2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择!

四季读书网 3 0
2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择!
2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第1张

★ 关注小卫,了解【#公卫考研#预防医学#公共卫生考研#预防医学考研#353卫生综合】更多资讯~

1

前言

在多重线性回归中,“变量越多越好”是一个危险的错觉。2026年厦门大学这道真题,以”所有可能子集回归”的15个模型为素材,要求考生从R²、调整R²、Cp统计三个维度,辨析“回归效果最好”“最优回归方程”的本质区别。

这道题的核心矛盾在于:包含所有自变量的模型R²最大(0.61)但调整R²并非最高,Cp统计量也远离理想值。第14号模型(仅含X₂、X₃、X₄三个变量)调整R²=0.58(最大),Cp=3.36(最小且最接近自变量个数3),才是真正的”最优”选择。

这道题教会我们:模型选择不是追求拟合度的极致,而是追求”简洁与拟合的平衡”——这正是统计学家Occam剃刀原理在回归分析中的体现。今天,我们把模型选择的”艺术”,变成可操作的”技术”!

2

真题再现

55、某研究者收集60名某病患者的5项临床指标(X₁,X₂,X₃,X₄和Y),做多重线性回归,采用所有可能子集筛选自变量,相关结果见表3。

2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第2张

(1)解释表3中R²的含义。

(2)写出回归效果最好的回归方程,并说明理由。

(3)写出最优回归方程,并说明理由。

3

满分答案

(1)R²的含义

2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第3张

2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第4张

含义: 回归平方和在总平方和中所占的百分比,反映模型中所有自变量共同解释因变量Y变异的比例。

取值范围: 0≤R2≤1

R2→1:模型拟合效果极好

R2→0:模型几乎无解释力

本题示例: 编号15的模型R2=0.61,表示X₁、X₂、X₃、X₄四个自变量共同解释了Y变异的61%,剩余39%的变异由模型外的其他因素或随机误差解释。

💡 评分关键:公式正确得1分;解释”解释变异比例”得1分;举例说明得1分。

(2)回归效果最好的回归方程

2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第5张

回归方程: 编号15的模型

2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第6张

理由: 回归效果的优劣主要通过判断,R²越大,模型对样本数据的拟合效果越好。

编号15的R²=0.61是所有模型中最大的,说明该模型包含的自变量能最大限度地解释Y的变异,因此回归效果最好

⚠️ 注意:“回归效果最好”≠“最优模型”!R²随自变量增加而单调递增,即使新增变量无意义,R²也会虚高。

(3)最优回归方程

2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第7张

最优多重线性回归方程的选择需同时结合调整R²、Cp统计量两个核心指标,判断原则如下:

①调整R²最大:反映模型拟合优度,且不受自变量个数增多的虚假升高影响。

②Cp最小且最接近模型中自变量个数m:Cp 越小表示模型无偏、误差小、无多余变量,最优模型要求Cp ≈ m

结合本题数据:第14号模型 调整R²=0.58(所有模型中最大);第14号模型 Cp=3.36(所有模型中最小),模型包含3个自变量(X₂、X₃、X₄),Cp 最接近自变量个数m= 3;该模型拟合效果好、无多余自变量、模型简洁稳定。

因此,第14号模型为最优回归方程。回归方程为:2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第8张

4

核心知识点复习

知识点1:R²、调整R²、Cp统计量的辨析

2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第9张
2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第10张

三者关系图示:

自变量个数增加    ↓R²:持续上升(即使新增变量无意义)→ "贪婪"    ↓调整R²:先升后降(找到最优后下降)→ "理性"    ↓Cp:先降后升(最小值点附近最优)→ "精准"

知识点2:模型选择的”金标准”--Cp统计量

2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第11张

Cp的理想状态:

2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第12张

本题15个模型的Cp分布:

2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第13张

知识点3:所有可能子集回归 vs 逐步回归

2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第14张
2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第15张

本题方法: 所有可能子集回归(p=4,共15个模型),保证找到全局最优。

知识点4:多重共线性的识别与处理

2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第16张

本题潜在问题: X₁在多个模型中系数不稳定(编号1:1.03,编号5:0.83,编号15:0.15),提示可能存在多重共线性。

2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第17张

处理策略: 若X₁与其他变量高度相关,可考虑剔除或进行主成分分析。

知识点5:回归系数的解释与比较

2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第18张

编号14最优模型的系数解读:

2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第19张

系数标准化比较(Beta系数):

若需比较不同自变量的相对重要性,应计算标准化回归系数(Beta),消除量纲影响。

5

秒杀口诀

✔ 模型选择三重标准口诀

“R平方看拟合,调整R平方看真实;Cp最小最理想,接近m值是黄金”

✔ 最优vs最好辨析口诀

“效果最好R平方,最优模型调整R;Cp接近变量数,简洁拟合两相宜”

✔ Cp统计量解读口诀

“Cp等于m是理想,小于m过拟想,大于m漏变量;越小越好是方向”

 ✔所有可能子集口诀

“子集回归穷举法,全局最优不害怕;变量少时好用处,变量多时逐步替”

✔ 多重共线性识别口诀

“系数不稳定符号变,VIF超过十要警惕;相关矩阵先看眼,共线处理主成分”

6

下期预告

下一期我们将拆解华中科技大学353的另一道生态学研究真题——“儿童近视与太阳光照时长的回归分析”,这道题以R²=0.95的”完美拟合”为陷阱,深度考查生态学谬误、相关≠因果以及混杂偏倚三大核心概念,是卫生统计学中”数字会说话,但会说谎话”的经典教案!

关注本号,持续更新2026年卫生统计学典型真题拆解,助你353专业课高分上岸!

⭐ 点击查看:往期【真题拆解】系列推文

本文题目来源:

厦门大学353 2026年真题

整理:卫灿公卫考研辅导团队

2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第20张

抢跑上岸 卫灿助你

2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第21张
2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第22张

点击查看 近期热门

2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第23张
2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第24张
2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第25张
2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第26张

给小卫点个赞吧ヾ(◍°∇°◍)ノ゙! 

2026年《卫生统计学》公卫考研真题拆解第6期 | 厦门大学353:多重线性回归的最优模型选择! 第27张

抱歉,评论功能暂时关闭!