← 返回实验列表
最小二乘回归直线 · 实验台
引擎 #30 · 数学
2020·全国Ⅱ卷 T18 蓝本
题目
5 组观测数据 (1,2), (2,3.1), (3,4.2), (4,4.8), (5,y₅),题面 y₅=6.1。
求经过样本中心 (x̄, ȳ) 的回归直线 ŷ = b̂(x−x̄) + ȳ 的斜率
b̂ = Σ(xᵢ−x̄)(yᵢ−ȳ) / Σ(xᵢ−x̄)²,并说明它为什么"最小二乘"。
※ 蓝本:2020 年全国Ⅱ卷第 18 题(线性回归应用题)。题面数据 b̂ = 10/10 = 1.00,回归线 ŷ = x + 1.04。
先想一想,再动手
"最小二乘"里,公式算出的 b̂ 让什么东西最小?
🔒 提交预测后,下方实验台才会解锁
实验台
解释
固定直线过样本中心 (x̄, ȳ),残差平方和是斜率 b 的二次函数:
SSE(b) = Σ[(yᵢ−ȳ) − b(xᵢ−x̄)]² = Sxx·b² − 2Sxy·b + Syy
抛物线开口向上,谷底在
b̂ = Sxy / Sxx = Σ(xᵢ−x̄)(yᵢ−ȳ) / Σ(xᵢ−x̄)²
题面数据:x̄=3, ȳ=4.04,Sxx=10,Sxy=10 ⟹ b̂=1.00,回归线 ŷ = x + 1.04。
选平方而不选绝对值/垂直距离,是因为平方处处可导 —— 求导令零一步就解出谷底,
这正是右图抛物线告诉你的事:高考给的 b̂ 公式,就是这条抛物线的对称轴。
变式追问:把 y₅ 从 6.1 拖到 9(制造离群点)—— 谷底整体右移,一个点就能拽动整条回归线,
这是平方惩罚的副作用:最小二乘对离群点敏感。