Statistics 线性回归
一旦使用相关分析确定了变量之间的关系程度,就很自然会深入研究关系的本质。回归分析有助于确定变量之间的因果关系。如果可以使用图形方法或代数方法预测自变量的值,则可以预测其他变量(称为因变量)的值。
图形方法
它涉及绘制散点图,其中 X 轴为自变量,Y 轴为因变量。然后绘制一条线,使其穿过大部分分布,其余点几乎均匀分布在线的两侧。
回归线被称为最佳拟合线,它总结了数据的一般移动。它显示了一个变量的最佳平均值与另一个变量的平均值相对应。回归线基于这样一条准则,即它是一条使因变量的预测值和观测值之间的偏差平方和最小的直线。
代数方法
代数方法推导出 X 对 Y 和 Y 对 X 的两个回归方程。
Y 对 X 的回归方程
哪里-
${Y}$ = 因变量
${X}$ = 自变量
${a}$ = 显示 Y 轴截距的常数
${b}$ = 显示直线斜率的常数
a 和 b 的值由以下正规方程获得:
${\sum Y = Na + b\sum X \\[7pt] \sum XY = a \sum X + b \sum X^2 }$
哪里-
${N}$ = 观察次数
X 对 Y 的回归方程
哪里-
${X}$ = 因变量
${Y}$ = 自变量
${a}$ = 显示 Y 轴截距的常数
${b}$ = 显示直线斜率的常数
a 和 b 的值由以下正规方程获得:
${\sum X = Na + b\sum Y \\[7pt] \sum XY = a \sum Y + b \sum Y^2 }$
哪里-
${N}$ = 观察次数
示例
问题说明:
一位研究人员发现,父亲和儿子的体重倾向之间存在相关性。他现在对根据给定数据开发两个变量的回归方程感兴趣:
父亲体重(公斤) |
69 |
63 |
66 |
64 |
67 |
64 |
70 |
66 |
68 |
67 |
65 |
71 |
儿子的体重(公斤) |
70 |
65 |
68 |
65 |
69 |
66 |
68 |
65 |
71 |
67 |
64 |
72 |
开发
Y 在 X 上的回归方程。
Y 上的回归方程。
解决方案:
${X}$ |
${X^2}$ |
${Y}$ |
${Y^2}$ |
${XY}$ |
69 |
4761 |
70 |
4900 |
4830 |
63 |
3969 |
65 |
4225 |
4095 |
66 |
4356 |
68 |
4624 |
4488 |
64 |
4096 |
65 |
4225 |
4160 |
67 |
4489 |
69 |
4761 |
4623 |
64 |
4096 |
66 |
4356 |
4224 |
70 |
4900 |
68 |
4624 |
4760 |
66 |
4356 |
65 |
4225 |
4290 |
68 |
4624 |
71 |
5041 |
4828 |
67 |
4489 |
67 |
4489 |
4489 |
65 |
4225 |
64 |
4096 |
4160 |
71 |
5041 |
72 |
5184 |
5112 |
${\sum X = 800}$ |
${\sum X^2 = 53,402}$ |
${\sum Y = 810}$ |
${\sum Y^2 = 54,750}$ |
${\sum XY = 54,059}$ |
Y 对 X 的回归方程
Y = a+bX
其中,a 和 b 由正规方程得到
${\sum Y = Na + b\sum X \\[7pt] \sum XY = a \sum X + b \sum X^2 \\[7pt] 其中\ \sum Y = 810, \sum X = 800 , \sum X^2 = 53,402 \\[7pt] , \sum XY = 54, 049, N = 12 }$
${\Rightarrow}$ 810 = 12a + 800b ... (i)
${\Rightarrow}$ 54049 = 800a + 53402 b ... (ii)
将方程 (i) 乘以 800,将方程 (ii) 乘以 12,我们得到:
96000 a + 640000 b = 648000 ... (iii)
96000 a + 640824 b = 648588 ... (iv)
从 (iii) 中减去方程 (iv)
-824 b =-588
${\Rightarrow}$ b =-.0713
代入方程中的 b 值。 (一)
810 = 12a + 800 (-0.713)
810 = 12a + 570.4
12a = 239.6
${\Rightarrow}$ a = 19.96
因此X上的方程Y可以写成
${Y = 19.96-0.713X}$
X 对 Y 的回归方程
X = a+bY
其中,a 和 b 由正规方程得到
${\sum X = Na + b\sum Y \\[7pt] \sum XY = a \sum Y + b \sum Y^2 \\[7pt] 其中\ \sum Y = 810, \sum Y^2 = 54,750 \\[7pt] , \sum XY = 54, 049, N = 12 }$
${\Rightarrow}$ 800 = 12a + 810a + 810b ... (V)
${\Rightarrow}$ 54,049 = 810a + 54, 750 ... (vi)
将 eq (v) 乘以 810,将 eq (vi) 乘以 12,我们得到
9720 a + 656100 b = 648000 ... (vii)
9720 a + 65700 b = 648588 ... (viii)
从 eq vii 中减去 eq viii
900b =-588
${\Rightarrow}$ b = 0.653
代入方程(v)中b的值
800 = 12a + 810 (0.653)
12a = 271.07
${\Rightarrow}$ a = 22.58
因此X和Y的回归方程为
${X = 22.58 + 0.653Y}$