Statistics教程

区间估计

区间估计是使用样本数据来计算未知总体参数的可能(或可能)值的区间,而点估计是单个数字。

公式

${\mu = \bar x \pm Z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt n}}$
哪里-
${\bar x}$ = 平均值 ${Z_{\frac{\alpha}{2}}}$ = 置信系数 ${\alpha}$ = 置信度 ${\sigma}$ = 标准差 ${n}$ = 样本量

示例

问题说明:
假设一名学生测量某种液体的沸点温度,观察到 6 种不同液体样品的读数(以摄氏度为单位)102.5、101.7、103.1、100.9、100.5 和 102.2、他计算出样本平均值为 101.82、如果他知道这个过程的标准差是 1.2 度,那么在 95% 置信水平下总体均值的区间估计是多少?
解决方案:
学生计算出沸点温度的样本平均值为 101.82,标准差为 ${\sigma = 0.49}$。 95% 置信区间的临界值为 1.96,其中 ${\frac{1-0.95}{2} = 0.025}$。未知均值的 95% 置信区间。
${ = ((101.82-(1.96 \times 0.49)), (101.82 + (1.96 \times 0.49))) \\[7pt] \ = (101.82-0.96, 101.82 + 0.96) \\[7pt] \ = ( 100.86, 102.78) }$
随着置信水平的降低,相应区间的大小将减小。假设学生对沸腾温度的 90% 置信区间感兴趣。在这种情况下,${\sigma = 0.90}$,而 ${\frac{1-0.90}{2} = 0.05}$。此水平的临界值等于 1.645,因此 90% 置信区间为
${ = ((101.82-(1.645 \times 0.49)), (101.82 + (1.645 \times 0.49))) \\[7pt] \ = (101.82-0.81, 101.82 + 0.81) \ = (1.645 \times 0.49)) 101.01, 102.63)}$
增加样本量会缩短置信区间的长度,但不会降低置信水平。这是因为标准偏差随着 n 的增加而减小。

误差幅度

区间估计的误差幅度${m}$定义为从样本均值中添加或减去的值,它决定了区间的长度:
${Z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt n}}$
假设在上面的例子中,学生希望误差幅度等于 0.5,置信度为 95%。将适当的值代入 ${m}$ 的表达式中并求解 n 即可得出计算结果。
${ n = {(1.96 \times \frac{1.2}{0.5})}^2 \\[7pt] \ = {\frac{2.35}{0.5}^2} \\[7pt] \ = {(4.7 )}^2 \ = 22.09 }$
要在总长度小于 1 度的情况下实现平均沸点的 95% 区间估计,学生必须进行 23 次测量。
昵称: 邮箱:
Copyright © 2022 立地货 All Rights Reserved.
备案号:京ICP备14037608号-4