Statistics教程

Statistics Kolmogorov Smirnov 检验

此测试用于必须在观察到的样本分布和理论分布之间进行比较的情况。

K-S 单样测试

此测试用作拟合优度的测试,在样本量较小时非常理想。它将变量的累积分布函数与指定分布进行比较。零假设假设观察到的分布和理论分布之间没有差异,并且检验统计量"D"的值计算如下:

公式

$D = 最大值 |F_o(X)-F_r(X)|$
哪里-
${F_o(X)}$ = n 个观测的随机样本的观测累积频率分布。 和 ${F_o(X) = \frac{k}{n}}$ =(观察数 ≤ X)/(观察总数)。 ${F_r(X)}$ = 理论频率分布。
${D}$ 的临界值是从一个样本测试的 K-S 表值中找到的。
接受标准:如果计算值小于临界值,则接受原假设。
拒绝标准:如果计算值大于表值,则拒绝原假设。

示例

问题说明:
在对一所大学的各个流派进行的一项研究中,我们采访了 60 名学生,每个流派的学生人数相同,并注意到了他们加入大学戏剧俱乐部的意图。
理学士 学士学位 B.Com 硕士 M.Com
没有。在每个班级 5 9 11 16 19
预计每个班级有 12 名学生将加入戏剧俱乐部。使用 K-S 测试找出学生班级之间在加入戏剧俱乐部的意图方面是否存在差异。
解决方案:
${H_o}$:不同流派的学生加入戏剧俱乐部的意愿没有差异。
我们开发了观测分布和理论分布的累积频率。
不。有兴趣加入的学生 ${F_O(X)}$ ${F_T(X)}$ ${|F_O(X)-F_T(X)|}$
观察到(O) 理论(T)
理学学士 5 12 5/60 12/60 7/60
学士学位 9 12 14/60 24/60 10/60
B.COM。 11 12 25/60 36/60 11/60
硕士 16 12 41/60 48/60 7/60
M.COM。 19 12 60/40 60/60 60/60
总计 n=60
测试统计量 ${|D|}$ 计算为:
$D = 最大值 {|F_0 (X)-F_T (X)|} \\[7pt] \, = \frac{11}{60} \\[7pt] \, = 0.183$
D 在 5% 显着性水平下的表值由下式给出
${D_0.05 = \frac{1.36}{\sqrt{n}}} \\[7pt] \, = \frac{1.36}{\sqrt{60}} \\[7pt] \, = 0.175$
由于计算值大于临界值,因此我们拒绝原假设,得出不同流派学生加入俱乐部的意愿存在差异的结论。

K-S 两样测试

当不是一个,而是有两个独立样本时,则可以使用 K-S 两样本检验来检验两个累积分布之间的一致性。原假设表明两个分布之间没有差异。 D 统计量的计算方式与 K-S 单样本检验相同。

公式

${D = 最大值 |{F_n}_1(X)-{F_n}_2(X)|}$
哪里-
${n_1}$ = 第一个样本的观察结果。 ${n_2}$ = 来自第二个样本的观察结果。
可以看出,当累积分布显示出较大的最大偏差 ${|D|}$ 时,表明两个样本分布之间存在差异。
${n_1 = n_2}$ 且≤ 40 的样本 D 的临界值,使用两个样本案例的 K-S 表。当 ${n_1}$ 和/或 ${n_2}$ > 40 时,应使用两样本检验的大样本 K-S 表。如果计算值小于表值,则接受原假设,反之亦然。
因此,当目标人群的特征未知或未对其做出任何假设时,使用这些非参数检验中的任何一种都有助于研究人员测试其结果的显着性。
昵称: 邮箱:
Copyright © 2022 立地货 All Rights Reserved.
备案号:京ICP备14037608号-4