Statistics教程

Statistics 异常值函数

概率分布函数中的异常值是指距离下四分位数或上四分位数超过数据集长度 1.5 倍的数字。具体来说,如果一个数字小于 ${Q_1-1.5 \times IQR}$ 或大于 ${Q_3 + 1.5 \times IQR}$,那么它就是一个异常值。
异常值由以下概率函数定义和给出:

公式

${Outlier\ datas\ are\, \lt Q_1-1.5 \times IQR\ (or)\ \gt Q_3 + 1.5 \times IQR }$
哪里-
${Q_1}$ = 四分之一 ${Q_2}$ = 第三四分位数 ${IQR}$ = 四分位距

示例

问题说明:
考虑一个代表 8 名不同学生周期性任务计数的数据集。任务计数信息集为11、13、15、3、16、25、12和14、从学生周期性任务计数中发现异常数据。
解决方案:
给定的数据集是:
11 13 15 3 16 25 12 14
按升序排列:
3 11 12 13 14 15 16 25
第一四分位值() ${Q_1}$
${ Q_1 = \frac{(11 + 12)}{2} \\[7pt] \ = 11.5 }$
四分之三值() ${Q_3}$
${ Q_3 = \frac{(15 + 16)}{2} \\[7pt] \ = 15.5 }$
下离群值范围 (L)
${ Q_1-1.5 \times IQR \\[7pt] \ = 11.5-(1.5 \times 4) \\[7pt] \ = 11.5-6 \\[7pt] \ = 5.5 }$
上离群值范围 (L)
${ Q_3 + 1.5 \times IQR \\[7pt] \ = 15.5 + (1.5 \times 4) \\[7pt] \ = 15.5 + 6 \\[7pt] \ = 21.5 }$
在给定的信息中,5.5 和 21.5 比给定数据集中的其他值更大,即除了 3 和 25,因为 3 大于 5.5,25 小于 21.5、
这样,我们使用 3 和 25 作为异常值。
昵称: 邮箱:
Copyright © 2022 立地货 All Rights Reserved.
备案号:京ICP备14037608号-4