Statistics 箱线图
箱线图是基于以下五个数字汇总显示数据分布的标准化方式。
最低
第一个四分位数
中位数
四分之三
最大
对于均匀分布的数据集,在箱线图中,中心矩形跨越第一个四分位数到第三个四分位数(或四分位距,IQR)。矩形内的一条线显示中值,框上方和下方的"胡须"显示最小值和最大值的位置。这种箱线图显示了从最小值到最大值的完整变化范围、可能的变化范围、IQR 和中位数。
问题陈述:
为以下两个数据集创建一个箱线图。
0.22 |
-0.87 |
-2.39 |
-1.79 |
0.37 |
-1.54 |
1.28 |
-0.31 |
-0.74 |
1.72 |
0.38 |
-0.17 |
-0.62 |
-1.10 |
0.30 |
0.15 |
2.30 |
0.19 |
-0.50 |
-0.09 |
-5.13 |
-2.19 |
-2.43 |
-3.83 |
0.50 |
-3.25 |
4.32 |
1.63 |
5.18 |
-0.43 |
7.11 |
4.87 |
-3.10 |
-5.81 |
3.76 |
6.31 |
2.58 |
0.07 |
5.76 |
3.50 |
解决方案:
这里两个数据集在零附近均匀平衡,因此均值在零附近。第一个数据集的变化范围大约从-2.5 到 2.5,而第二个数据集的变化范围大约从-6 到 6、绘制图表如下所示: