Statistics 箱线图
箱线图是基于以下五个数字汇总显示数据分布的标准化方式。
最低
第一个四分位数
中位数
四分之三
最大
对于均匀分布的数据集,在箱线图中,中心矩形跨越第一个四分位数到第三个四分位数(或四分位距,IQR)。矩形内的一条线显示中值,框上方和下方的"胡须"显示最小值和最大值的位置。这种箱线图显示了从最小值到最大值的完整变化范围、可能的变化范围、IQR 和中位数。
问题陈述:
为以下两个数据集创建一个箱线图。
| 0.22 |
| -0.87 |
| -2.39 |
| -1.79 |
| 0.37 |
| -1.54 |
| 1.28 |
| -0.31 |
| -0.74 |
| 1.72 |
| 0.38 |
| -0.17 |
| -0.62 |
| -1.10 |
| 0.30 |
| 0.15 |
| 2.30 |
| 0.19 |
| -0.50 |
| -0.09 |
| -5.13 |
| -2.19 |
| -2.43 |
| -3.83 |
| 0.50 |
| -3.25 |
| 4.32 |
| 1.63 |
| 5.18 |
| -0.43 |
| 7.11 |
| 4.87 |
| -3.10 |
| -5.81 |
| 3.76 |
| 6.31 |
| 2.58 |
| 0.07 |
| 5.76 |
| 3.50 |
解决方案:
这里两个数据集在零附近均匀平衡,因此均值在零附近。第一个数据集的变化范围大约从-2.5 到 2.5,而第二个数据集的变化范围大约从-6 到 6、绘制图表如下所示:
