Python机器学习

箱形图和晶须图

箱形图和晶须图详细操作教程
箱形图和晶须图也简称为箱形图,是另一种有用的技术,可用于检查每个属性的分布情况。以下是该技术的特点-
本质上是单变量的,总结了每个属性的分布。 它为中间值(即中位数)画一条线。 它在25%和75%周围画一个方框。 它还会绘制晶须,这将使我们对数据的传播有所了解。 晶须外的点表示离群值。离群值比中间数据的散布大小大1.5倍。

示例

在以下示例中,Python脚本将生成"密度图",用于分布Pima印度糖尿病数据集的属性。
# Filename : example.py
# Copyright : 2020 By Lidihuo
# Author by : www.lidihuo.com
# Date : 2020-08-27
from matplotlib import pyplot
from pandas import read_csv
path = r"C:\pima-indians-diabetes.csv"
names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
data = read_csv(path, names = names)
data.plot(kind = 'box', subplots = True, layout = (3,3), sharex = False,sharey = False)
pyplot.show()

输出

Box晶须图
从上面的属性分布图可以看出,年龄,测试和皮肤似乎偏向较小的值。
昵称: 邮箱:
Copyright © 2022 立地货 All Rights Reserved.
备案号:京ICP备14037608号-4