Python机器学习

直方图

直方图详细操作教程
直方图将数据按箱进行分组,这是了解有关数据集中每个属性分布的最快方法。以下是直方图的一些特征-
它为我们提供了为可视化而创建的每个箱中观测值的计数。 从垃圾箱的形状中,我们可以轻松观察到分布,即天气是高斯分布,偏斜还是指数分布。 直方图还可以帮助我们查看可能的异常值。

示例

下面显示的代码是一个Python脚本示例,用于创建Pima印度糖尿病数据集属性的直方图。在这里,我们将在 Pandas DataFrame上使用 hist()函数生成直方图,并使用 matplotlib 进行绘制。
# Filename : example.py
# Copyright : 2020 By Lidihuo
# Author by : www.lidihuo.com
# Date : 2020-08-27
from matplotlib import pyplot
from pandas import read_csv
path = r"C:\pima-indians-diabetes.csv"
names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
data = read_csv(path, names=names)
data.hist()
pyplot.show()

输出

 Matplotlib
上面的输出显示它为数据集中的每个属性创建了直方图。由此,我们可以观察到 年龄,pedi 和test属性可能具有指数分布,而质量和plas具有高斯分布。
昵称: 邮箱:
Copyright © 2022 立地货 All Rights Reserved.
备案号:京ICP备14037608号-4