可视化数据
Python机器学习可视化数据详细操作教程
简介
在上一章中,我们讨论了数据对于机器学习算法的重要性以及一些Python配方,以了解具有统计信息的数据。还有另一种称为可视化的方式来理解数据。借助数据可视化,我们可以看到数据的外观以及数据的属性保持什么样的关联。这是查看要素是否与输出相对应的最快方法。借助以下Python图谱,我们可以了解具有统计信息的ML数据。
单变量图:独立理解属性
最简单的可视化类型是单变量或“单变量”可视化。借助单变量可视化,我们可以独立了解数据集的每个属性。以下是Python中用于实现单变量可视化的一些技术-
编号 |
单变量图和描述 |
1 |
直方图 直方图将数据按箱进行分组,这是了解有关数据集中每个属性分布的最快方法。 |
2 |
密度图 获取每个属性分布的另一种快速简便的技术是密度图。 |
3 |
箱形图和晶须图 Box和Whisker图(也简称为boxplots)是另一种有用的技术,可用于检查每个属性的分布。 |
多元图:多个变量之间的相互作用
可视化的另一种类型是多变量或“多变量”可视化。借助多元可视化,我们可以了解数据集多个属性之间的相互作用。以下是Python中实现多元可视化的一些技术-
序号 |
多元图和描述 |
1 |
相关矩阵图 相关性是有关两个变量之间变化的指示。 |
2 |
散点图 散点图借助二维点显示一个变量受另一个变量影响的程度或它们之间的关系。 |