线性回归
Python机器学习线性回归详细操作教程
线性回归简介
线性回归可以定义为统计模型,用于分析因变量与给定的一组自变量之间的线性关系。变量之间的线性关系意味着当一个或多个自变量的值改变(增加或减少)时,因变量的值也将相应改变(增加或减少)。
在数学上,可以借助以下方程式表达关系-
$$ Y \:= \:mX + b $$
在这里,Y是我们试图预测的因变量。
X是我们用来进行预测的自变量。
m是回归线的斜率,表示X对Y的影响
b是一个常数,称为𝑌Y截距。如果X = 0,则Y等于𝑏b。
此外,线性关系本质上可以是正值或负值,如下所述-
正线性关系
如果自变量和因变量都增加,则线性关系将称为正。借助下图可以理解-
负线性关系
如果独立增加和因变量减少,则线性关系将称为正。借助下图可以理解-
线性回归的类型
线性回归具有以下两种类型-
简单线性回归
多元线性回归
假设
以下是关于线性回归模型所建立的数据集的一些假设-
多重共线性-线性回归模型假设数据中几乎没有多重共线性。基本上,当共变量或要素具有相关性时,就会发生多重共线性。
自相关-线性回归模型的另一个假设是数据中几乎没有自相关。基本上,当残差之间存在依赖性时,就会发生自相关。
变量之间的关系-线性回归模型假定响应变量和特征变量之间的关系必须是线性的。