盘点10大回归类型：总有一款深得你心

发布时间：2019-06-10 12:51:37 所属栏目：经验来源：读芯术

导读：除了统计模型和其他的一些算法，回归是机器学习成功运行的重要构成要素。回归的核心是寻找变量之间的关系，而机器学习需要根据这种关系来预测结果。显然，任何称职的机器学习工程师都应重视回归，但回归也有很多种。线性回归和逻辑回归通常是人们最先学习

在概率统计理论中，假设这是一组独立同分布的随机变量，且以下是要研究的数据：

线性回归

约翰•图基(John Tukey)在1949年提出的观点(即“大折刀法”)是对一个样本做大量的研究，排除一个观察结果(并返回之前被排除的结果)。下面列出了从原始数据中获得的样本：

线性回归

每一项都有n个新样本，样本容量为n-1，且都可用来计算计量经济学感兴趣的统计数据的价值(样本容量减1)：

线性回归

通过获得的统计值，可了解其分布和分布的特征，如期望、中值、分位数、散点和均方差。

那么，该使用哪一种回归?

盘点10大回归类型：总有一款深得你心

如果模型需要连续的因变量：线性回归是最常见和最直接的使用类型。如果有一个连续的因变量，可能要首先考虑线性回归模型。然而，要注意线性回归的几个缺点，如对异常值和多重共线性很敏感。在这种情况下，最好使用更高级的线性回归变体，如岭回归、套索回归和偏最小二乘法回归(PLS)。
如果模型需要分类因变量：应使用逻辑回归。这种模型最适合二元因变量。在进行更复杂的分类建模之前，最好先使用这种模型。分类变量的有些值可以根据特征放入可计数的不同组中。逻辑回归对因变量进行变换，然后使用最大似然估计法而非最小二乘法来估计参数。
如果模型需要计数因变量：应使用泊松回归。计数数据往往遵循泊松分布，因此泊松回归很适合。使用泊松变量可以计算和评估发生率。

（编辑：辽源站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!