参考资料:用python动手学统计学
当总体为“有或无”这种二指数据或“1个、2个、3个”这种计数型数据时,我们无法假设其服从正态分布分布。
在这种情况下,可以使用广义线性模型。广义线性模型可以统一处理分类与回归问题。
1、广义线性模型的组成
组成要素有三个:①总体服从的概率分布;②线性预测算子;③联系函数。
1.1 概率分布
广义线性模型可用于正态分布、二项分布和泊松分布等多种概率分布。
1.2 线性预测算子
线性预测算子是线性关系式表示的解释变量。
1.3 联系函数
联系函数用于将相应变量和线性预测算子联系在一起,可以应用于相应变量。
2、联系函数与概率分布的关系
概率分布与联系函数的常用组合如下图:

正态线性模型无须更多的变形,所以在广义线性模型的领域中,它的联系函数就是恒等函数。当正态分布的联系函数为对数函数时,有些模型的响应变量将永远为正值。负二项分布常以对数函数为联系函数。伽马分布常以对数函数、倒数函数为联系函数。
3、广义线性模型的参数估计
广义线性模型可以用于非正态分布,所以参数估计使用最大似然法。常用的参数估计算法为迭代加权最小二乘法。
本文介绍了如何使用Python学习统计学中的广义线性模型,特别关注了其组成部分(概率分布、线性预测算子和联系函数),以及它们在不同分布情况下的应用,包括参数估计方法如最大似然法和迭代加权最小二乘法。
1177

被折叠的 条评论
为什么被折叠?



