数据科学个人笔记:线性回归变种之弹性网络回归+局部散点平滑估计

本文介绍了线性回归的两种变种:局部加权线性回归(LOESS)及ElasticNet回归。局部加权线性回归依据预测点与训练样本的距离调整权重,通过正规方程求解;ElasticNet回归结合了L1和L2正则化项,适用于特征间存在关联的情况。

一、线性回归的变种:局部加权线性回归(本地散点平滑估计LOESS)

1.形式:一种非参数学习算法。局部加权线性回归中,针对每个要预测的样本点,我们都要对整个训练集进行一次拟合,因为我们要根据不同训练样本与预测样本的距离不同来调整每个样本的权重。也就是选取一个W,使得各样本均方误差的加权和达到最小。可使用正规方程来求解,正规方程为W=(X^T*X)^-1 *X^T*A*y。A为对角矩阵,对角线每个值为一个样本的权重,所以维度是样本数*样本数的。

2.确定权重矩阵:通常使用以下公式来计算权重,ai=exp[(xi-预测点的x)^2/(-2k^2)]。其中k为超参数,越大权重的差距就越小,趋于无穷时相当于常规的线性回归。k越小权重差距越大。K越小时拟合能力越强,但越可能过拟合。

 

二、线性回归的变种:ElasticNet回归

弹性网络回归同时使用l1和l2正则化项,损失函数为1 / (2 * n_samples) * ||y - Xw||^2_2+ alpha * l1_ratio * ||w||_1+ 0.5 * alpha * (1 - l1_ratio) * ||w||^2_2。所以lambda1和lambda2的指定是通过l1_ratio和alpha来完成。弹性网络是一种使用 L1, L2 范数作为先验正则项训练的线性回归模型。 这种组合允许学习到一个只有少量参数是非零稀疏的模型,就像 Lasso 一样,但是它仍然保持一些像 Ridge 的正则性质。我们可利用 l1_ratio 参数控制 L1 和 L2 的凸组合。

弹性网络在很多特征互相联系的情况下是非常有用的。Lasso 很可能只随机考虑这些特征中的一个,而弹性网络更倾向于选择两个。

在实践中,Lasso 和 Ridge 之间权衡的一个优势是它允许在循环过程(Under rotate)中继承 Ridge 的稳定性由于包含l1正则化项,同样要使用坐标下降法来解决此问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

SiameseAge

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值