过拟合和欠拟合现象及解决方案

本文探讨了过拟合和欠拟合的现象,过拟合表现为模型在训练集上表现好但在验证集上表现差,欠拟合则是模型在训练集上表现不佳。解决过拟合的方法包括正则化(如L1和L2)、数据增强、提前终止、参数绑定和共享、bagging、Dropout等;解决欠拟合则可以通过添加新特征、增加模型复杂度或减少正则化系数。

过拟合和欠拟合

欠拟合:(under-fitting)也称为欠学习,它的直观表现是算法训练得到的模型在训练集上表现差,没有学到数据的规律。引起欠拟合的原因有:模型本身过于简单,例如数据本身是非线性的但使用了线性模型;特征数太少无法正确的建立统计关系。

过拟合:(over-fitting)随着训练过程的进行,模型复杂度,在training data上的error渐渐减小。可是在验证集上的error却反而渐渐增大——由于训练出来的网络过拟合了训练集,对训练集以外的数据却不work。过拟合即在训练误差很小,而泛化误差很大,因为模型可能过于的复杂,使其”记住”了训练样本,然而其泛化误差却很高。

解决过拟合的方法:

1. 加入正则化项,参数范数惩罚,可在优化原来目标函数的同时,避免权值过大带来的过拟合风险

最常用的范数惩罚为L1,L2正则化,L1又被成为Lasso,

Lasso回归的损失函数:

Ridge回归损失函数:

L1正则可以产生稀疏模型(L1是怎么让

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值