过拟合和欠拟合现象及解决方案

最新推荐文章于 2023-11-19 22:59:15 发布

原创

最新推荐文章于 2023-11-19 22:59:15 发布 · 3.7k 阅读

·

1

·

本文探讨了过拟合和欠拟合的现象，过拟合表现为模型在训练集上表现好但在验证集上表现差，欠拟合则是模型在训练集上表现不佳。解决过拟合的方法包括正则化（如L1和L2）、数据增强、提前终止、参数绑定和共享、bagging、Dropout等；解决欠拟合则可以通过添加新特征、增加模型复杂度或减少正则化系数。

过拟合和欠拟合

欠拟合：（under-fitting）也称为欠学习，它的直观表现是算法训练得到的模型在训练集上表现差，没有学到数据的规律。引起欠拟合的原因有：模型本身过于简单，例如数据本身是非线性的但使用了线性模型；特征数太少无法正确的建立统计关系。

过拟合：（over-fitting）随着训练过程的进行，模型复杂度，在training data上的error渐渐减小。可是在验证集上的error却反而渐渐增大——由于训练出来的网络过拟合了训练集，对训练集以外的数据却不work。过拟合即在训练误差很小,而泛化误差很大,因为模型可能过于的复杂,使其”记住”了训练样本,然而其泛化误差却很高。

解决过拟合的方法：

1. 加入正则化项，参数范数惩罚，可在优化原来目标函数的同时，避免权值过大带来的过拟合风险

最常用的范数惩罚为L1,L2正则化，L1又被成为Lasso，

Lasso回归的损失函数：

Ridge回归损失函数：

L1正则可以产生稀疏模型（L1是怎么让

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。