COMP 9417 T2_2021 Lesson 3

最新推荐文章于 2026-07-01 23:56:57 发布

原创

最新推荐文章于 2026-07-01 23:56:57 发布 · 743 阅读

·

1

·

本文探讨了模型评估的关键点，如残差分析、特征选择及其对模型复杂性的影响。介绍了线性回归在处理连续变量时的应用，并转向分类问题，如逻辑回归和贝叶斯分类。通过实例解释了如何利用贝叶斯定理计算事件概率。同时，提到了在线学习、参数化和非参数化模型的区别，并概述了线性分类器的工作原理。

判断模型是否合适：
如果分割完后正好是一半正的一半副的，就表示是个很好的模型。
如果一个数据点为离群值，同时也意味着它对应的残差具有较大的方差，因此数据中的离群值数量较多的话，残差一般也会出现明显的异方差性。
残差应显示近似对称的钟形频率分布，平均值为0

一些非线性关系可以通过转换来变成线性模型。作业1a。

如果模型过于复杂，我们可以考虑简化模型。

通过子集来估计整体。会产生多个模型，需要做选择。
正则将不重要的系数归零或者接近0。
降维。

对于第一种方法：
在得到很多子特征集之后。都是greedy的
前向选择：该过程从一个空的特性集合开始，并逐个添加最优特征到集合中。
向后消除：该过程从所有特征集开始。通过逐步删除集合中剩余的最差特征。
这些Greedy的选择方式其实就是在计算R^ 2。决定系数 coefficient of determination。用于度量因变量的变异中可由自变量解释部分所占的比例，以此来判断回归模型的解释力。也就来逐个的判断每个子模型的影响力，解释力度，特征强度。就是通过删除或者添加来对比。

一两个数据的变化不会对mean X和mean Y造成很大影响，只会稍微改变slope

模型只能在与收集数据时保持的条件大致相同的条件下工作
在这里插入图片描述

线性回归总结以及线性模型应用场景：
在这里插入图片描述

Chapter 2 机器学习处理分类问题

Pg: 1-24

之前的回归问题中我

标签

#机器学习

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。