有监督学习和无监督学习
有监督学习:
-
有监督学习是从标签化训练数据集中推断出函数的机器学习任务。
-
有监督学习,就是人们常说的分类,通过已有的训练样本(即已知数据以及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合,最优则表示在某个评价准则下是最佳的),再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的,也就具有了对未知数据进行分类的能力。
无监督学习
某知有个回答是这样的:是否有监督(supervised),就看输入数据是否有标签(label)。输入数据有标签,则为有监督学习,没标签则为无监督学习。
总结:
-
无论是有监督学习还是无监督学习,都是机器学习在模仿人类对于事物的认识中而来的。只是人类对于事物的认识有两种情况:你小时候见到了狗和猫两种动物,有人告诉你这个样子的是狗、那个样子的是猫,你学会了辨别,这是监督学习;你小时候见到了狗和猫两种动物,没人告诉你哪个是狗、哪个是猫,但你根据他们样子、体型等特征的不同鉴别出这是两种不同的生物,并对特征归类,这是无监督学习。
-
我们所见到的事物就是输入数据,而大人们对这些事物的判断结果(是狗还是猫啊)就是相应的输出。当我们见识多了以后,脑子里就慢慢地得到了一些泛化的模型,这就是训练得到的那个(或者那些)函数,从而不需要大人在旁边指点的时候,我们也能分辨的出来哪些是猫,哪些是狗。
-
还可以拿高考来举例,有监督的学习就是我们在平时训练做题时,都是有参考答案的(即数据的标签),通过这种大量的有答案的题目来训练我们的解题方法,从而在高考时,将最好的解题方法应用,得出最好的分数。
而无监督学习就像我们平时做题时,没有任何参考答案(即输入数据无标签),那么你就失去了参考的标准,就没有一个可以确定的解题思路了,这样的状态在参考高考时,就不一定能得出最好的分数。
有监督学习是使用带标签的训练数据来推导出预测函数,常用于分类问题。无监督学习则是在没有标签的数据上进行,如聚类,通过发现数据内在结构来学习。两者的区别在于是否存在明确的输出标签。有监督学习类似学习区分狗和猫的过程,有指导;无监督学习则类似自己通过观察特征区分不同生物,无预先定义类别。高考做题的例子生动说明了两者之间的差异,有监督学习如同有答案的训练,而无监督学习则是在无参考答案的情况下自我学习和提升。
2万+

被折叠的 条评论
为什么被折叠?



