深度学习中的有监督学习和无监督学习

原创已于 2022-08-17 17:50:07 修改 · 6.7k 阅读

19 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#深度学习 #学习 #机器学习

于 2022-08-17 17:42:13 首次发布

深度学习专栏收录该内容

3 篇文章

订阅专栏

有监督学习是使用带标签的训练数据来推导出预测函数，常用于分类问题。无监督学习则是在没有标签的数据上进行，如聚类，通过发现数据内在结构来学习。两者的区别在于是否存在明确的输出标签。有监督学习类似学习区分狗和猫的过程，有指导；无监督学习则类似自己通过观察特征区分不同生物，无预先定义类别。高考做题的例子生动说明了两者之间的差异，有监督学习如同有答案的训练，而无监督学习则是在无参考答案的情况下自我学习和提升。

有监督学习和无监督学习

有监督学习：

有监督学习是从标签化训练数据集中推断出函数的机器学习任务。
有监督学习，就是人们常说的分类，通过已有的训练样本（即已知数据以及其对应的输出）去训练得到一个最优模型（这个模型属于某个函数的集合，最优则表示在某个评价准则下是最佳的），再利用这个模型将所有的输入映射为相应的输出，对输出进行简单的判断从而实现分类的目的，也就具有了对未知数据进行分类的能力。

无监督学习

某知有个回答是这样的：是否有监督（supervised），就看输入数据是否有标签（label）。输入数据有标签，则为有监督学习，没标签则为无监督学习。

总结：

无论是有监督学习还是无监督学习，都是机器学习在模仿人类对于事物的认识中而来的。只是人类对于事物的认识有两种情况：你小时候见到了狗和猫两种动物，有人告诉你这个样子的是狗、那个样子的是猫，你学会了辨别，这是监督学习；你小时候见到了狗和猫两种动物，没人告诉你哪个是狗、哪个是猫，但你根据他们样子、体型等特征的不同鉴别出这是两种不同的生物，并对特征归类，这是无监督学习。
我们所见到的事物就是输入数据，而大人们对这些事物的判断结果（是狗还是猫啊）就是相应的输出。当我们见识多了以后，脑子里就慢慢地得到了一些泛化的模型，这就是训练得到的那个（或者那些）函数，从而不需要大人在旁边指点的时候，我们也能分辨的出来哪些是猫，哪些是狗。
还可以拿高考来举例，有监督的学习就是我们在平时训练做题时，都是有参考答案的(即数据的标签)，通过这种大量的有答案的题目来训练我们的解题方法，从而在高考时，将最好的解题方法应用，得出最好的分数。

而无监督学习就像我们平时做题时，没有任何参考答案(即输入数据无标签)，那么你就失去了参考的标准，就没有一个可以确定的解题思路了，这样的状态在参考高考时，就不一定能得出最好的分数。