好了,现在开始写支持向量机系列,希望能坚持下去。
仅供参考,请勿转载,因为随时都可能会修改。
第一部分 引子
1. 支持向量机的目的是什么?
对于用于分类的支持向量机来说,给定一个包含正例和反例(正样本点和负样本点)的样本集合,支持向量机的目的是寻找一个超平面来对样本进行分割,把样本中的正例和反例用超平面分开,但是不是简单地分看,其原则是使正例和反例之间的间隔最大。
超平面是什么呢?简单地说,超平面就是平面中的直线在高维空间中的推广。那么,对于三维空间,超平面就是平面了。对于更高维的空间,我们只能用公式来表达,而缺少直观的图形了。总之,在n维空间中的超平面是n-1维的。
超平面的公式为
。公式中的w为可以调整的系数向量,b为bias。注意我们的表达习惯,所有的向量都是列向量,所以在第一项的内积中向量w需要进行转置。
现在考虑样本集合{xi,di},xi是输入的特征,di是样本对应的分类。现在规定当样本xi属于第一类时,di为1,当xi属于第二类时,di为-1。
那么,线性可分的意思就是一个超平面可以把两类样本完全地分割开来。用公式表达就

本文作为支持向量机入门系列的第一篇,介绍了支持向量机的目的,即寻找最大间隔的超平面将样本分类。讨论了超平面的概念、线性可分与不可分情况、支持向量及其重要性,以及如何通过最大化间隔来优化超平面。最后,形式化了该优化问题并引入了约束条件。
1万+

被折叠的 条评论
为什么被折叠?



