SVM的本质是寻觅最大间隔的分割超平面。
SVM的假定也是在样本的每一个属性前面乘以1个系数,代价函数是基于LR演变而来的。LR中是S型函数的假定,SVM中是分段函数cost的情势,再包括正则项,最后SVM的代价函数为:
当C1般要设置地很大,这模样的SVM才能够找到最大间隔的超平面,thetaT*x>=1或thetaT*x<=⑴的时候,我们可以把第1项疏忽。这样,转换以后的SVM的目标函数就是我们熟习的:
我们构建拉格朗日函数:
分别对w和b求偏导,令偏导等于0,回代,可以得到w和b的最优解,以下:
W和b都是alpha表示的,我们使用SMO算法求得alpha。
利用核函数的概念,解决数据的线性不可分问题。核函数的作用,把显示映照到高维空间转换到隐式映照到高维空间。
SVM还可以扩大到多类分类中,利用one vs. one或one vs. other的规则。
SVM的优点:效果较好,既可以适用线性数据,也能够非线性。
缺点:对参数选择敏感。