<cite id="fzn17"></cite>
<var id="fzn17"></var><cite id="fzn17"><video id="fzn17"></video></cite>
<cite id="fzn17"></cite>
<var id="fzn17"></var>
<menuitem id="fzn17"><span id="fzn17"><thead id="fzn17"></thead></span></menuitem>
<cite id="fzn17"><span id="fzn17"><var id="fzn17"></var></span></cite><var id="fzn17"><span id="fzn17"><var id="fzn17"></var></span></var>
<var id="fzn17"></var>
<menuitem id="fzn17"></menuitem>
<cite id="fzn17"><video id="fzn17"></video></cite>
|
|
51CTO旗下网站
|
|
移动端

2.1 算法原理

《大数据分析:数据挖掘必备算法示例详解》第2章SVM 算法,本书详细介绍了大数据分析,尤其是数据分类相关算法的原理及实现 细节,并给出了每个算法的编程实例。本节为大家介绍算法原理。

作者:张重生来源:机械工业出版社|2017-12-13 17:32

第2章 SVM 算法

2.1 算法原理

Vapnik早在 20世纪 60年代就提出了 SVM算法[?#20445;玻?#30340;原理,但是直到 ?#20445;梗梗病保梗梗?#24180;他移民美国之后这篇论文才公开在全世界范围内投稿 /发表。该论文在 ?#20445;梗梗的?#20043;前曾经一度被机器学习领域的著名期刊拒绝录用。后来,Vapnik等增加了手写识别的应用,最后,该论文直到 ?#20445;梗梗的?#25165;被著名期刊 《MachineLearning》接收并正式发表。

下面给出 SVM算法原理的推导。在图 2-1中,令 f(x,y)?#21073;鰨猓剑啊?#35813;直线上方的数据点为健康人士,下方的数据点为糖尿病患者。将 f(x,y)向上、向下各平移一个单位,分别得到两条新直线 g(x,y)和 h(x,y),则这两条直线的方程分别为:

g(x,y)?#21073;媯ǎ保剑鰨猓保剑?/p>

h(x,y)?#21073;媯ǎ保剑鰨猓保剑?/p>

即,g(x,y)表示的是 f(x,y)?#21073;保唬瑁ǎ?#34920;示的是 f(x,y)?#21073;薄?#32780;且,g(x,y)上方的数据
点均满足 f(x,y)>?#21073;保唬瑁ǎ?#19979;方的数据点均满足 f(x,y)<?#21073;薄?br />

g(x,y)与 h(x,y)两条直线之间的垂?#26412;?#31163;为:

SVM的目标是将上述两条直线之间的距离dis最宽(最大化)。而将dis最大化,等价地,就是将?#20445;鰨玻?最小化。同时,需要满足如下限制条件:直线g(x,y)上方的数据点均满足f(x,y)>?#21073;保?#30452;线h(x,y)下方的数据点均满足f(x,y)<?#21073;薄?/p>

然后,引入拉格朗日函数?#25237;?#20598;变量βi解决上述最优化问题。并代入各个数据点的坐标,求解各βi变量。进而求解数据分类的最佳直线方程。

将上述每个数据点都增加一个维度?#20445;?#24471;到6个点:

p是一个三行一列的向量(列向量)。p向量的这三个值分别表示直线ax+cy+b?#21073;?#30340;三个系数a,c,b。根据系数a,c,b,可以求解直线方程ax+cy+b?#21073;埃?#35813;直线即为对应数据进行分类的最佳直线方程。

当数据是线性不可分的情形时,如图2-3所示:

此时,需要对数据进行映射,在图2-3的例子中,可以将?#19981;?#19978;的数据点(其坐标满足x2+y2?#21073;矗?进行映射:

映射后的数据点,满足线性可分。此时,就可使用上面的技术,求解数据分类的最佳直线方程。

这里,就引入了SVM的核函数,科学家们设计了多种SVM核函数,如高斯核。这些核函数将数据点进行映射,将原始数据点映射为线性可分的数据点。


?#19981;?#30340;朋友可以添加我们的微信账号:

51CTO读书频道二维码

 

51CTO读书频道活动讨论群:365934973
【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你?#19981;?/dt>

订阅专栏+更多

活学活用 Ubuntu Server

活学活用 Ubuntu Server

实战直通车
共35章 | UbuntuServer

218人订阅学习

Java EE速成指南

Java EE速成指南

掌握Java核心
共30章 | 51CTO王波

83人订阅学习

Mysql DBA修炼之路

Mysql DBA修炼之路

MySQL入门到高阶
共24章 | 武凤涛

472人订阅学习

读 书 +更多

计算机网络技术

本书是为北大燕工教育研究院编写的计算机网络技术的学习教材。它以实?#24335;?#23398;大纲为依据,全面系统的介绍了计算机网络技术知识,对于一个...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO播客

澳洲幸运5官方
<cite id="fzn17"></cite>
<var id="fzn17"></var><cite id="fzn17"><video id="fzn17"></video></cite>
<cite id="fzn17"></cite>
<var id="fzn17"></var>
<menuitem id="fzn17"><span id="fzn17"><thead id="fzn17"></thead></span></menuitem>
<cite id="fzn17"><span id="fzn17"><var id="fzn17"></var></span></cite><var id="fzn17"><span id="fzn17"><var id="fzn17"></var></span></var>
<var id="fzn17"></var>
<menuitem id="fzn17"></menuitem>
<cite id="fzn17"><video id="fzn17"></video></cite>
<cite id="fzn17"></cite>
<var id="fzn17"></var><cite id="fzn17"><video id="fzn17"></video></cite>
<cite id="fzn17"></cite>
<var id="fzn17"></var>
<menuitem id="fzn17"><span id="fzn17"><thead id="fzn17"></thead></span></menuitem>
<cite id="fzn17"><span id="fzn17"><var id="fzn17"></var></span></cite><var id="fzn17"><span id="fzn17"><var id="fzn17"></var></span></var>
<var id="fzn17"></var>
<menuitem id="fzn17"></menuitem>
<cite id="fzn17"><video id="fzn17"></video></cite>
水果拉霸视频 西班牙人巴列卡诺都挺好 亚冠山东和鹿岛鹿角预测 重庆时时彩走势图诀窍 招财童子在线客服 mg热血羽毛球网站 网游之王牌战士贴吧 fatezero兰斯洛特 北京pk10开奖 中秋佳节流行送礼,你会送什么呢?