<cite id="fzn17"></cite>
<var id="fzn17"></var><cite id="fzn17"><video id="fzn17"></video></cite>
<cite id="fzn17"></cite>
<var id="fzn17"></var>
<menuitem id="fzn17"><span id="fzn17"><thead id="fzn17"></thead></span></menuitem>
<cite id="fzn17"><span id="fzn17"><var id="fzn17"></var></span></cite><var id="fzn17"><span id="fzn17"><var id="fzn17"></var></span></var>
<var id="fzn17"></var>
<menuitem id="fzn17"></menuitem>
<cite id="fzn17"><video id="fzn17"></video></cite>
|
|
51CTO旗下网站
|
|
移动端

1.6 数据分析算法简介

《大数据分析:数据挖掘必备算法示例详解》第1章数据分析绪论,本章主要介绍预备知识,即在进行数据分析前,读者需要了解的知识与背景。本节为数据分析算法简介。

作者:张重生来源:机械工业出版社|2017-12-13 17:24

1.6 数据分析算法简介

数据分类的问题通常分为两个阶段:在训练数据 (每行数据都有类别 /标签)上的分类模型训练阶段,以及使用该分类模型在测试数据 (每行数据都没有类别 /标签) 上进行预测的阶段。

从 19?#31119;?#24180; RossQuinlan发明的 I?#27169;常ǎ桑簦澹潁幔簦椋觶澹模椋悖瑁錚簦錚恚椋螅澹潁常?#31639;法,到 1993年他提出的C4?5算法,再到 199?#30340;?Vapnik和 Cortes发表的 SVM (SupportVectorMachine/networks)算法,1999年的 Friedman的 GB?#27169;裕ǎ櫻簦錚悖瑁幔螅簦椋悖牽潁幔洌椋澹睿簦攏錚錚螅簦椋睿紓裕潁澹澹螅?算法,到 2003年 Fre
und的 AdaBoost(AdaptiveBoosting)算法,再到 2006年 Guang-BinHuang的 ELM (Extremelearningmachines)算法,到 2009年前后产生的 SRC (SparseRepresentation-basedClassifica?tion)分类算法,几十年来,机器学习领域已经产生了数十种数据分类算法。

然而,直到今天,计算机领域并没有产生一个能够绝对胜过其他算法的分类算法。相反,在不同的数据和应用中,各种分类算法有不同准确率的表现 (performance)。譬如,在某些数据上,A算法和 B算法训练的分类模型可能取得***的准确率;而在另外一些数据上,C算法或 D算法却能取得***的预测准确率。由于没有一个算法能够绝对胜过其他算法,导致人们在?#23548;?#24212;用中总是需要结合具体的应用和数据,选择最合适该数据的分类算法?#23433;?#25968;,或者是若干分类算法的组合,?#20113;?#22312;该数据上学习得到的分类模型能够达到***的预测准确率。现在,对于多数大数据分析 /数据挖掘领域的研究人员而言,设计一种新的、高准确率的分类算法是非常困难的事情。而如何选择最适合某个具体数据的分类算法或若干算法的组合,已经上升为一种极其重要的技术。事实上,很多研究人员的工作,并没有专注于设计全新的分类算法,而基本上都是基于某一种或某几种现有的分类算法,进行改进或组合 (集成学习),或者是优化分类算法的流程,如增加属性选择或数据选择的步骤,或者是改进收敛的条件 /限制。

根据文献介绍,结合作者的切身使用经验,GB?#27169;浴ⅲ遙幔睿洌錚恚疲錚潁澹螅簟ⅲ蹋椋猓櫻鄭汀ⅲ牛蹋?#25972;体上是分类准确度***的 4个算法。为了达到***的分类准确率,这 4个算法都需要进行调参。调参时,通常将整个训练数据细分为训练数据 Tr和验证数据 Va,在 Tr上 (使用不同的参数)训练分类模型,并在 Va上进行验证;重复该过程,直到得到一组能在 Va上达到***分类准确率的参数。调参的过程通常是极其耗时的。例如,如果不需要调参,GB?#27169;?#26159;最快的算法,但是,?#30001;系?#21442;步骤之后,其所需的运行时间会增加数十倍,甚至更多。


?#19981;?#30340;朋友可以添加我们的微信账号:

51CTO读书频道二维码

 

51CTO读书频道活动讨论群:365934973
【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你?#19981;?/dt>

订阅专栏+更多

16招轻松掌握PPT技巧

16招轻松掌握PPT技巧

GET职场?#26377;?#25216;能
共16章 | 晒书包

289人订阅学习

20个局域网建设改造案例

20个局域网建设改造案例

网络搭建技巧
共20章 | 捷哥CCIE

645人订阅学习

WOT2019全球人工智能技术峰会

WOT2019全球人工智能技术峰会

通用技术、应用领域、企业赋能三大章节,13大技术专场,60+国内外一线人工智能精英大咖站台,分享人工智能的平台工具、算法模型、语音视觉等技术主题,助力人工智能落地。
共50章 | WOT峰会

0人订阅学习

读 书 +更多

基于Eclipse的开源框架技术与实战

当前,开源框架层出不穷,它为用户提供了通用的解决方案,同时也增加了用户的学习难?#21462;?#24320;源是一?#36873;?#21452;?#34218;!保?#19968;方面它共享了?#35797;矗?#25552;供了...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO播客

澳洲幸运5官方
<cite id="fzn17"></cite>
<var id="fzn17"></var><cite id="fzn17"><video id="fzn17"></video></cite>
<cite id="fzn17"></cite>
<var id="fzn17"></var>
<menuitem id="fzn17"><span id="fzn17"><thead id="fzn17"></thead></span></menuitem>
<cite id="fzn17"><span id="fzn17"><var id="fzn17"></var></span></cite><var id="fzn17"><span id="fzn17"><var id="fzn17"></var></span></var>
<var id="fzn17"></var>
<menuitem id="fzn17"></menuitem>
<cite id="fzn17"><video id="fzn17"></video></cite>
<cite id="fzn17"></cite>
<var id="fzn17"></var><cite id="fzn17"><video id="fzn17"></video></cite>
<cite id="fzn17"></cite>
<var id="fzn17"></var>
<menuitem id="fzn17"><span id="fzn17"><thead id="fzn17"></thead></span></menuitem>
<cite id="fzn17"><span id="fzn17"><var id="fzn17"></var></span></cite><var id="fzn17"><span id="fzn17"><var id="fzn17"></var></span></var>
<var id="fzn17"></var>
<menuitem id="fzn17"></menuitem>
<cite id="fzn17"><video id="fzn17"></video></cite>
浙江l5选5开奖结果 15选5杀号定胆走势 大乐透下期预测最准确 兴發娱乐官网 日韩美女1280x720 mg电子游戏澳门娱乐城 重庆时时升降图 时时彩app哪个好用 江西时时历史开奖结果 3d开机号走势图今天晚上