1决策树(Decision Trees)的优缺点

决策树的优点:

一、 决策树易于理解和解释.人们在通过解释后都有能力去理解决策树所表达的意义。

二、 对于决策树,数据的准备往往是简单或者是不必要的.其他的技术往往要求先把数据一般化,比如去掉多余的或者空白的属性。

三、 能够同时处理数据型和常规型属性。其他的技术往往要求数据属性的单一。

四、 决策树是一个白盒模型。如果给定一个观察的模型,那么根据所产生的决策树很容易推出相应的逻辑表达式。

五、 易于通过静态测试来对模型进行评测。表示有可能测量该模型的可信度。

六、 在相对短的时间内能够对大型数据源做出可行且效果良好的结果。

七、 可以对有许多属性的数据集构造决策树。

八、 决策树可很好地扩展到大型数据库中,同时它的大小独立于数据库的大小。

决策树的缺点:

一、 对于那些各类别样本数量不一致的数据,在决策树当中,信息增益的结果偏向于那些具有更多数值的特征。

二、 决策树处理缺失数据时的困难。

三、 过度拟合问题的出现。

四、 忽略数据集中属性之间的相关性。

2 人工神经网络的优缺点

人工神经网络的优点:

一、分类的准确度高,

二、并行分布处理能力强,

三、分布存储及学习能力强,

四、对噪声神经有较强的鲁棒性和容错能力,

五、能充分逼近复杂的非线性关系,

六、具备联想记忆的功能等。

人工神经网络的缺点:

一、神经网络需要大量的参数,如网络拓扑结构、权值和阈值的初始值;

二、不能观察之间的学习过程,输出结果难以解释,会影响到结果的可信度和可接受程度;

三、学习时间过长,甚至可能达不到学习的目的。

3 遗传算法的优缺点

遗传算法的优点:

一、 与问题领域无关切快速随机的搜索能力。

二、 搜索从群体出发,具有潜在的并行性,可以进行多个个体的同时比较,鲁棒性好。

三、 搜索使用评价函数启发,过程简单。

四、 使用概率机制进行迭代,具有随机性。

五、 具有可扩展性,容易与其他算法结合。

遗传算法的缺点:

一、 遗传算法的编程实现比较复杂,首先需要对问题进行编码,找到最优解之后还需要对问题进行解码,

二、 另外三个算子的实现也有许多参数,如交叉率和变异率,并且这些参数的选择严重影响解的品质,而目前这些参数的选择大部分是依靠经验.没有能够及时利用网络的反馈信息,故算法的搜索速度比较慢,要得要较精确的解需要较多的训练时间。

三、 算法对初始种群的选择有一定的依赖性,能够结合一些启发算法进行改进。

4 KNN算法(K-Nearest Neighbour) 的优缺点

KNN算法的优点:

一、 简单、有效。

二、 重新训练的代价较低(类别体系的变化和训练集的变化,在Web环境和电子商务应用中是很常见的)。

三、 计算时间和空间线性于训练集的规模(在一些场合不算太大)。

四、 由于KNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,KNN方法较其他方法更为适合。

五、 该算法比较适用于样本容量比较大的类域的自动分类,而那些样本容量较小的类域采用这种算法比较容易产生误分。

KNN算法缺点:

一、 KNN算法是懒散学习方法(lazy learning,基本上不学习),一些积极学习的算法要快很多。

二、 类别评分不是规格化的(不像概率评分)。

三、 输出的可解释性不强,例如决策树的可解释性较强。

四、 该算法在分类时有个主要的不足是,当样本不平衡时,如一个类的样本容量很大,而其他类样本容量很小时,有可能导致当输入一个新样本时,该样本的K个邻居中大容量类的样本占多数。该算法只计算“最近的”邻居样本,某一类的样本数量很大,那么或者这类样本并不接近目标样本,或者这类样本很靠近目标样本。无论怎样,数量并不能影响运行结果。可以采用权值的方法(和该样本距离小的邻居权值大)来改进。

五、 计算量较大。目前常用的解决方法是事先对已知样本点进行剪辑,事先去除对分类作用不大的样本。

5 支持向量机(SVM)的优缺点

SVM的优点:

一、 可以解决小样本情况下的机器学习问题。

二、 可以提高泛化性能。

三、 可以解决高维问题。

四、 可以解决非线性问题。

五、 可以避免神经网络结构选择和局部极小点问题。

SVM的缺点:

一、 对缺失数据敏感。

二、 对非线性问题没有通用解决方案,必须谨慎选择Kernelfunction来处理。

6 朴素贝叶斯的优缺点

优点:

一、 朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。

二、 NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。

缺点:

一、 理论上,NBC模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因为NBC模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的(可以考虑用聚类算法先将相关性较大的属性聚类),这给NBC模型的正确分类带来了一定影响。在属性个数比较多或者属性之间相关性较大时,NBC模型的分类效率比不上决策树模型。而在属性相关性较小时,NBC模型的性能最为良好。

二、 需要知道先验概率。

三、 分类决策存在错误率

7 Adaboosting方法的优点

一、 adaboost是一种有很高精度的分类器。

二、 可以使用各种方法构建子分类器,Adaboost算法提供的是框架。

三、 当使用简单分类器时,计算出的结果是可以理解的。而且弱分类器构造极其简单。

四、 简单,不用做特征筛选。

五、 不用担心overfitting。

8 Rocchio的优点

Rocchio算法的突出优点是容易实现,计算(训练和分类)特别简单,它通常用来实现衡量分类系统性能的基准系统,而实用的分类系统很少采用这种算法解决具体的分类问题。

9各种分类算法比较

根据这篇论文所得出的结论,

Calibrated boosted trees的性能最好,随机森林第二,uncalibrated bagged trees第三,calibratedSVMs第四, uncalibrated neural nets第五。

性能较差的是朴素贝叶斯,决策树。

有些算法在特定的数据集下表现较好。

转载于:https://www.cnblogs.com/88223100/p/DT_ANN_KNN_SVM_GA_Bayes_Adaboosting_Rocchio.html

各常用分类算法的优缺点总结:DT/ANN/KNN/SVM/GA/Bayes/Adaboosting/Rocchio相关推荐

  1. 常用分类算法的优缺点

    1. Bayes 贝叶斯分类法 1.1. 优点 1)所需估计的参数少,对于缺失数据不敏感. 2)有着坚实的数学基础,以及稳 定的分类效率. 1.2. 缺点 1)需要假设属性之间相互独立,这往往并不成立 ...

  2. 机器学习常见的分类算法的优缺点

    1. 前言 在机器学习中,种类最多的一类算法要属很类算法,本文对机器学习中的各种分类算法的优缺点做一个总结. 2. 贝叶斯分类法 2.1 优点 所需估计的参数少,对于缺失数据不敏感. 有着坚实的数学基 ...

  3. 数据挖掘算法——常用分类算法总结

    常用分类算法总结 分类算法 NBC算法 LR算法 SVM算法 ID3算法 C4.5 算法 C5.0算法 KNN 算法 ANN 算法 分类算法 分类是在一群已经知道类别标号的样本中,训练一种分类器,让其 ...

  4. 机器学习中分类算法的优缺点

    决策树 一.  决策树优点 1.决策树易于理解和解释,可以可视化分析,容易提取出规则. 2.可以同时处理标称型和数值型数据. 3.测试数据集时,运行速度比较快. 4.决策树可以很好的扩展到大型数据库中 ...

  5. 基于Python实现五大常用分类算法(原理+代码)

    读: 在机器学习和统计中,分类算法通过对已知类别训练集的计算和分析,从中发现类别规则并预测新数据的类别.分类被认为是监督学习的一个实例,即学习可以获得正确识别的观察的训练集的情况. 实现分类的算法,特 ...

  6. 模式识别之基础---常用分类算法特性归纳

    常用的分类算法主要有决策树,贝叶斯,KNN,SVM,神经网络以及基于规则的分类算法. 本文主要对各种分类算法的特性做一下总结. 1. 决策树算法 决策树算法是一种构建分类模型的非参数方法,它不要求任何 ...

  7. 不同分类算法的优缺点是什么?(值得推荐)

    本篇文章讲解大白话,易懂 目录 目录 1不同分类算法的优点是什么-Xavier Amatriain版 逻辑回归 支持向量机SVM 决策树集 深度学习 总结 2不同分类算法的优点是什么-Ediwin C ...

  8. 几种常用回归算法——线性回归、支持向量机回归和KNN回归

    欢迎关注,敬请点赞! 台湾何时归--几种常用回归算法 线性回归LR(Linear Regression) 代码展示(加噪声的正旋函数,狭义线性回归) 支持向量机回归SVR(Support Vector ...

  9. 【综述】介绍这些常用机器学习算法的优缺点

    视学算法 来源:数据派THU.七月在线 目录 正则化算法(Regularization Algorithms) 集成算法(Ensemble Algorithms) 决策树算法(Decision Tre ...

最新文章

  1. C++ 发手机短信(很易很简单)
  2. hdu3018 一笔画问题
  3. [翻译]Go与C#对比 第三篇:编译、运行时、类型系统、模块和其它的一切
  4. mysql备份 where_MySQL备份与还原
  5. python unit test_Python Unittest
  6. 分享最新40款免费的 WordPress 主题(上篇)
  7. 库克遭一名自称其妻子的陌生女子威胁 苹果紧急申请限制令
  8. Kylin 2.6.0JDBC方式访问
  9. javascript---DOM---事件
  10. 最强联合!北大清华互相开放本科课程(附课程名单)
  11. 1.2 iostream库简介
  12. 印度互联网创业大热:会出现“下一个苹果”?
  13. 哇塞,可以用Python实现电脑自动写小说了!!!
  14. blk_update_request: I/O error,dev fd0, sector 0
  15. 【Paper】Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation
  16. 线性代数:如何求特征值和特征向量?
  17. 「诗人艺术家ll著名诗人」胭脂茉莉十四行诗10首
  18. 【趣味科普】数学中的励志故事
  19. python蒙特卡洛算法模拟赌博模型
  20. 一本通 第三部分 数据结构 第四章 图论算法 第二节 最短路径算法 1381:城市路(Dijkstra)

热门文章

  1. 误入前端三年,一个文科生的独白(上)
  2. 看看这14家科技前沿公司 原来最牛的天使投资是它
  3. ftp+nginx+lua_Nginx+GraphicsMagick来实现目录浏览、实时缩略图
  4. 关闭Eclipse的控制台console自动跳出
  5. XStream xml与javabean之间的互转
  6. windows API 实现截图
  7. 如何和女生聊天不进入友谊区
  8. nginx有10个以上参数rewrite的处理
  9. 从性能方面谈系统设计
  10. 微软职位内部推荐-SW Engineer II for WinCE