机器学习是人工智能行业的一个创新且重要的领域。我们为机器学习程序选择的算法类型,取决于我们想要实现的目标。现在,机器学习有很多算法。可能对于初学者来说,这是相当不堪重负的。此前,Educative.io 联合创始人法希姆乌尔哈克(Fahim ul Haq)发文简要介绍了几种流行的机器学习算法,帮助初学者进入机器学习的世界。

1. 线性回归
线性回归(Linear Regression)可能是最流行的机器学习算法。线性回归就是要找一条直线,并且让这条直线尽可能地拟合散点图中的数据点。它试图通过将直线方程与该数据拟合来表示自变量(x 值)和数值结果(y 值)。然后就可以用这条线来预测未来的值。
这种算法最常用的技术是最小二乘法(Least of squares)。这个方法计算出最佳拟合线,以使得与直线上每个数据点的垂直距离最小,总距离是所有数据点的垂直距离的平方和。其思想是通过最小化这个平方误差或距离来拟合模型。

2. 逻辑回归
逻辑回归(Logistic regression)与线性回归类似,但它是用于输出为二进制的情况(即,当结果只能有两个可能的值)。对最终输出的预测是一个非线性的 S 型函数(称为 logistic function, g())。
这个逻辑函数将中间结果值映射到结果变量 Y,其值范围从 0 到 1。然后,这些值可以解释为 Y 出现的概率。S 型逻辑函数的性质使得逻辑回归更适合用于分类任务。

3. 决策树
决策树(Decision Trees)可用于回归和分类任务。在这一算法中,训练模型通过学习树表示(Tree representation)的决策规则来学习预测目标变量的值。树是由具有相应属性的节点组成的。

在每个节点上,人们根据可用的特征询问有关数据的问题。左右分支代表可能的答案,最终节点(即叶节点)对应于一个预测值。每个特征的重要性是通过自顶向下方法确定的。节点越高,其属性就越重要。

4. 支持向量机(SVM)
支持向量机(Support Vector Machine)是一种用于分类问题的监督算法。支持向量机试图在数据点之间绘制两条线,它们之间的边距最大。为此,要将数据项绘制为 n 维空间中的点,其中,n 是输入特征的数量。在此基础上,支持向量机找到一个最优边界,称为超平面(Hyperplane),它通过类标签将可能的输出进行最佳分离。
超平面与最近的类点之间的距离称为边距。最优超平面具有最大的边界,可以对点进行分类,从而使最近的数据点与这两个类之间的距离最大化。

5. K- 均值

K- 均值(K-means)是通过对数据集进行分类来聚类的。例如,这个算法可用于根据购买历史将用户分组。它在数据集中找到 K 个聚类。K- 均值用于无监督学习,因此,你只需使用训练数据 X,以及你想要识别的聚类数量 K。
该算法根据每个数据点的特征,将每个数据点迭代地分配给 K 个组中的一个组。它为每个 K- 聚类选择 K 个点。 K- 聚类又称为质心,基于相似度,将新的数据点添加到具有最近质心的聚类中,这个过程一直持续到质心停止变化为止。

6. 降维
随着人们捕获的数据量越来越大,机器学习问题也变得更加复杂。这就意味着训练极其缓慢,而且很难找到一个好的解决方案。这一问题,通常被称为“维数灾难”(Curse of dimensionality)。
降维(Dimensionality reduction)试图在不丢失最重要信息的情况下,通过将特定的特征组合成更高层次的特征来解决这个问题。主成分分析(Principal Component Analysis,PCA)是最流行的降维技术。
主成分分析通过将数据集压缩到低维线或超平面 / 子空间来降低数据集的维数。这尽可能地保留了原始数据的显著特征。

以上就是当下流行的几种机器学习算法,除此以外,还有朴素贝叶斯、K- 最近邻算法(KNN)、 随机森林、人工神经网络(ANN)等也是有名的机器学习算法。

机器学习常用六大算法相关推荐

  1. 机器学习-常用回归算法归纳(全网之最)

    文章目录 前言 一元线性回归 多元线性回归 局部加权线性回归 多项式回归 Lasso回归 & Ridge回归 Lasso回归 Ridge回归 岭回归和lasso回归的区别 L1正则 & ...

  2. 机器学习常用的算法整理:线性回归、逻辑回归、贝叶斯分类、支持向量机、K-means聚类、决策树、随机森林以及常用的应用场景整理

    什么是机器学习? 机器学习是计算机利用已有的数据(经验)得出了某种模型,并利用这些模型预测未来的一种方法.这个过程其实与人的学习过程极为相似,只不过机器是一个可以进行大维度数据分析而且可以不知疲倦地学 ...

  3. 机器学习——常用算法的总结

    机器学习常用算法总结 机器学习--常用算法的总结 学习方式 一.监督式学习: 1.分类 2.回归 补充--线性回归与逻辑回归 二.非监督式学习: 三.半监督式学习: 四.强化学习: 算法类似性 一.回 ...

  4. 机器学习常用算法归详细纳整理

    作者:进击的西西弗斯 本文链接:https://blog.csdn.net/qq_42216093/article/details/116434557 版权声明:本文为作者原创文章,未经作者同意禁止转 ...

  5. 机器学习常用算法的优缺点总结

    决策树 一.  决策树优点 1.决策树易于理解和解释,可以可视化分析,容易提取出规则. 2.可以同时处理标称型和数值型数据. 3.测试数据集时,运行速度比较快. 4.决策树可以很好的扩展到大型数据库中 ...

  6. 机器学习-第三方库(工具包):scikit-learn【用于特征工程(主要分为三部分:数据预处理、特征选择、降维)】【Sklearn模块中包含常用的算法】

    sklearn是Python语言的机器学习工具 sklearn是做特征工程(做模型调算法)最常用也是最好用的工具没有之一. Scikit-learn包括许多知名的机器学习算法的实现(算法原理一定要懂) ...

  7. 【机器学习】常用聚类算法 整理

    sparkML 常用聚类算法 http://spark.apache.org/docs/latest/mllib-clustering.html 如下为 机器学习聚类算法的理论知识: 在机器学习中,无 ...

  8. [机器学习笔记] 常用关联规则算法

    机器学习中常用关联规则算法 关联规则算法是一种基于规则的机器学习算法,该算法可以在大数据中发现彼此之间的关系. 它的目的是:利用一些度量指标来分辨数据库中存在的强规则.也即是说关联规则挖掘是用于知识发 ...

  9. 机器学习(二十二)——推荐算法中的常用排序算法, Tri-training

    推荐算法中的常用排序算法 Pointwise方法 Pranking (NIPS 2002), OAP-BPM (EMCL 2003), Ranking with Large Margin Princi ...

最新文章

  1. jacoco收集探针结果时机_滴滴开源Super-jacoco:java代码覆盖率收集平台
  2. visio取消首字母大写
  3. 实现用户协议显示_HTTP协议工作原理及其特点
  4. 新建一个Windows Service的方法
  5. C# 委托:把方法组合到一个数组中使用
  6. netflix_Netflix播放按钮剖析
  7. matlab R2012a in ubuntu12.04
  8. 清空文件夹_回收站不小心被清空?简单3步即刻找回丢失文件,值得收藏!
  9. c++输入、输出和文件
  10. 5.14 创建基于图层的切片并输出网页 [原创Ps教程]
  11. python 爬取直播弹幕视频_Python获取B站直播间弹幕信息
  12. 实验2014062701:opencv对图像的点操作
  13. Acdream 1729 Crime
  14. NISP管理中心|NISP二级证书介绍
  15. 替换字符串中的英文括号为其他字符串
  16. 今日分享——点点小事对人的影响
  17. 读写mp3,flac等音乐文件媒体信息
  18. 美通企业日报 | 茅台在海外市场供不应求;默克广东创新中心将正式投入使用...
  19. 在职研究生计算机专业好考么,湖南在职研究生计算机专业好考不
  20. 图像的基本操作--反转、放大等

热门文章

  1. 实现MSN,QQ消息提示效果[ASP.Net]
  2. arcgis 合并 联合_合并不同图层中的要素(联合)
  3. 由三个点的坐标确定圆和球的圆心和半径
  4. 帝国cms7.5编辑信息无法修改内容和上传图片解决办法
  5. 【JAVA进阶】static关键字详解
  6. WAV 文件转成数组
  7. python爬虫逆向|某手网页滑块逆向分析
  8. 402、403、404、502等网关错误的解决办法都在这了!
  9. AWS在中国推出教育技术创业加速计划AWS EdStart
  10. plsqldev工具自动提交