点击关注我哦

一篇文章带你学习基本要求以精通机器学习

机器学习,深度学习,数据科学和人工智能(AI)是当今最常用的流行语。这些主题的受欢迎程度每天都在上升。每个人、每个企业都在尝试向这些领域靠拢。据《财富》杂志统计,人工智能专家的招聘在过去四年中增长了74%。人工智能被视为当代的“最热门”工作。

这可能在我们的脑海中引发许多问题:是什么让它如此受欢迎?这些领域到底是什么?什么是机器学习?我该如何开始?为什么是python?

我们将在今天的文章中尝试讨论这些问题,同时详细说明如何开始使用python和机器学习(ML)。

为什么AI如此受欢迎?

人工智能是当今增长最快的领域之一。人工智能的进步正在迅速发展。不缺少职位空缺和职业机会。每个人都对AI将如何成为下一件大事大肆宣传。正如吴安德教授所言,现代AI最杰出的人物之一“人工智能是新的电力。”由于技术的进步和数据的丰富,对现代AI领域的期望值很高。我们拥有更高质量的图形处理单元和更好的技术来计算复杂过程。

这些领域到底是什么?

人工智能是一个广阔的领域。机器学习,数据科学,统计,自然语言处理等主题都属于人工智能。深度学习是机器学习的子集。人工智能是“能够执行通常需要人类智力的任务的计算机系统的理论和开发,例如视觉感知,语音识别,决策和语言之间的翻译。”

在本文中,我们将重点放在机器学习上。我将尝试给出一种更直观的方法来理解机器学习。

什么是机器学习?

机器学习是程序自动学习和提高效率的能力,而无需明确地编程即可。这意味着,给定训练集,可以训练机器学习模型,并且它将了解模型的确切工作方式。在测试集,验证集或任何其他看不见的数据上进行测试后,模型仍将能够评估特定任务。

用一个简单的例子来理解这一点。假设有30,000个电子邮件的数据集,其中有些被归类为垃圾邮件,有些被归类为非垃圾邮件。机器学习模型将在数据集上进行训练。培训过程完成后,可以使用测试数据集中未包含的邮件对其进行测试。机器学习模型可以对以下输入进行预测,并且无论输入电子邮件是否为垃圾邮件,都可以对其进行正确分类。

机器学习方法主要有三种。下面将陈述一些示例和应用:

1. 监督学习

使用专门标记的数据集训练模型。数据集可以是二分类也可以是多分类。训练数据集是带有标记的数据,这些数据指定不同的分类。监督学习即在这些标记的数据帮助下进行了预训练。这种学习可以分为以下两种算法:

  1. 分类:当输出具有选择或特定类别时,首选这些算法。电子邮件垃圾邮件过滤的示例可以视为分类问题。

  2. 回归:当输出变量具有实数值时,首选算法。例如,可以预测特定位置的房价。

算法:回归算法(线性回归),决策树,随机森林和分类算法,例如K最近邻(KNN),支持向量机(SVM),逻辑回归,朴素贝叶斯。

应用:电子邮件垃圾邮件过滤,肿瘤分类(良性或恶性),用户评论分为正面评论或负面评论。

2. 无监督学习

无监督学习是在无标签数据集上训练模型。这意味着该模型没有任何先验信息。它通过将相似的特征和模式组合在一起来进行自我训练。无监督学习的一个例子是对猫和狗的分类。提供给我们的数据将是一个没有标签的数据集,其中包含狗和猫的图像。无监督算法将在模式和狗和猫的分组中找到相似之处,而无需指定数据类型。群集算法主要有以下两种类型:

  1. 聚类:将相似的实体排列成聚类组。如前所述,将猫和狗等类别归为一组的示例。另一个例子是根据特定数据确定癌症分期。

  2. 关联:在2个或多个班级/用户之间关联相似的模式。这样的示例是推荐系统,其中,如果特定的人观看特定类型的电影,则根据观看同一电影的其他用户喜欢观看的内容为用户提供推荐。亚马逊的另一个例子是,当亚马逊建议购买特定商品的买家也喜欢购买其他类似商品时。

算法: K-均值聚类,主成分分析(PCA),奇异值分解(SVD),分层聚类。

应用:亚马逊,Netflix,YouTube和其他数字平台中的推荐系统,Facebook上的朋友建议,异常检测。

3. 强化学习

根据维基百科上的介绍:强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以使累积奖励的概念最大化有关。除了监督学习和无监督学习,强化学习是三种基本的机器学习范式之一。

强化学习是一种即插即用的方法模型。这是模型学习反复失败的方法。当模型无法达到期望的结果时,模型将重新训练。这可以应用于像下棋的概念,在玩了数百万游戏之后,模型将能够学习适当的模式和动作。一个更简单的示例是井字游戏。经过几百场比赛,该模型可以学习每条通往胜利的道路,并且经过完美训练后,它永远不会输掉一场比赛。

算法:基于策略,基于价值和基于模型的强化学习算法。

应用:进行模型学习,如玩飞鸟,工业自动化中的机器人,交通控制,基于深度学习的强化学习。

应该如何开始?

机器学习入门的最佳方法是探索并更深入地研究围绕机器学习的各个主题。机器学习需要编程技能,数学知识,最重要的是需要学习的意愿和毅力。有大量的免费和付费资源,您可以从中获得很多知识。

为什么使用Python?

Python是一种面向对象的高级编程语言,具有高度的可解释性和效率。它非常优雅,易于学习且易于使用。Python是任何人的最佳方法,即使没有使用编程或编码语言的经验的人也可以开始使用机器学习。尽管存在一些缺陷,例如被认为是“慢”语言,但是python仍然是AI和机器学习的最佳语言之一。

尽管R等其他语言,Python之所以在机器学习中如此受欢迎的主要原因如下:

  1. 如前所述,python非常简单且一致。

  2. 与其他编程语言相比,流行度迅速提高。

  3. 有关各种库和框架的大量资源。我们将在本系列的下一部分中对此进行更详细的讨论。

  4. 多功能性和平台独立性。这意味着python也可以导入用其他编程语言构建的基本模块。

  5. 很棒的社区和不断更新。总体来说,python社区充满了令人惊奇的人,并且不断进行更新以改进python。

·  END  ·

HAPPY LIFE

Python入门机器学习相关推荐

  1. 集锦分享 | 200篇原创笔记,帮助你快速入门Python与机器学习

    「Python与算法社区」号主现就职于某知名互联网公司,5年算法工程师,从事机器学习.深度学习.数据分析等相关工作.Pandas开源库贡献者. 这位大佬喜欢分享,在过去的两年中,已原创并分享 280 ...

  2. 新书上市 | 数学不好,Python不行,还能入门机器学习吗?

    没错,图灵君又来安利好书了! 什么书?机器学习?机器学习的书已经很多了,这本有啥特别的吗? 当然有. 话说有位日本网友,买了40多本数学和机器学习相关的书,愣是没有学会,直到遇到了这本,那叫一个相见恨 ...

  3. python需要数学知识吗_入门机器学习到底需要多少数学知识

    还记得上个月的时候,准备学习机器学习的知识,想着线性回归模型较简单一些,那就从它开始吧.可是仔细一看里面的知识包括矩阵.极大似然函数.求导等方面的知识,这些知识也只是大学的时候学习的,现在也早已还给了 ...

  4. 入门机器学习的必备Python库

    点击关注我哦 一篇文章带你了解入门机器学习的必备Python库 1. Pandas Pandas模块是python一个开源库,包含DataFrame和Series两种数据结构用于组织数据极为有用.Pa ...

  5. 【CSDN软件工程师能力认证学习精选】如何入门Python与机器学习

    CSDN软件工程师能力认证(以下简称C系列认证)是由中国软件开发者网CSDN制定并推出的一个能力认证标准.C系列认证历经近一年的实际线下调研.考察.迭代.测试,并梳理出软件工程师开发过程中所需的各项技 ...

  6. 元旦福利 | Python、机器学习、TensorFlow 图书送一波

    随着人工智能的升温,大家越来越关注这门最接近AI的编程语言,关于Python的消息也是接连不断.比如浙江省信息技术课程改革方案出台,Python 确定进入浙江省信息技术高考,从2018年起浙江省信息技 ...

  7. 微软推出Python入门课,登上GitHub趋势榜第一(附视频)

    来源:新智元 本文约900字,建议阅读10分钟. 本文带你看视频轻松学习python课程! [ 导读 ] 微软针对 Python 初学者,推出了一套免费的教程视频.这套课程最大的特定是轻松简洁,一上线 ...

  8. Python入门教程:很多人推荐学 Python 入 IT ,如果学完 Python 找不到工作怎么办...

    Python入门教程:很多人推荐学 Python 入 IT ,但是如果学完 Python 找不到工作怎么办,这也是很多人担心的问题. 很多人推荐通过学习 Python 入行 IT 一是因为 Pytho ...

  9. 哪本python入门书内容最详细-重磅 | 由浅入深的 AI 学习路线,最详细的资源整理!...

    原标题:重磅 | 由浅入深的 AI 学习路线,最详细的资源整理! [导读] 本文由知名开源平台,AI技术平台以及领域专家: Datawhale, ApacheCN, AI有道和 黄海广博士联合整理贡献 ...

最新文章

  1. 158行Python代码复现:DeepMind提图像生成的递归神经网络DRAW
  2. 深入理解计算机系统----读书笔记
  3. Linux: 系统配置 crond 和 crontab(有图有代码有真相!!!)
  4. oracle堆表和MySQL_聚簇索引对比|Oracle vs MySQL
  5. Python连接mysql基本操作
  6. 设计模式(一)面向对象设计原则
  7. sharepoint 2010 在线打开office时报错
  8. 计算机职业资格证学什么,计算机职业资格证书有哪些
  9. 光学基本知识--概念辨析
  10. openpyxl给excel设置条件格式
  11. Koo叔说Shader-CG语言介绍
  12. 【Ubantu】Ubantu 20.04设置root账户密码,查看共享文件夹
  13. 乐影音下载器 建议回复
  14. Xilinx SDK编译Microblaze时出错
  15. 文本数据分析:删除停用词
  16. Java中被final修饰的变量的几种赋值方式
  17. webrtc jitter buffer
  18. *一篇看了心有所感且文风特别好的文章**
  19. android商务app视频,电子商务设计视频
  20. PowerDesigner数据建模

热门文章

  1. 2001-2011年SCI收录中国学者发表的自动化与控制系统学科论文发文量前50期刊
  2. js封装数组反转的方法--冯浩的博客
  3. JSP开发之TomcatEclipse环境搭建(创建项目运行一个简单的jsp文件)
  4. Echarts-之显示百分比
  5. 4米乘以12米CAD图_简单四步,教你如何绘制好施工现场总平面布置图
  6. 拉格朗日插值在MATLAB的实现
  7. 中国地理位置四至点及计算方法
  8. Filter的使用技巧
  9. 中国安全市场进入战国时代(转)
  10. StarUML安装、注册与中文版详解版