大数据的定义

大数据(bigdata),指无法在定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据是个笼统的概念暂未发现和准确的定义。

大数据的核心是利用数据的价值,机器学习是利用数据价值的关键技术,对于大数据而言,机器学习是不可或缺的。相反,对于机器学习而言,越多的数据会越可能提升模型的精确性,同时,复杂的机器学习算法的计算时间也迫切需要分布式计算与内存计算这样的关键技术。因此,机器学习的兴盛也离不开大数据的帮助。大数据与机器学习两者是互相促进,相依相存的关系。

机器学习与大数据紧密联系。但是,必须清醒的认识到,大数据并不等同于机器学习,同理,机器学习也不等同于大数据。大数据中包含有分布式计算,内存数据库,多维分析等等多种技术。单从分析方法来看,大数据也包含以下四种分析方法:

1.大数据,小分析:即数据仓库领域的OLAP分析思路,也就是多维分析思想。

2.大数据,大分析:这个代表的就是数据挖掘与机器学习分析法。

3.流式分析:这个主要指的是事件驱动架构。

4.查询分析:经典代表是NoSQL数据库。

也就是说,机器学习仅仅是大数据分析中的一种而已,尽管机器学习的一些结果具有很大的魔力,在某种场合下是大数据价值较好的说明。但这并不代表机器学习是大数据下的唯的分析方法。

机器学习的定义

从广义上来说,机器学习是种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。但从实践的意义上来说,机器学习是种通过利用数据,训练出模型,然后使用模型预测的种方法。

先,我们需要在计算机中存储历史的数据。接着,我们将这些数据通过机器学习算法进行处理,这个过程在机器学习中叫做“训练”,处理的结果可以被我们用来对新的数据进行预测,这个结果般称之为“模型”。对新数据的预测过程在机器学习中叫做“预测”。“训练”与“预测”是机器学习的两个过程,“模型”则是过程的中间输出结果,“训练”产生“模型”,“模型”指导“预测”。

人类在成长、生活过程中积累了很多的历史与经验。人类定期地对这些经验进行“归纳”,获得了生活的“规律”。当人类遇到未知的问题或者需要对未来进行“推测”的时候,人类使用这些“规律”,对未知问题与未来进行“推测”,从而指导自己的生活和工作。

机器学习中的“训练”与“预测”过程可以对应到人类的“归纳”和“推测”过程。通过这样的对应,我们可以发现,机器学习的思想并不复杂,仅仅是对人类在生活中学习成长的个模拟。由于机器学习不是基于编程形成的结果,因此它的处理过程不是因果的逻辑,而是通过归纳思想得出的相关性结论。

这也可以联想到人类为什么要学习历史,历史实际上是人类过往经验的总结。有句话说得很好,“历史往往不样,但历史总是惊人的相似”。通过学习历史,我们从历史中归纳出人生与国家的规律,从而指导我们的下步工作,这是具有莫大价值的。当代些人忽视了历史的本来价值,而是把其作为种宣扬功绩的手段,这其实是对历史真实价值的一种误用。

人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:
四大机器学习编程语言对比:R、Python、MATLAB、Octave
http://www.duozhishidai.com/article-16728-1.html
人工智能,机器学习和深度学习之间,主要有什么差异?
http://www.duozhishidai.com/article-15858-1.html
干货:深度学习 vs 机器学习 vs 模式识别三种技术对比
http://www.duozhishidai.com/article-15119-1.html


多智时代-人工智能和大数据学习入门网站|人工智能、大数据、物联网、云计算的学习交流网站

机器学习和大数据的基本介绍,两者之间有什么联系?相关推荐

  1. 概述:机器学习和大数据技术在信贷风控场景中的应用

    来源:知乎 本文约5400字,建议阅读10分钟 本文简要概述在当前大数据和机器学习技术如何在信贷风控场景下的常见应用. 似乎一夜之间,所有的互联网公司在对外的宣传稿中都会提及自己使用机器学习和大数据技 ...

  2. 推荐文章:机器学习:“一文读懂机器学习,大数据/自然语言处理/算法全有了...

    PS:文章主要转载自CSDN大神"黑夜路人"的文章:           http://blog.csdn.NET/heiyeshuwu/article/details/43483 ...

  3. 机器学习及大数据经典算法笔记汇总

    机器学习及大数据经典算法笔记汇总 一.总结 二.机器学习及大数据算法 机器学习及大数据经典算法笔记汇总 一.总结 前面的博文,介绍了很多TensorFlow 以及 DeepLeaning 的算法.这里 ...

  4. 机器学习科普文章:“一文读懂机器学习,大数据/自然语言处理/算法全有了”

    PS:文章主要转载自CSDN大神"黑夜路人"的文章:           http://blog.csdn.net/heiyeshuwu/article/details/43483 ...

  5. 一文读懂机器学习,大数据/自然语言处理/算法全有了…… (非常好)

    http://www.open-open.com/lib/view/open1420615208000.html 阅读文件夹 1.一个故事说明什么是机器学习 2.机器学习的定义 4.机器学习的方法 5 ...

  6. 一文读懂机器学习,大数据/自然语言处理/算法全有了

    转载至:http://www.cnblogs.com/subconscious/p/4107357.html 在本篇文章中,我将对机器学习做个概要的介绍.本文的目的是能让即便完全不了解机器学习的人也能 ...

  7. 《Python Spark 2.0 Hadoop机器学习与大数据实战_林大贵(著)》pdf

    <Python+Spark 2.0+Hadoop机器学习与大数据实战> 五星好评+强烈推荐的一本书,虽然内容可能没有很深入,但作者非常用心的把每一步操作详细的列出来并给出说明,让我们跟着做 ...

  8. [转载] 机器学习科普文章:“一文读懂机器学习,大数据/自然语言处理/算法全有了”

    PS:文章主要转载自CSDN大神"黑夜路人"的文章:           http://blog.csdn.net/heiyeshuwu/article/details/43483 ...

  9. [转]机器学习科普文章:“一文读懂机器学习,大数据/自然语言处理/算法全有了”

    在本篇文章中,我将对机器学习做个概要的介绍.本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实 践.这篇文档也算是EasyPR开发的番外篇,从这里开始,必须对机器学习了解才能 ...

最新文章

  1. 8GB内存的树莓派4来啦!国内售价589元,官方还推出配套64位系统
  2. 正则表达式,grep,sed,
  3. 单例模式的七种实现方法(java版)
  4. ORACLE中表死锁的处理
  5. java顺序表冒泡排序_冒泡排序就这么简单 - Java3y的个人空间 - OSCHINA - 中文开源技术交流社区...
  6. android放大镜无广告,Android放大镜的实现代码
  7. tableau 集动作_在Tableau中通过添加操作,控制集并高亮显示数据
  8. java-png图片压缩,解决png图片压缩后背景变黑问题
  9. C++使函数返回多个数组
  10. php 还原mysql_PHP备份/还原MySQL数据库的代码
  11. (转)style,currentStyle,getComputedStyle的区别和用法
  12. 【模拟信号】基于matlab调频信号产生+解调【含Matlab源码 986期】
  13. IBM SPSS Statistics定义变量使用介绍
  14. uniapp使用网易易盾
  15. java.util.Scanner包的使用
  16. VirtualBox 安装 增强功能
  17. KafkaConsumer实现精确的latest(结尾)开始消费
  18. 不错的U3D第一人称射击类游戏教程
  19. T9键盘[用户通过数字键盘输入,手机将提供与这些数字相匹配的单词列表]
  20. python中输入直角三角形的两个直角边a,b求斜边c的长度

热门文章

  1. 機器學習基石 机器学习基石(Machine Learning Foundations) 作业1 习题解答
  2. 关于电脑开机声音设置小技巧,记住这些就够了
  3. 浏览器触发reflow(回流)的操作
  4. iPhoto的删除动画
  5. 说说 Spring 支持的 AspectJ 切点函数
  6. 收货地址卡片源码分享
  7. Sandcastle Help File Builder
  8. 2017.7.3笔记总结 防浪涌设计
  9. 小米率先发布鸿蒙,华为鸿蒙开放,国产厂商集体失声?小米率先表态!
  10. win10如何开启远程桌面连接