机器学习可以说是高级分析的典型代表。机器学习领域汇集了众多技术,这些技术用于让计算机基于大量数据来学习数据的倾向并作出某些判断。机器学习的算法可以根据输入的数据类型分为“监督学习”和“非监督学习”两种。

监督学习和非监督学习

当用机器学习的算法让计算机学习数据倾向时,算法会根据用于学习的数据中是否含有“正确答案”的数据而有所不同。打个比方,假设现在要从传感器数据来判断分析设备的故障情况和建筑物的损坏情况等异常状况。如果采用监督学习的算法,就需要输入过去实际发生异常状况时的数据,即需要明确地输入“异常”的数据。说白了,算法要学习“正确答案”和“不正确答案”之间存在的差异。
相对而言,非监督学习不区分输入的数据是否存在异常,也就是说,非监督学习算法会学习数据整体的倾向,在整体中找出倾向不同的数据,将其判断为“异常值”。

对于想要还原场景的情况,需要基于是否有当时的数据这一点来判断是采用监督学习还是非监督学习。特别是对于那些极少发生的异常情况,如果不能准备正确答案,就需要考虑采用非监督学习。另外,如果无法预测以后会发生什么异常状况,那么使用非监督学习来建立平常状态的模型,就能检测出和平常状态不同的状态(即异常)。

如果确定了想要发现的异常的种类,也采集到了足够的数据,那么采用监督学习会更加精确地检测出异常情况。

分析方法的种类

那么在理解了监督学习和非监督学习的基础上,接下来就以聚类和类别分类等为切入点来了解一下这些分析方法。根据其用法,分析方法可以分为几种。其中,图所示的3 种方法的使用频率特别高,接下来将详细讲解这3 种方法。

聚类分析

聚类分析,其目的是基于样本(样本数据)具有的特征,把相似的样本分成多个组(聚类)。具体的聚类算法包括K-means 算法、自组织映射、层次聚类等。这些方法能够根据数据的特征找到并整合具有同样特征的数据。

K-means 算法就是针对数据的分布来事先指定要把数据分成多少个块,即分成多少个聚类,由此来机械性地生成数据块的一种算法。

类别分类

类别分类分析的目的在于把数据分成两组或者更多组。虽然有人可能会感觉它跟聚类分析很相似,但类别分析用在已经明确想好了要分类的对象,基于过去的数据来分出对象组和非对象组的场合。类别分类算法包括线性判别式分析、决策树分析、支持向量机(SVM)等。特别是支持向量机还被用于图像识别算法,即识别某张图像上都拍摄了什么内容。

维度压缩

维度压缩也叫“维度约简”或“降维”,即对于大型数据中的大量数据,尽全力留下其中的重要信息并压缩冗余的信息,借此来缩小数据量的分析方法。维度压缩包括主成分分析、因子分析、多维尺度法等。很多时候设备发来的传感器信息太多,或是要分析从无数台设备发来的海量信息时,还会出现很多不需要的信息,即对于获取结果来说没有什么用的信息。此时,通过进行维度压缩,就能切去不需要的信息,把数据转化成一种更易于分析的形式。

【物联网】30.物联网数据分析的基础 - 机器学习相关推荐

  1. 深度解析物联网和大数据分析的渊源和应用

    最近很多人跟我讨论物联网和大数据,但他们大都还对这两个技术分类认识不是很清晰.在这里我结合我们的一些案例对这两个概念做一些阐述. 物联网是一个完整的概念,不仅包括远端的传感器数据采集.传输.存储和展示 ...

  2. 关于物联网进入元宇宙时代的基础与发展思考

    关于物联网进入元宇宙时代的基础与发展思考 李正海 对于元宇宙的发展可以理解成元宇宙首先是新兴理念,对这个理念的分析.解读.展示就可以吸引关注,一起受众关注,那么对于企业而言,就可以产生流量,促进销售. ...

  3. 30天数据分析与机器学习实践之Day16——Python文本数据分析:新闻分类任务

    30天数据分析与机器学习实践之Day16--Python文本数据分析:新闻分类任务 一.文本分析与关键词提取 1.1文本数据 1.2停用词 1.语料中大量出现2.没啥大用3.留着过年嘛? 1.3Tf- ...

  4. 零基础机器学习(1)- 我们为什么要学习Python?

    好,今天这篇文章我们来讲讲我们为什么要学习Python,是的,我们是要学机器学习,所以我们要学习Python,因为机器学习是Python语言大火的重要原因之一,以后我们学习机器学习的时候也都是用Pyt ...

  5. 视频教程-用Java从零开始开发一个物联网项目-物联网技术

    用Java从零开始开发一个物联网项目 多年的产品设计和开发经验,带领团队完成多个知名产品.历任多家大型公司的Java架构师,对知名框架的源码均有深入研究.拥有IT一线开发.教学10多年的实战经验,能充 ...

  6. 【物联网】物联网时代25大开源IoT框架(一)

    [声明] 原来来自千锋教育微信公众号. 戳下方图片,搜索[物联网]即可获取为你准备的超多物联网实战项目.相当长一段时间以来,互联网一直被用来连接人类并简化生活,这是21世纪初的启示.今天,我们将讨论各 ...

  7. Numpy:高性能科学计算和数据分析的基础包

    Numpy:高性能科学计算和数据分析的基础包 概述 基础数据类型:ndarray数组 为什么引入ndarray数组 案例1:实现a+1的计算 案例2:实现c=a+b的计算 创建ndarray数组 查看 ...

  8. 计算机网络物联网论文,物联网技术及其应用_计算机网络论文.doc

    物联网技术及其应用_计算机网络论文 物联网技术及其应用_计算机网络论文 论文关键字:EPC RFID Savant ONS 物联网技术 论文摘要:至上个世纪90年代物联网概念出现以来,越来越的人们对其 ...

  9. tableau 集动作_Tableau训练营:7天,每天30分钟,零基础get数据可视化基本姿势

    原标题:Tableau训练营:7天,每天30分钟,零基础get数据可视化基本姿势 Tableau是啥?为什么要学? 「 强大的工具通常有一个共性,就是一旦你掌握了它,带给你的回报远远超过你当时付出的时 ...

最新文章

  1. java jar 打印_Java 打印流 及 commons-io.jar包方法
  2. Python---编写一函数,将摄氏温度与华氏温度互转。
  3. wifi模块 服务器通讯协议,模块之间通信协议
  4. 使用SAP iRPA创建一个最简单的hello world项目并部署到SAP云平台上
  5. gram矩阵_Skip-gram
  6. 一款不错的SpringCloud 脚手架项目
  7. Python的多进程锁的使用
  8. android真实项目教程(一)——App应用框架搭建_by_CJJ
  9. zabbix 监控mysql模板_Zabbix监控MYSQL模板-阿里云开发者社区
  10. gcc/g++ 如何支持c11/c++11标准编译
  11. numberformat java_【Java】java.text.NumberFormat 工具类
  12. vbs代码未结束的字符串常量
  13. uni-app:搜索关键词并高亮显示,可重复显示
  14. 2022计算机二级全套资料:视频+练习软件+真题资料
  15. 2021年中国棘轮手柄市场趋势报告、技术动态创新及2027年市场预测
  16. ES启动异常:the default discovery settings are unsuitable for production use; at least...
  17. Json和Json解析
  18. Linux查看隐藏进程pid脚本
  19. 无法从计算机验证正在安装驱动,intel CPU集显驱动失败,无法为此计算机验证正在安装的驱动程序...
  20. 提问:影视剪辑解说都是怎样配音的,软件合成还是自己配音?

热门文章

  1. python取出字典中最大值_python 比较字典value的最大值的几种方法
  2. 计算广告笔记06-程序化交易广告
  3. 京津冀协同创新与高等教育(上)
  4. 如何给嵌入式Linux打实时补丁?
  5. gdsdxy.cn index.php,【北京教师网加盟联盟】实时更新,已有9所院校自主招生成绩可查...
  6. [JetBrains注册] 利用教育邮箱注册JetBrains产品(pycharm、idea等)的方法
  7. tensorflow如何做幂律分布_离散概率分布与连续概率分布
  8. i.MX6ULL快速上手 | 01 - i.MX6ULL Alpha开发板快速上手
  9. Java大数据去重,返回第一个重复的数据,统计每个数据出现的次数
  10. 综述 | 基于脑电图信号的情感识别研究