数据沉淀、数据挖掘和数据可视化

  • 数据沉淀
  • 数据挖掘
  • 数据呈现

此文 摘自 多智时代
对于数据业务,按照我们的理解,简单将其分为三块:数据沉淀、挖掘和可视化,每一块分别对应不同的模式及产品或服务。(数据挖掘业务又被细分为分析、理解及存储。)下面会进行简单介绍,其实从我们的业务也可以看到一些整个行业的大致状况。

数据沉淀

用大白话说就是数据抓取。目前有四大方式获取数据 :
1. 网络爬虫
用Python及Go等开发自己的爬虫平台,对几十个网站进行每日抓取获得相关信息 (详见: 能利用爬虫技术做到哪些很酷很有趣很有用的事情? - 何明科的回答 )
2. Wi-Fi接入方案
比如我们自己就开发了一套完整的软硬件方案,优势是高ROI(投资回报比),且免费提供给物业管理者,帮助其实现靠网费赚钱以及推广费赚钱。在与其协商的基础上,获得用户数据。这主要是OpenWRT的开发以及一些智能硬件和客户端的开发。
3. 提供一些图像方面的API,进行图片搜索及人脸搜索,满足客户在图像处理和图像识别方面的一些需求,同时获取相关的图像数据。涉及到一些Machine Learning和Deep Learning的算法,使用C++/Open CV/Matlab等工具或模块。
4. 数据服务需求方自行提供。
这部分是按照数据销售的方式向客户收费。

数据挖掘

用大白话说,就是利用数据分析产生深层次有价值的理解。
基于以上各种方式获得的数据,我们可以做最简单的统计分析、用户及品牌理解、用户画像、各品牌或各产品型号之间的关系等等,了解现在和历史并争取预测未来。
常用的工具是Python/R/SPSS等,算法包括最简单的统计、稍微复杂一些的Machine Learning、现在被捧上天的Deep Learning以及Collaborative Filtering等等,也需要使用到Hive等大数据处理平台。 这部分类似于咨询服务,向有需求的客户按照项目收费。

数据呈现

用大白话说,就是把分析结果用最美观和最容易理解的方式(图标或者图形)展现出来。
目前,行业大概有几种玩法。
网站(兼容PC端和移动端):提供给付费的B端客户,不对外公开,大致形式如下:
提供一个SaaS的公有云平台,方便大家把自己的数据制作成为便于在网上特别是移动端传播的图文报表。[大数据魔方]产品的逻辑很简单:读数读图的需求越来越强烈,但是却缺乏这样的工具或者平台来制作图文并茂的内容,即使是Excel,也不能制作出适合于网络传播的图文内容。常使用的技术是JS+Node.JS+MongoDB等等。

大数据业务:数据沉淀、数据挖掘和数据可视化相关推荐

  1. 如何搭建属于 “数据业务”的指标体系?

    转自公众号一个数据人的自留地 临近年末,上到集团总部,下到每个员工,都开始做年度工作总结和项目复盘:这其中,对齐KPI指标的.量化的成果和价值,必然是工作总结中的核心亮点. 作为数据人,在支持业务部门 ...

  2. 01_数据业务化与业务数据化

    文章目录 数据.信息.知识 业务数据化 数据业务化 数字化转型挑战 数据.信息.知识 在现实世界中:2000,175- 这些都称为数据,而数据离开了单位和上下文是没有意义的.而数据 + 数据描述我们才 ...

  3. Android7.0 数据业务长连接拨号过程

    前面我们已经分析了android在进行数据业务拨号前,进行相关准备工作的流程,现在我们可以分析一下整个数据业务长连接拨号在框架部分的流程. 长连接的"长",是相对于终端进行彩信发送 ...

  4. 2021年大数据基础(四):​​​​​​​​​​​​​​​​​​​​​大数据业务分析基本步骤

    2021大数据领域优质创作博客,带你从入门到精通,该博客每天更新,逐渐完善大数据各个知识体系的文章,帮助大家更高效学习. 有对大数据感兴趣的可以关注微信公众号:三帮大数据 目录 大数据业务分析基本步骤 ...

  5. 大数据之有指导数据挖掘方法的模型

    转载自:http://www.itongji.cn/article/092S5Z2014.html 数据挖掘的目的,就是从数据中找到更多的优质用户. 什么是有指导的数据挖掘方法模型,以及数据挖掘如何构 ...

  6. 讨论▍数据分析师(非数据挖掘,偏业务)是青春饭吗?

    关于数据分析十万个为什么问题 从事数据分析是否需要终身不断学习? 国内普遍情况加班是否严重? 数据分析师(非数据挖掘,偏业务)是青春饭吗? 回答answer 先拆解问题. 数据分析师(非数据挖掘,偏业 ...

  7. Thinking in BigData(五)大数据之统计学与数据挖掘

    今天回来,在原来的文章中,添加了一些数据挖掘方面的概念. 上篇博客,我们从"大","价值"两点来揭示大数据主要源于哪些企业和在哪些企业应用更广泛.在最后,我么指 ...

  8. 直击大数据业务痛点:浪潮整合优势推出云海大数据一体机

    互联网的发展给人们生活品质带来极大的提升.更便捷的购物,更便捷的交通,更安全的出行,更丰富的教育资源等等.我们应该思考一下,互联网带给了我们这些便利.但是事物是两面性的,当我们在应用这些便捷生活方式的 ...

  9. 网站|数据分析、大数据、数据挖掘或者数据分析学习相关的网站

    1.公开的数据集 做数据分析和数据挖掘,最基础的就是数据集了,这里分享一些科研机构.企业.政府会开放的一些数据集.这些数据集通常比较完善.质量相对较高.给大家推荐一些常用的可以获取数据集的网站: UC ...

最新文章

  1. 终端主题_再见 XShell 和 ITerm 2,是时候拥抱全平台高颜值终端工具 Hyper 了!
  2. boost::mpl模块实现print相关的测试程序
  3. DeepMind刚向星际争霸 II 的玩家们下了战书!你的对手可能是只AI,而你毫不知情...
  4. Codeup墓地-问题 A: 算法7-15:迪杰斯特拉最短路径算法
  5. Qt文档阅读笔记-Qt Concurrent介绍及简单使用
  6. 蓝桥杯:试题 历届真题 修改数组【第十届】【省赛】【研究生组】Java实现
  7. 亚马逊在德国新设AI研发中心,与马克思普朗克系统研究所亲密合作
  8. 计算机丢失faultrep.dll,faultrep.dll
  9. Quartz的时间配置
  10. mybatis的多AND条件查询。批量插入。String分割查询。
  11. Diamond软件的使用(5)--建立Modelsim仿真环境
  12. 如何看待360与腾讯之争
  13. [网易编程题] 涂棋盘
  14. java代码实现打气球游戏_javascript+css3开发打气球小游戏完整代码
  15. 生活随记 - 清明时节特想老爸老妈
  16. JGG:肠道菌群与COVID-19重症风险密切关联
  17. 支付宝扫五福,你扫了吗
  18. 正态性/方差齐性检验及stata实现
  19. 20岁后长高增高秘诀
  20. guid分区怎么装win7_如何在GUID分区装win7系统并以UEFI启动?

热门文章

  1. 快速傅里叶变换 及MATLAB函数
  2. While My Guitar Gently Weeps合奏
  3. Centos安装XSS平台
  4. 儿童编程scratch
  5. PS 学习笔记 08-矩形工具组
  6. 洞察与思考Fuzzing技术发展趋势
  7. DASCTF Apr.2023 Crypto 全解
  8. OTFT-2:有效迁移率的计算
  9. oracle runc n m,19cRAC增删节点
  10. New Audio Codec (4) : Daryl Ning 的 Warped LPC and Wavelet Audio Coding 方案