在大数据这个词出现之前,我们对日常数据的这种处理和分析,常常使用的一些类似SQL server、MySQL、Oracle等等这些关系数据库,传统的这些数据库处理T级别数据量已经是这些数据库的极限,面对这种P级和E级的数据量,基本上是无能为力。

  一直到2005年,提供大数据基础能力的Hadoop项目出来,从技术层面上搭建了一个对非结构化和复杂数据快速可靠分析,变为现实的一个技术平台,从这个时候开始,大数据才成为互联网信息科技里高频的热词;

  2.什么是大数据,大数据有哪些特征

  不管我们是不是大数据的专业人士,在这个信息时代,我们都要了解一些大数据的概念,小到店家,大到国家都在讲大数据,不过真正搞清楚什么是大数据的人,还不是太多;

  对于大数据的概念,我们引用世界著名咨询公司麦肯锡对它的描述:

  大数据是什么?

  麦肯锡的定义:“一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有4V特征”

  4V是什么?

  Volume海量的规模;

  Velocity快速的流转

  Variety多样的类型

  Value低密度的价值

  二.怎样制定企业的大数据战略

  战略是我们工作的指导,一定有正确的战略才能做战术上的执行,战略错了,那么一切战术都是等于0,这里总结了大数据的6大战略;

  1.决策战略

  先了解所在企业的背景状况:比如企业是民企、国企还是上市公司,规模有多大,有多少员工,大数据仅仅是锦上添花还是已经具体的发挥了它的价值;在决策企业是否上大数据项目的时候,以及投入多少的问题上,这些问题都需要考虑清楚的;

  2.时机战略

  就是企业什么时候开始投入大数据建设

  3.人才战略

  4.选型战略

  是自建IDC数据中心、自建私有云,还是选择阿里云(腾讯云等等)共有云这个平台

  5.平台战略

  就是我们先选择搭建一个平台还是先实施一个应用的问题。

  一个原则:离钱越近,越要早做;

  6.管理战略

  关于数据是否可再生的问题:就是如何采集数据、如何存储数据、数据是怎样应用的,数据安全,用户隐私安全问题的保障;

  三.企业如何进行大数据平台建设

  无论从帮助企业营销还是提高效率来看,节约企业成本这个角度来看,大数据有非常大的价值,大数据做好了,可以推动企业的业务突飞猛进的增长;要实现这个大数据的价值,真正让大数据为企业创造贡献,那我们首先要积累有大数据,把日常业务和用户的行为数据收集起来,我们前面说过,有些数据是可再生资源,但更多的是不可再生资源,这就需要我们管理好我们的数据资产,去搭建一个数据平台,负责数据的采集,规整、运算、存储、应用、展现等等;

  1.大数据平台是由三个平台加一个服务组成的

  (1)工具平台,又包括

  -运维平台

  -数据采集平台

  (2)大数据仓库基础平台

  (3)大数据门户,又包括

  -大数据分析平台

  -产品应用平台

  (4)服务

  运维平台主要负责大数据平台的业务调度、任务监控、元数据管理、权限管理等等,主要由图中所示的系统组成的;二个是数据采集平台,主要负责把数据采集到大数据仓库平台当中,企业这种大数据来源,主要从三个方面去获取数据,从业务系统、日志采集系统、外部数据来源采集,每一个方面的来源又包含几个途径,如图所示;

  大数据基础平台,传统的也叫大数据仓库平台,这部分是整个大数据平台的核心;

  下面是大数据门户,是集成数据成果一体化的平台,包括大数据分析平台,和大数据应用平台;大数据门户,作为整个大数据的窗口,所有的数据研究成果,都会展现在这个数据门户当中,这样就极大的方便了公司职能人员使用数据;

  用户服务:使用数据的人主要包括管理人员、分析人员、运营人员、产品经理、技术工程师还有企业投资的相关方,或公司对外的数据服务,我们是通过API接口体现出来;

  2.如何构建大数据基础平台

  大数据基础平台,是整个大数据平台的核心,是企业大数据加工、计算、存储的场所,原本非常凌乱的各种各样来源的数据,进入基础平台之后,都会按照一定的标准,一定的规范化进行存储,处理起来,大数据基础平台有三个核心技术点,第一个是主题模型,第二个是层次模型,第三个是计算模型,下面会给大家一些简单的介绍;

  (1)主题模型

  主体模型详细附件图表

  主体模型设计的注意事项:

  大主题可以有若干的子主题构成

  主题之间不要有交叉,相同特征的要放在同一个主题当中;

  主体要充分的覆盖,能够覆盖到企业所有的业务,能够支持所有的应用和分析的需求

  (a)具备完整性

  (b)主体的独立性

  (c)具备层次性

  (2)层次模型

  层次模型通常由4个层次组成,如下图:

  (a)ODL层(操作数据层)

  功能是存放从业务系统之间抽取过来的数据,数据从数据结构,从数据这种逻辑关系上面,都与业务系统基本上是保持一致的,这里实现了透视字段一些固化的处理,像会员注册,注册时间,还有一些少量的基本的数据清洗,比如脏数据的一些过滤,维度的一些处理等等,最终生成了这种增量的数据

  (b)BDL层(基础数据层)

  该层的主要功能,是基于主题域的划分来完成数据整合的,提供统一的数据的基础平台,在这个层级当中,我们会完成数据的清洗、定义的分类等等的一些功能;

  (c)IDL层(接口数据层)

  面向应用的,统一的应用接口访问平台,客户统一视图都在这一层级实现,该层级的重点就在于实现跨主题域的这种数据的关联计算;在实践当中,会涉及两类模型,一类是为了获取数据更容易,我们会制造一些反规范化的主题模型,我们常常看到的这种宽表模型,另一类就是为了我们实现快速的查询,分析而建立起来的这种比较规范式的多维分析模型,它是由多个维表进行组成的;

  (d)ADL层(应用数据层)

  提供差异化的数据服务,以满足业务方的需求,这一层级我们可以实现一些报表,数据挖掘、产品应用等等需求;

  在传统的数据库时代,ADL层主要在RAC(ORACLE真正应用集群)中实现的,在大数据时代里,我们通常会用hbase这一层的数据的存储;

  我们在工作中,为了降低维度大数据平台的负责度,我们通常把4层压缩到3层,我们通常把ODL层和BDL层进行合并,原来分别在这两层当中实现的一些事情,我们合并到一层里面去实现;如下图所示:

  3.如何构建大数据门户

  企业大数据门户,是企业应用的集成一体化的平台,大数据门户,作为企业服务的窗口,除了数据研究成果外,都会展现在大数据门户中,从而极大的方便了我们企业个只能人员使用、利用这个数据;

  企业大数据门户包含:

  主要由精准营销、个性化推荐等等

  负责业务数据的可视化展现,智能报表,临时取数的分析,还有多维数据分析的一些模型,比如用户画像、业务关键指标监控,还有数据挖掘模型的一些监控等等。

面对国内众多的云平台,个人和企业该如何选择呢?可以参考这篇文档:【云服务器推荐】2021年腾讯云、阿里云、华为云服务器价格和配置评测

企业该怎么建立大数据平台?相关推荐

  1. 我国将建统一的企业信息公示大数据平台 年底上线

    我国将建统一的企业信息公示大数据平台 年底上线 责任编辑:editor006 作者:王嫚 |  2016-09-22 19:14:50 本文摘自:人民网 以后,备受老百姓关注的"执行难&qu ...

  2. 推广北斗导航建立大数据平台

    9月22日下午,"基于北斗导航技术的物流运输智能感知与位置服务系统"项目座谈会召开,太原市委副书记.市长耿彦波,副市长王建生,项目组专家评委夏青,市有关部门及中石油太原公司负责人参 ...

  3. 从0到N建立高性价比的大数据平台

    声明:本文为作者在CSDN技术公开课的分享原创整理,未经许可,禁止转载. 作者:郭炜,易观CTO,毕业于北京大学,曾任联想大数据总监.万达电商数据部总经理,曾在中金.IBM.Teradata公司担任大 ...

  4. 大数据平台不是救世主!做好数字化转型,得先解决这一问题

    企业数据管理团队最大的一个挑战就是跨部门数据的整合,因为部门墙到处都是. 对于大多数企业,需要先破后立,通过大数据平台项目的形式进行跨部门的数据采集和整合.因为在项目阶段,公司领导一般比较关注,而规划 ...

  5. 自拍会不会被大数据_不会搭建大数据平台,我被老板优化了...

    [51CTO.com原创稿件]随着业务的飞速发展,信息化作为业务的支撑,各个企业都建立了自己的信息化系统. 图片来自 Pexels 在业务增涨过程中,每个企业不知不觉积累积累了一些数据.无论数据是多是 ...

  6. 如何建立大数据营销体系

    企业开展大数据营销系统,一般包括数据标准.基础数据.数据质量.周期管理.数据安全和数据资产六个部分,各部分的内容需要投入精力才能完成,在管理层面,需要通过数据治理组织和数据治理流程进行支撑和保障. 那 ...

  7. 大数据平台安全建设方案分享

    随着国家提出大数据促进经济社会转型发展的战略思路,大数据平台建设目前已经是政务信息化建设中的焦点内容,各省级政府依托强大的信息化体系率先做出尝试.大数据平台业务系统搭建之初,作为整个平台稳定.持续运行 ...

  8. 大数据平台框架、组件以及处理流程详解

    数据产品和数据密不可分作为数据产品经理理解数据从产生.存储到应用的整个流程,以及大数据建设需要采用的技术框架Hadoop是必备的知识清单,以此在搭建数据产品时能够从全局的视角理解从数据到产品化的价值. ...

  9. InfoQ《大咖说》:大数据平台如何进行云原生改造 | 内附视频回放

    * 关注公众号,后台回复关键词[大咖],获取视频直播回放. 策划 | 褚杏娟 来源 | InfoQ InfoQ<大咖说>本期嘉宾:智领云联合创始人兼CEO 彭锋博士,拥有20余年软件开发, ...

最新文章

  1. ikbc键盘自动打字_键盘按斤卖,一斤一百块?IKBC W200机械键盘简晒
  2. 第 16 章 MySQL Cluster
  3. hibernate添加spring 事务管理注意问题记录
  4. 学计算机的你伤不起啊(转)
  5. uip UDPclient模式通信移植,当地port随机
  6. 天气预测频繁2项集_986天气| 今年冬天比往年更冷?官方回应来了
  7. Sparta(斯巴达)——信息收集扫描爆破集成
  8. 编码规范-html.md
  9. 中国基座污水泵市场趋势报告、技术动态创新及市场预测
  10. Civil 3D CustomDraw .NET混合项目设置
  11. 详解 MySQL 基准测试和 sysbench 工具
  12. c语言中输入大数,如何使用C语言实现输入10个数按从大到小的顺序排序输出
  13. JavaScript常见设计模式梳理
  14. 如何打造自动驾驶的数据闭环
  15. Python学习手册~笔记1
  16. 无盘服务器易乐游,网维大师、易乐游无盘万兆性能评测
  17. 中国 / 省市区县 / 四级联动 / 地址选择器(京东商城地址选择)
  18. mysql 数据库 back_log 参数
  19. 每日辣评:快手和抖音、爱奇艺巨亏、搜狗输入法变声功能、贝佐斯
  20. GPU显卡环境配置安装

热门文章

  1. CSDN如何转载他人文章
  2. java for循环 条件_Java for循环(十三)
  3. 【计算机视觉实验五】图像检索与识别
  4. Unity——责任链模式(土味情话传递)
  5. vrrp协议和master路由器
  6. Hello Qt(十)——QT输入组件
  7. steam游戏在线人数统计周报第9期-2019年12月23日
  8. 页面布局基础——2.3
  9. cmd设置总是置顶_怎么将想要的窗口一直置顶 原来只要这简单的一步
  10. python中import as的浅显理解