文/范昭赋 华为弹性计算云Marketing部主任工程师

大数据时代来了

有人说现在是个信息大爆炸的时代,其实用“爆炸”来形容当今信息时代的特征是不确切的,“爆炸”不仅意味着多(多的容器装不下了),还意味着无法控制和毁灭。我们当然不能让信息“爆炸”,而要为我们所用,化危机为财富。

信息的载体是数据,新摩尔定律表明,每18个月所产生的数据相当于有史以来产生的数据的总和,也就是说每一年半,数据就翻番。移动互联网、物联网等成为海量数据的催化剂,传统的数据处理技术已渐渐对海量数据无能为力,如果不想让海量暴增的数据失控,我们就需要对其进行“治理”,治理包括管理、开发、利用,要从大数据中挖掘出有价值的东西,为人类创造更多的智慧,这就是所谓的“大数据技术”,其核心就是要让大数据“慧”说话(说出有智慧的话)。

大数据技术是一个笼统的概念,它包括了海量数据的分布式存储技术、面向海量数据查询和分析的并行计算技术、各种海量数据的挖掘算法、行业海量数据建模、各种使得大数据价值变现的应用,以及承载海量数据的硬件基础设施等。大数据技术构成了一个完整的信息生态链,将各行各业更紧密地联系起来,“开放”、“融合”、“创新”成为大数据时代出现频率最高的词汇。

如今,大数据技术已经在各行各业开始应用,特别是大型互联网公司、运营商以及政府和金融等行业。相信5~10年内大数据技术的应用会全面铺开,充斥到社会的每一个角落,并且成为未来IT的基础架构。因此,确切地说,我们这个时代不是信息“爆炸”的时代,而是一个“大数据时代”!

运营商要向IT和互联网转型,金融机构、政府组织也要向IT和互联网转型,全球最大的通信设备提供商——华为公司也在向IT和互联网转型。实际上,将来的每一个企业首先都是一个互联网企业。用马云的话说,企业在大数据时代和技术变革之前,必须要掌握对于未来的研判,重塑自己的文化基因和组织架构,必须“有所为有所不为”,去做一个社会化的企业。我的解读就是企业要找准自己在大数据生态链上的位置,大数据技术必将把全社会各行业组织成一个有机的整体,任何企业都不能独立于这个肌体之外。

FusionInsight:完全开放的大数据平台

在大数据领域,华为公司当然不会袖手旁观。为社会创造价值、丰富人们的沟通和生活、成就客户是华为人的使命。从2009年开始,华为在大数据领域投入了大量的资金和人力进行研发,2011年,华为大数据解决方案横空出世,最初命名为Galax HD,2013年改名为FusionInsight Hadoop。到目前为止,FusionInsight已在全球拓展了100多个大数据项目,有40多个项目已经在交付,其中10多个已经在商用。客户主要分布在电信、金融、科研、公安和政府等行业。

FusionInsight是企业级大数据存储、查询、分析的统一平台,为企业快速构建海量数据信息处理系统,通过对各类海量数据信息实时和非实时的分析和挖掘,帮助企业从海量数据信息中获取到真正的价值,及时洞察和决策新的机会与风险。

FusionInsight是完全开放的大数据平台,可运行在任意标准的x86服务器上,无需任何专用的硬件或存储,并针对金融、运营商等数据密集型行业的运行维护、应用开发等需求打造了高可靠、高安全、易使用的运行维护系统和全量数据建模中间件,让企业可以更快、更准、更稳地从各类繁杂无序的海量数据中发现价值。

Google虽然是大数据技术的鼻祖,但Apache Hadoop开源社区却是最有影响力的开源大数据技术的孵化器,大数据要走向开放、融合,开源是必然的趋势。华为将大数据明确为ICT融合时代公司的战略方向并加大投入,在美国以及中国香港、深圳、北京、西安汇集了各路大数据专家,持续回馈并引领Apache Hadoop开源社区,对Apache Hadoop社区的贡献在所有IT设备商中排名第一,持续推动社区的开放与发展。

华为FusionInsight团队具备强大的本地化工程服务能力,不仅可以帮助客户定位大数据内核级问题,还针对行业应用开发了数据服务和能力开放使能环境,兼容客户原有开发和使用环境,让大数据更易使用并产生价值。FusionInsightHadoop发行版紧随开源社区的最新技术,快速集成最新组件,并在可靠性、安全性、管理性方面进行了企业级的增强和持续改进,始终保持技术领先。而且FusionInsight Hadoop保持了100%的开放性,决不使用私有架构和组件。

FusionInsight Hadoop的企业级增强

FusionInsight Hadoop的企业级增强主要表现在以下几个方面:

● 高可靠性

FusionInsight Hadoop所有管理节点组件均实现HA;HBase集群实现1000公里以上的异地灾备;表级集群备份、全量、增量、日志追赶、数据恢复(对本地存储的业务数据进行完整性校验,在发现数据遭破坏或丢失时进行自恢复)。

● 高安全性

FusionInsight Hadoop实现了基于用户和角色的统一认证体系,实现对角色进行权限管理和审计,WEBUI服务还支持单点登录认证。对HBase的权限控制支持HBase库、表、列族和列等不同级别。Hive还支持合法用户之间的数据安全隔离,保障用户数据安全;支持合法用户之间的授权访问,允许用户数据交叉访问。

FusionInsight还可以对文件系统进行加密,Hive、HBase可以对表、字段加密,集群内部用户信息禁止明文存储。加密算法插件化,可进行扩充,亦可自行开发,并且加解密过程业务完全不感知。

高安全性还体现在对操作系统的安全加固,通过裁剪不必要组件,工具自动测试扫描,在业务节点、管理节点和用户管理Portal等组件采取业界标准来实现操作系统加固,保证基础设施的安全性。

● 高性能

针对数据密集型行业传统数据库、数据仓库的大量关联表设计,创新地实现了CTBase方案。CTBase可以将多个具有类似功能或存在关联的业务表聚簇到一个HBase大表中,可提升一些关键场景的多表关联查询性能。另外,CTBase还提供了二级索引,RowKey Schema的维护管理等关键能力。同时,CTBase对HBase原生态API进行了封装,提供更友好的二次开发界面。

FusionInsight Manager(FusionInsight运行维护中心)支持系统双机和分布式并行处理,可10分钟完成集群安装;全自动化在线运行维护、自定义Dashboard、自动化的应用开发助手,让企业可以轻松地管理大数据系统;提供向导式升级、回退的界面操作,当升级过程异常时,支持自动安全回退,也支持观察期手工触发安全回退,可以在6分钟内完成Hadoop集群升级。

FusionInsight Hadoop还提供了北向接口,实现与企业现有网管系统集成;当前支持syslog接口,接口消息可通过配置适配现有系统;整个Hadoop集群采用统一的集中管理,未来北向接口可根据需求灵活扩展。

● 解决方案配套能力

为让开发者更方便地使用大数据技术,在开源Hadoop平台基础上,华为FusionInsight Hadoop围绕数据的采集、分析和消费,在典型场景如数据中心运维日志分析、历史数据查询、实时事件处理、客户特征画像等形成了系列解决方案,并跟随客户业务的发展不断丰富。

FusionInsight总体架构图

绽放智慧的光彩

华为FusionInsight大数据平台可以为电信、金融、政府等行业大型企事业单位量身定制企业级的大数据解决方案,本着让数据“慧”说话的目标,对企业数据全量建模、深度分析、深刻洞察,为企业的精准营销、实时决策、客户维系、数据开放等各种应用场景提供全面的技术保障。

用任正非总裁的话讲,大数据时代也是大机会时代,但是华为不可以机会主义,华为人总是本着求实创新的精神,不惜10年磨一剑。经过华为人的努力,FusionInsight必将成为大数据领域的一颗耀眼明珠,在茫茫的数据海洋中,绽放属于它的智慧的光彩。

(更多华为资讯请关注华为开发者社区,华为自己的对外开放门户:http://developer.huawei.com/cn/ict/ ,不要问我叫啥,别人都叫我雷锋

FusionInsight,让数据“慧”说话相关推荐

  1. 华为云数据治理生产线DataArts,让“数据‘慧’说话”

    摘要:数据治理生产线DataArts改变了传统"人拉肩抗"的数据处理方式,帮助提升效率:降低技术门槛,让"人人都是分析师":让"数据'慧'说话&quo ...

  2. 华为云大数据轻量级解决方案,让数据“慧”说话

    企业要想实现数字化的转型和升级,就必须解决数据技术.人才引进困难和资金不足的问题.在此情况下,企业必然需要一个通用的系统来集中管理企业的数据.如果你作为该类企业的管理决策者,那你一定要趁此活动期间引进 ...

  3. 大数据会说话也“慧”说话

    在"墨迹天气"APP上,每天有超过5亿次的天气查询需求,这个数字甚至要大于推特(Twitter)每天的发帖量.这些数据资源给墨迹带来了价值,其运营团队每天最关心的是APP背后的数据 ...

  4. UC伯克利黑科技:用语音数据预测说话人手势

    点击我爱计算机视觉标星,更快获取CVML新技术 昨天CVPR 论文终于提供下载: 重磅!CVPR 2019 论文终于全面开放下载!附百度云链接 看到一篇CVPR 2019 论文<Learning ...

  5. 华为云FusionInsight智能数据湖版本新能力解读

    9月23日至25日,华为全联接2021以"深耕数字化"为主题,各行业领军人物分享最新成果与实践.其中在"华为云FusionInsight智能数据湖打造千行百业数据底座&q ...

  6. 从甜心教主“炸”活中年男粉看企业如何让“沉睡数据醒来说话”?

    "你一票,我一票,心凌80还唱跳."随着综艺某综艺的正式开播,如今已年近40的"甜心教主"用一首<爱你>,不仅让自己翻红,也让无数网友大声呼喊着&q ...

  7. 案例:华为FusionInsight 大数据平台集成 atlas1.0.0 ,环境Centos7

    本案例在使用了编译好的atlas 版本号1.0.0 ,本文重在讲解如何集成:编译atlas,可以在其他博客中找一下 1.华为FusionInsight 大数据平台 自带的solr版本和atlas版本( ...

  8. 数据用压缩 bcd 码 java_IT职场新人选python,go还是java?用数据来说话

    最近有读者在后台问,刚参加工作,想选一个职业方法,问我现在python很火,但是貌似就业机会不是很多,所以比较纠结现在到底是学python,go还是java. 所以我就想我们能不能用数据说话,看看py ...

  9. 华为的FusionInsight智能数据生态地图

    参考文档:https://fusioninsight.github.io/ecosystem/zh-hans/ FusionInsight支持开源标准的Hadoop接口,可以与以下第三方工具进行对接. ...

最新文章

  1. java中定义score方法_elasticsearch 自定义 script score JavaAPI查询详解
  2. 从一道常见习题的自然延伸谈起
  3. python如何读取excel数据-使用Python读取电子表格中的数据
  4. Android之解决ScrollView包裹了两个RecyclerView导致滑动冲突问题
  5. 有效的云安全态势始于三个步骤
  6. Ubuntu14.04安装ROS
  7. 有关计算机编程论文,有关计算机程序的论文范文
  8. [置顶] java高级工程师-----struts的内部运行机制详解
  9. 文字在div中的垂直居中问题 div在页面中的水平垂直居中问题 vertical-align ??????
  10. JDK1.8中文帮助文档下载
  11. 邻接矩阵的COO格式
  12. 点餐系统源码|点餐系统小程序源码
  13. 使用Python写一个简单的服务器
  14. docker部署homeassistant
  15. java获取ip地址 方法_java获取IP地址的方法
  16. MBTI职业倾向测验
  17. mysql 筛选重复项(单列或者多列同时重复)
  18. C#实现串口通信的上位机开发
  19. Java标准I/O流介绍
  20. KubeSphere 社区双周报 | 2022-07-22

热门文章

  1. 1xb等于多少bit?
  2. GYM 101086 A.My Friend of Misery(水~)
  3. 【Netty】原理分析:ChannelHandlerContext
  4. 如何分析软件测试结果,软件测试结果对比
  5. Mysql 关于月份
  6. medoo update mysql,medoo的增删改功能
  7. 语音识别中的傅里叶变化
  8. 世界坐标系、相机坐标系、图像坐标系、像素坐标系都是什么?
  9. TFN 品牌熔接机怎么样?TFN FT-7做干线又有哪些优势
  10. 电池充电那些事之电池放电至低压保护时无法充电的问题