今天的重复数据删除技术在EMC以总价21亿美元收购Data Domain之后,骤然达到了最顶点。这也符合业界对以DeDUPlication发家的Data Domain公司股票代码的定义:DDUP——“Day Day UP”,天天向上。这个说法多少来源自其三位创始人之一的李凯,其正牌身份是普林斯顿大学计算机学院教授,在海外学人圈里,他被推崇为华人北美第一人。
<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />
早在2005年8月,记者采访来到北京的李凯时,他还是成立仅仅四年时间的Data Domain公司的首席技术官。就在那时,记者比较系统的了解到了Data Domain口中的“容量优化磁盘恢复设备”,也就是今天市场上热门的重复数据删除产品。当时隔四年之后,李凯又一次与媒体会面,职位变为了首席科学家,但Data Domain已经成为EMC大家庭的一员。特意强调其与媒体会面是因为,作为清华大学以及中科院计算所的访问教授,他基本每年都会回来一次,以帮助国内相关科研机构就大型机、超大型计算机的系统架构设计。他开创了共享虚拟内存领域(DSM,分布式共享内存),他的研究领域包括分布式和并行系统,曙光的超级计算机就有其一直参与。
 

Data Domain首席科学家兼创始人李凯
李凯被海外学人推崇的除了技术水平之外,还有其敏锐的商业头脑。在接受媒体采访时,他就表示,最开始创立DataDomain的时候,他们并不是和其他学校里面的教授那样,想把实验室里的实验品产品化,等技术成熟了在做产品。而是先做市场调查,了解市场缺少什么,才去做什么,以市场的需求为最优先考虑。这恐怕也是DataDomain的产品一直被市场推崇,以至今天被EMC收购的最主要原因。
Data Domain公司2003年首次推出重复数据删除NAS、2004年推出重复数据删除卷复制、2005年推出重复数据删除网关、2006年推出重复数据删除虚拟磁带库(VTL)、2007年推出重复数据删除指向复制……而在市场方面,Data Domain发展之快也令人称道:目前已在24个国家设有办事处、3个研发中心、超过2100家企业级用户、连续多个季度实现超高速增长、2007年6月在纳斯达克成功上市、2009年更是被EMC以24亿美金收入囊中。
能在成立不到十年时间,就完成从公司成立到纳斯达克上市到被高价收购,究竟靠的是什么?重复数据删除技术肯定是其中之一,但更深层次方面是:自从2000年以后,信息爆炸的趋势日渐显著,企业数据量快速增长、数据类型增多。数据量飞速增长促使企业花费在存储容量的成本上升,企业迫切需要降低数据存储的成本,企业的这种需求无形中给重复数据删除形成了一个隐性、未开拓的市场。而李凯在公司成立之初正是看到了这个隐性的市场,并抓住机会率先推出了重复数据删除产品,从而满足了市场的迫切需求,这才有了今日犹如时势造英雄般的成功。
对于重复数据删除技术的未来发展,李凯抱有极大的信心。在他看来,到今天磁带还没有被完全取代的主要原因,一是因为任何产品的消亡都会有一个时间周期,二则是其他产品的速度不够快。正是因为大多数产品的性能不足以完全替代磁带,用户完全可以接受的性能以及高可靠性才是用户最终舍弃磁带选择新产品的重要因素。所以,DataDomain的产品是在不停的做校验,写进去马上读出来校验,之后每天每星期都在校验,李凯认为磁带库不能够校验,可靠性的量级是不一样的。
备份数据里面存在大量的重复部分,很多人把数据比作游泳池加水:每天加的水并不多,但是整个的游泳池很大。如果每天备份的话,每次都备份一个游泳池就太不合算了,应该是备份每天加的那些水,这就是我们常会提到的增量备份与全备份。具体到实际操作,因为数据并非简单的添加,而是对很多原有的数据进行修改,所以也并不是备份增量那么简单。
另外一个难点,就是对磁盘上面的海量数据进行操作的时候,如何才能高效的寻找到数据,并对数据进行有效操作。在计算机体系结构里面,存储层次从CPU的cache到内存,再到硬盘,每个层次的存取速度,都是上面一个层次的千分之一,如何利用有限的内存来处理海量的低速硬盘,里面有很多的技巧。这里面的技术,很多都是目前文件系统和数据库使用的技巧,但是技巧如何合理组合,就是一个技术公司成功的秘密之一了。
很多家公司都有自己的数据备份产品,Data Domain的一个显著差别就是他们的硬件,就是普通的PC。而从Data Domain的应用来说,他们要处理的数据通路很宽,通用CPU的数据通路都很窄。所以为什么不和大多数存储厂商一样订制自己的硬件呢?李凯对此解释是,由于特制硬件,特别是特制的芯片,如基于FPGA的可编程芯片,虽然可以提供足够的数据通路宽度,但是由于摩尔定律对硬件速度的提升,以及英特尔对CPU质量的保证,使得使用通用CPU比用特制硬件的开发周期大大减少,只要专注开发自己的软件,18个月以后,就可以得到免费的性能提升,几年之内就可以超越使用特制芯片的对手。
 
究其上面种种,这大抵就是Data Domain今天的成功秘诀。其实,这些内容也是整个计算机行业众所周知的东西,而李凯和Data Domain之所以凭借这些内容取得的今天的成功,也是国内存储厂商需要借鉴的地方——把大家都知道的东西,巧妙组合,从而形成自己的竞争力。

转载于:https://blog.51cto.com/radioloves/201550

天天向上 专访Data Domain创始人李凯相关推荐

  1. 读Avoiding the Disk Bottleneck in the Data Domain Deduplication File System

    最近在思考和实践怎样应用重复数据删除技术到云存储服务中.找了些论文来读,其中<Avoiding the Disk Bottleneck in the Data Domain Deduplicat ...

  2. 聆听李凯院士的报告----Disruptive Innovation

    今天有幸聆听了普林斯顿大学李凯教授的报告"An Disruptive innovation example: Data Domain, Inc".李凯教授是美国工程院院士,在学术界 ...

  3. 当当创始人李国庆谈吴秀波事件:呼吁释放陈昱霖 应核查税收

    雷帝网 乐天 1月22日报道 在"刘强东事件"中发表看法的当当创始人李国庆日前又在吴秀波事件上表态,称呼吁立即释放昱霖,法律不该认为是敲诈勒索刑事案件,而是分手费或封口费的民事纠纷 ...

  4. 专访第一棋牌创始人陈总:_如何解雇自己:创始人的困境

    专访第一棋牌创始人陈总: "请允许,您是希望看到自己的想法得到实施,还是成为尝试实施这些想法的人-但谁也没有时间完成甚至只有其中一个,而不是大多数? 这些令人信服的话语,由前Entagen和 ...

  5. “摔杯一怒为俞渝” 当当创始人李国庆:蓄谋已久的阴谋 不吐不快

    近日,"李国庆摔杯一怒为俞渝"一事为网友们热议. 当当创始人李国庆作客访谈节目<进击的梦想家>,节目中回忆起被包括老婆俞渝在内的管理层"逼宫"时,情 ...

  6. 叽歪网创始人李卓桓:叽歪的微信息模式

    叽歪网创始人李卓桓:叽歪的微信息模式 http://www.sina.com.cn  2008年11月17日 18:31  创业时代 图为叽歪网创始人李卓桓做客新浪创业频道"对牛乱弹琴&qu ...

  7. 【华人学者风采】李凯 普林斯顿大学

    [华人学者风采]李凯,普林斯顿大学计算机科学系讲席教授,中国工程院外籍院士,美国工程院院士,ACM Fellow,IEEE Fellow.研究兴趣涉及分布式和并行系统,操作系统,存储系统以及功能丰富的 ...

  8. 百度创始人李彦宏:互联网的下一章

    百度创始人李彦宏:互联网的下一章 By 极客公园 | 2014/01/11 [核心提示] 本文汇聚对百度创始人李彦宏访谈的观点:互联网如何加速淘汰传统行业?为什么说技术是百度的生存之道?百度的少帅计划 ...

  9. 当当网创始人李国庆宣布离开当当,投身区块链再创业

    2月20日,当当网创始人李国庆发布公开信宣布离开当当网. 以下为公开信全文: 各位当当人.当当的合作伙伴.股东以及当当读者们: 离开创立了 19 年的公司,离开了每天都去的办公室,走进公司前台看到的不 ...

最新文章

  1. 用python做问答测试_测试用户输入Python
  2. Django-内置用户系统
  3. flowable流程实例笔记(1)
  4. struts单例模式 java_Java单例设计模式详细介绍
  5. Hibernate 语句总结
  6. 红帽资深解决方案架构师魏新宇:云原生应用构建之路
  7. IOS 传值方法总结
  8. cassandra随机获取数据_Cassandra维护最终一致性 和存储机制 分区策略
  9. 转:Java NIO系列教程(一)Java NIO 概述
  10. 【python】编码
  11. 5G无线网络架构及规划
  12. 浅谈几个“返利网”----所谓的网购省钱利器
  13. macOS wifi 密码 查看
  14. 马斯克:特朗普都快80了,我支持个年轻的!懂王回怼:忘了当初跪求补贴?...
  15. MVP结合(RecycleView,Retorfit,GreenDao和EventBus)数据展示
  16. fama french-3 模型个人理解
  17. 用机器学习颠覆环法自行车赛传统体验 岱凯野心可不只有这一点!
  18. 小米电视android版本最好,小米电视安装当贝桌面+安卓TV最简单好用的NAS播放器...
  19. 永恒之蓝漏洞攻击完整步骤
  20. android chrome 工具栏,安卓chrome://flags中值得调整的的选项

热门文章

  1. mysql 主从配置
  2. 越过网络层看威胁:为什么全攻击界面才是最重要的
  3. Java 9因模块化进程缓慢而欲推迟发布
  4. 病毒木马查杀实战第019篇:病毒特征码查杀之编程实现
  5. DotNetNuke CSS hierarchy
  6. 一天一个命令--ifconfig
  7. CentOS 查看IP,端口 修改IP,打开端口生效
  8. 基于form的身份验证怎样设置一个特例(使某页不需要验证)
  9. 什么是虚拟专用网(×××)
  10. 工作组环境下WPAD部署的另类解决--WINS解析