▏摘要

中国电信是中国三大运营商之一,为响应国家“东数西算”工程的全新数据中心形态,中国电信引入隐私计算平台,对内实现数据确权跟踪、对外实现数据共享交易,盘活中国电信分布在全国不同区域的数据资源和算力资源,通过数据开放、算力输出以及中国电信在AI领域的算法模型实践,赋能电信各省分公司和外部政企客户。

▏关键发现

• 隐私计算技术可实现各个数据协作方之间的安全可信,将智算中心升级为信算中心,形成一种集安全存储、可信计算、高性能、大规模为一体的新型可信信息基础设施;

• 在选择隐私计算技术路线时,出于对机器学习算法支持、计算密集度、安全信任方等考量,中国电信选择软硬件结合的可信执行环境(TEE)技术,兼容CPU与GPU,满足大规模数据训练推理的高性能需求,同时,信任基础建立在国产化技术路线之上,可以满足国产化替代的发展趋势;

• 各省分公司只需要部署异构加速隐私计算一体机,预装隐私计算核心架构和数据共享交易平台,则可以自动接入到中国电信区块链基础设施和数据流通的数据和算力调度网络中,实现快速部署和无缝扩容。

分享专家:周岳骞,冲量在线产品总经理
作者:沙丘社区分析师团队

01
案例企业

中国电信集团有限公司(以下简称“中国电信“)成立于1995年,是国有特大型通信骨干企业,连续多年入选世界500强企业。截至2021年底,拥有固定电话用户1.07亿户,移动电话用户3.72亿户,宽带用户1.70亿户,集团公司总资产9,078亿元,员工总数40余万人。

02
项目背景

2022年3月,十三届全国人大五次会议审查的计划报告提出,实施“东数西算”工程,把东部密集的算力需求有序引导到西部,使数据要素跨域流动,打通“数”动脉,织就全国算力一张网。中国电信作为三大运营商之一,作为重要的网络和算力基础设施的建设和运营方,自然承担起“东数西算”赋予的课题和任务。

对于中国电信本身而言,“东数西算”意味着内部和外部的两大需求:

内部:各省分公司之间通过一套平台实现算力和数据的统一调度和管理。中国电信内部各省分公司之间本身存在着算力和数据的不对等,内蒙、青海、宁夏等西部省份和地区,能源土地资源的成本较低,算力更多;而东部省份和地区的业务更加繁忙,有更多的业务数据。对此,中国电信推出数算云网战略,旨在打造全国算力和数据的一张网,实现整体算力和数据的调度。

外部:既能满足各省分公司对政企客户服务的需求场景,又能加大对各省分公司与外部政企合作时的数据安全合规保护要求。中国电信在各个省份都有外部政企合作方,合作方在使用中国电信算力和数据的同时,自身对数据安全存在诉求,中国电信在对外进行数据和算力的输出时也有着合规性的考量。随着《数据安全法》和《个人信息保护法》的推出和落实,中国电信对于全国省分公司的要求越来越严格。

基于以上两大需求,中国电信希望引入隐私计算平台实现各个数据协作方之间的安全可信,将智算中心升级为信算中心,形成一种集安全存储、可信计算、高性能、大规模为一体的新型可信信息基础设施。

隐私计算平台帮助各省分公司解决AI场景下数据、算法、建模的分离问题,具体包括两类场景:

第一,建模过程。智算中心拥有中国电信以及政企客户提供的数据、大量的异构芯片资源以及AI算法,模型训练方利用相关资源进行模型训练,但不希望输出的标签数据、用户身份数据等被沉淀。对于中国电信而言,托管在平台上的算法以及样本数据也不希望被模型训练方拿走,最终通过智算中心输出的只是建模结果。

第二,预测过程。政企客户在智算中心完成模型训练之后,希望将模型托管在智算中心平台上,然后对自身业务或用户提供API接口服务。用户在使用过程中,接口调用会涉及到真实的业务数据,在通过API方式调用模型的过程中,业务数据最终会传输到智算中心的加速芯片中进行运算,然后输出标签。在这个过程中,需要保证待预测的数据在预测过程中不能落盘,实现预测过程中样本数据与模型、算力提供方之间的分离。

03
解决方案

在实现智算中心升级的过程中,中国电信与冲量在线、中科海光等合作,共同推动国芯隐私计算及区块链技术的落地应用。

冲量在线是一家专注于数据流通与隐私计算解决方案的科技创新企业,拥有高新企业认证,在隐私计算一体机、可信执行环境、区块链增强的隐私计算等领域位均居于行业领先地位,也是隐私计算行业中最早拥抱信创生态并全面完成适配的企业。

中国电信、冲量在线、中科海光的合作最早可追溯于2020年,现已经历四个发展阶段:

阶段一:核心模块研发。冲量在线基于中科海光自研CPU芯片及自研的TEE技术CSV,自主研发了基于国产芯片的数据互联与隐私计算平台,并于2021年6月与中科海光联合推出了隐私计算软硬件一体机产品。

阶段二:数信链网产品。基于国产隐私计算一体机与区块链基础设施,电信研究院与冲量在线、海光信息联合研发了支持数据确权、定价、交易、隐私计算的数信链网产品,并在中国电信内部各省分公司进行试点和应用。

阶段三,异构加速创新。隐私计算技术在实际生产落地过程中存在着应用场景和性能规模方面的瓶颈,TEE技术无法满足异构场景下的需求,结合海光信息的异构加速芯片DCU,冲量在线与海光信息联合研发了TEE直通异构加速芯片的驱动及应用技术,将原本只能适用于CPU芯片上的CSV技术与海光芯片DCU直通,将原本由TEE保护的在CPU和内存当中的安全可信计算环境拓展到GPU中,利用GPU资源加速TEE中的隐私计算,推出全国产化的异构加速隐私计算一体机。

阶段四,信算落地应用。数信链网产品在北京电信部署落地,并结合北京电信智算中心的先进算力和算法积累,推出了基于隐私计算的AI开放应用平台,帮助北京电信实现数据资产与AI能力的开放运营,赋能北京电信的政企客户进行智能化转型。

可信执行环境(TEE)最早由CPU芯片厂商制定细节标准,无法覆盖智算中心的GPU资源。

2022年3月,英伟达率先推出首款能够支持隐私计算的H100 GPU芯片,提供PVle和NVLink通道保证CPU和GPU之间的通信完全加密,屏蔽CPU和GPU进行密文传输过程中的信息供给,能保证数据传输过程中的安全性;内置定制可信根,保证每个GPU芯片独立、无法被篡改,一旦被篡改,芯片的可信根就不再可用,保证硬件本身的安全性;此外,支持基于度量的可信启动和GPU远程认证,意味着运行在CPU当中的算法可以被数据提供方所度量,数据提供方可以从远端验证H100的芯片是否合规、是否被篡改过、是否内置可信根。基于CUDA生态,用户开发的深度学习和机器学习算法无需做任何更改,就可以在由TEE加密的GPU的可信执行环境中运行。

基于国际厂商推出基于TEE的异构加速方案,冲量在线与中科海光于2022年6月推出国内首个支持隐私计算的GPU芯片方案:通过海光DCU芯片与海光CPU芯片上的TEE直通,可以在CPU和GPU当中共同建立完整的可信执行环境,可信执行环境以CPU中的TEE为核心接收外部的算法、数据和模型,通过加密通道使用GPU的算力资源进行推理和训练,最后结果通过CPU中的可信执行环境对外输出。

该方案具有如下优势:

第一,在整个机器学习的训练和推理过程中,数据无需落盘,保证数据不存在隐私泄露的困扰;

第二,基于海光GPU CUDA的兼容,保证上层基于等TensorFlow、PyTorch等深度学习框架上的AI应用和隐私计算算法不需要修改;

第三,结合异构硬件加速卡,支持AI异构加速;

第四,全面国产化替代,CPU层面通过海光CPU替代英特尔CPU、GPU层面通过海光GPU替代英伟达GPU,实现端到端的软硬件全国产化。

在选择隐私计算技术路线时,中国电信考虑了基于软件的多方安全计算、联邦学习或基于硬件的可信执行环境。最终,中国电信选择了可信执行环境的技术路线,考虑因素如下:

第一,可信执行环境对于机器学习的支持更加友好,未来拓展更加便捷。无论是多方安全计算还是联邦学习,算法本身的开发语言、代码、开发框架都需要改造,例如多方安全计算需要用到多方安全计算所提供的算子重构算法;联邦学习需要基于联邦学习的框架重写原有机器学习算法。而可信执行环境由于本身是一个黑盒,不需要干预算法,原有机器学习算法、深度学习算法可以在无需改造的情况下,直接在可信执行环境当中运行。

第二,可信执行环境可支持亿级以上大规模数据。北京电信希望通过智算中心承载外部政企客户的诉求,每个节点能支持千万级甚至亿级别的大规模数据。可信执行环境的性能损耗可以控制在5%~10%,保证计算密集度不会有太大损耗,多方安全计算和联邦学习对计算密集度的损耗都相对较大。

第三,安全信任方可转移到芯片厂商。多方安全计算和联邦学习的安全信任方是在软件层面,或者说在加密算法层面,而可信执行环境的安全信任方可以转嫁给芯片厂商。引入国产芯片厂商一方面风险共担,另一方面保障信任基础建立在国产化技术路线之上,满足国产化替代的发展趋势。

目前,隐私计算平台在中国电信已经落地和正在落地的应用场景如下:

第一,金融风控。在保护用户隐私数据的前提下,帮助金融机构训练高准确率的用户金融风险评分模型,对可能发生的金融违约和欺诈行为进行预测,从而有效降低坏账率并做好风险预警。

第二,医疗药研。促进医疗结构与医院间的数据合作,通过“真实世界数据研究”推动药品研发和上市。严格遵循医疗数据保护规范,实现用户隐私数据完全脱敏且全流程隐私计算。

第三,双碳经济。通过智能水表、智能电表等物联网IT设备采集企业用电、能耗和生产经营数据,在隐私计算平台上进行建模,促进“双碳经济”中碳足迹数据的存证和交易,实现企业能耗、生产、经营数据的隐私保护,并通过数据流通促进监管机构和金融机构对绿色经济的管理和扶持。

第四,疫情防控。在做好个人信息保护的基础上实现大数据支撑的疫情联防联控,通过数据隐私共享流通,实现跨机构的联合排查和精准定位,同时充分保护居民个人隐私安全。

第五,治安舆情。通过电信业务数据、互联网行为数据、社交媒体舆情等融合分析,实现公共安全事件的有效预测和防范,实现治安情报分析中的多方双向隐私保护。

第六,跨省电信业务。实现中国电信各省分公司的数据互联互通,实现各省分公司数据所有权的保护和数据资产激活,支撑各类跨省电信业务的便捷开展与高效互通。

随着未来智算中心以及中国电信数信链网平台在各个省分公司的推广,每个省分公司只需要部署异构加速隐私计算一体机,预装隐私计算核心架构和数据共享交易平台,自动切入到中国电信区块链基础设施和数据流通的数据和算力调度网络中,实现快速部署和无缝扩容。

04
价值与效果

通过数信链网平台,中国电信对内实现数据确权跟踪、对外实现数据共享交易,并搭建智算中心的AI隐私计算开放平台,以SaaS化的方式提供隐私计算API管理。

目前,“数信链网”已经在中国电信及多个省分公司试点应用,承载了数万次内外部的数据交易流通和AI建模,总计运行的数据量超过百亿级别;支持北京电信的数据输出和智算AI开放业务,已支撑40余个AI训练的场景,包含千万用户量级的数据和数十种AI算法。

星河案例ㅣ中国电信 X 冲量在线:基于智算中心的隐私计算应用实践相关推荐

  1. 【观察】浪潮加速智算中心落地,计算先行筑牢“新基建”

    申耀的科技观察 读懂科技,赢取未来! 今天,从中央到地方.从政企到民间,"新基建"被擢升到前所未有的战略高度.其中,以5G.工业互联网.大数据中心等创新技术引领的"新基建 ...

  2. “智算中心”,按动着新基建的“快进键”

    2020年,新冠肺炎忽然横空出世,"黑天鹅"的羽翼笼罩全球. 纳西姆·塔勒布曾提出过"反脆弱"的概念:在非常态的环境里,所有事物都会从波动中得利或受损,脆弱性是 ...

  3. 自动驾驶“稳打地基”,小鹏汽车基于阿里云建自动驾驶AI智算中心算力可达600PFLOPS

    数据驱动是自动驾驶发展的公认方向,也让自动驾驶模型训练成为一头"吃算力"的巨兽.自动驾驶的视觉检测.轨迹预测与行车规划等算法模型,有赖于机器学习海量数据集,但算力的不足让研发速度仍 ...

  4. 计算力即生产力,智算中心就是智慧时代的“发电厂” | MEET2021

    编辑部 整理自 MEET 2021  量子位 报道 | 公众号 QbitAI 进入AI时代,什么最重要? 算法固然是AI技术的核心,但是没有强大算力的支持,AI技术就很难得到落地.现在连AI技术创新本 ...

  5. IMAX China去年实现扭亏为盈;华为助力打造成都智算中心;Quantinuum和IBM壮大量子生态系统 | 全球TMT...

    国内市场 IMAX China公布2021年全年财务业绩.公司大中华区2021年全年收入约为 1.13亿美元,同比增长116%.与2020年全年净亏损460万美元相比,公司2021年经调整净利润约为4 ...

  6. 浪潮信息做pc服务器,浪潮信息:高性能AI服务器将成为智算中心生产算

    川北在线核心提示:原标题:浪潮信息:高性能AI服务器将成为智算中心生产算力的动力机组 智算中心,不管我们看得见,还是看不见,它将源源不断提供智慧时代的动力计算力. 4月9日,在IPF2020浪潮云数据 ...

  7. 智能算力的枢纽如何构建?中国云都的淮海智算中心打了个样

    摘要:在全国众多智算中心当中,淮海智算中心为什么有底气打造智算枢纽? 目前,我国正处在智算中心的建设热潮中.据统计,全国共有20余个城市已经启动或完成了智算中心的建设.其中既有省会城市,也有不少把云计 ...

  8. 【产业互联网周报】全国超30城市正建或筹建智算中心;比尔•盖茨:不太看好Web3和元宇宙;...

     关注ITValue,看企业级最新鲜.最价值报道! (1月9日-15日)最近一周,加拿大宣布启动国家量子战略:微软收购可组合式基础设施供应商Fungible:阿里云海外增设产品.生态等四大国际能力中心 ...

  9. 手握智算中心“绿洲”,毫末跑在中美自动驾驶长跑第一线

    作者 | 白日梦想家 编辑 | 王博 2022年过去,数据驱动成为自动驾驶演进共识.沿着数据驱动这条路线,自动驾驶加速迈入智算时代. 智算中心应运而生. 实际上,将智算引入自动驾驶的开先河者是特斯拉, ...

最新文章

  1. python零基础入门教程学习要多久-廖雪峰python教程要学多久-零基础学Python需要多久...
  2. (转)软件开发人员如何提高自己的软件专业技术方面的具体建议
  3. ViewState机制的解析(转自csdn)
  4. 计算机教室 使用计划,计算机室教学计划
  5. layui进度条:调用、参数设置、动态渲染、数据热更新 (含案例、代码)
  6. wpf 创建附加属性实例
  7. OpenBSD操作系统(1)——服务管理程序rcctl 类似linux下的service或systemctl
  8. 使用pymongo需要手动关闭MongoDB Connection吗?
  9. 中国信通院发布《区块链赋能新型智慧城市白皮书(2019年)》解读(附全文下载)
  10. 硬件设计-USB2.0电路设计
  11. Mybatis之错误:Invalid bound statement (not found)
  12. 豆腐锅巴--怀念娭毑_原水_新浪博客
  13. python绘图黄金螺旋_教案-for循环应用之“黄金螺旋-信息技术高中
  14. python 搜索引擎 词位置加权_如何提高python中的词移动距离相似度并利用加权senten提供相似度评分...
  15. statsmodels.formula数据使用predict()
  16. VS2019 C++的跨平台开发——Android .so开发
  17. 爱尔眼科跌超11%,葛兰管理的中欧医疗健康混合基金产品重仓股
  18. 网络变压器的工作原理:网络变压器中的直流电阻对POE供电有怎样的影响呢?
  19. 学不可以已--我一年Java之路的回顾,反思以及展望(上)
  20. 云原生监控平台 Prometheus 从部署到监控

热门文章

  1. Linux笔记(2)——导入python库报错“libgomp.so.1: version `GOMP_4.0‘ not found“
  2. [cartographer] 10. ShrinkToFit
  3. Metal每日分享,调整对比度滤镜效果
  4. 华为 android 安全,华为 EMUI/Magic UI 安全更新 2020-5
  5. SSL证书问题:无法获取本地颁发者证书
  6. 【华为机试 Python实现】华为机试题集合(已更新171篇)
  7. 【寒假每日一题】洛谷 P6367 [COCI2006-2007#6] PRASE
  8. img标签请求拦截_如何给img标签里的请求添加自定义header?
  9. 普通人有捷径可以走吗?
  10. 浙江大学公共管理硕士(MPA)的选修课都有哪些哪些内容?