云端IDE:阿里云机器学习与PAI-DSW | 《阿里云机器学习PAI-DSW入门指南》
经过20年的快速发展,阿里经济体已经组建了一个庞大的商业生态圈,并在支付、云计算、本地生活服务等行业保持互联网巨头地位。2020财年交易额突破1万亿美元,全球第一家;阿里云支撑了2019年双11 期间峰值 54.4 万笔/秒、单日数据处理量达到 970PB 的世界级的流量洪峰,成为业界第一个实现此壮举的云计算公司。
阿里云机器学习平台正是伴随着这样庞大而复杂的阿里经济体业务成长起来的。下面我们将带着大家掀开阿里云机器学习技术大图的一角,看看阿里云机器学习,特别是机器学习工程上的发展、沉淀和创新。
阿里云机器学习技术大图
我们从用户和技术的两个角度来梳理阿里云机器学习的技术体系大图。从用户的角度来说,根据使用机器学习的深度不同,在云栖大会上,我们展示了飞天AI平台的技术分层关系:
(注:不是一个完整的产品列表,而是一些核心的样例)
从技术的角度说,机器学习从算法到底层的硬件,都涉及到不同的技术方向。下面是我们对于核心技术能力上的一个总体描述:
每个技术方向上都形成各自的布局和沉淀,接下来我们会重点讲述作为机器学习重要组成部分的工程能力体系建设。
阿里云机器学习工程能力体系
阿里云在机器学习工程体系建设上,也经历了各领域业务需求驱动和技术驱动分阶段螺旋式递进上升的过程。由最初的通过传统机器学习算法进行数据价值的粗加工,到今天以深度学习为主、支撑各类“行业大脑”解决方案的人工智能工程体系。
阿里云的机器学习工程能力体系建设始终围绕着更高效的融合人工智能三要素(算法、数据、算力)进行展开,即追求不断提升整个工程体系中的计算效率、数据效率以及工程效率,从而能够更好的支撑阿里经济体各方面业务快速发展的需求,并通过阿里云对外进行技术输出,推动人工智能领域的技术变革,产生更大的社会效益,实现普惠人工智能。
经过多年的发展创新,阿里云在AI托管平台技术层进行了系统性的建设,极大提升了算法研发、共享、部署、输出的效率,在此基础上沉淀出多个具有用户粘性和场景差异化的开发平台,这里我们选取阿里云机器学习PAI(Platform of Artificial Intelligence)作为代表来着重来介绍。
PAI是一款覆盖机器学习全流程的一站式机器学习平台产品,集数据预处理、特征工程、自动调参、模型训练、在线预测为一体,为用户提供低门槛、高性能的云端机器学习服务。
PAI相关技术脱胎于阿里集团内数十个BU的上千个业务体系,沉淀了大量的覆盖各个领域的优质分布式算法、框架、平台等,同时也在不断完善和扩充机器学习生态。
阿里云机器学习PAI-DSW
作为在AI战线上辛勤耕耘的算法工作者,你是否也常常遇到下面的情形:
算法需要运行在GPU上,可是长时间申请不到GPU机器,只能干着急。
终于GPU机器申请到了,却不能马上开始使用,需要先安装GPU驱动和各种依赖等等,感觉有些浪费时间。
好不容易机器环境弄好了,可当某天更新算法代码后变得很慢, 排查半天才发现是GPU驱动需要升级补丁,很是无奈。
生产环境机器网络隔离,在线上要debug代码,只能使用GDB在命令行进行,开发效率大大降低。
在本地采用PyCharm这样的IDE开发好代码,而数据在生产环境,不允许下载,只能把代码拷贝到线上机器运行,发现问题后,又得回到本地修改调试后再来一遍,非常不便。
PAI Studio采用图形化拖拽式,像搭积木一样分分钟就构建一个完整的工作流,很炫酷。 但想要定制发布自己的组件时,却不知从何下手。
在长期与算法工程师同学沟通合作的过程中,我们发现了算法工程师面临的这些问题。提升机器学习工程效率,降低人工智能使用门槛,急需一个简单、轻量、好用的工具平台,从而让算法工程师更加专注于模型设计本身。PAI DSW(Data Science Workshop)就是PAI团队为解决算法工程师的以上痛点,新推出的一款云端机器学习开发IDE。
PAI-DSW集成了Jupyterlab、WebIDE等多种开源项目,在阿里巴巴集团内上百个BU和上千名工程师的打磨之下性能和功能上都进行了一定的调优。数据上打通了ODPS等多个数据源,方便用户在构建模型的时候免去重新构建数据管道的工作。同时,在深度学习上,PAI-DSW内置了Tensorboard,可以通过简单的拖拽的方式来帮助深度学习的开发者更好的完成深度学习场景下神经网络的建模。下图展示了DSW在机器学习平台PAI产品架构中的位置:
(DSW在机器学习平台PAI产品架构中的位置)
简单来说,PAI-DSW可以实现多实例、多环境,GPU/CPU资源、JupyterLab、WebIDE以及全屏使用Terminal无干扰工作。目前PAI-DSW已经向所有阿里云的用户免费开放了探索者版,只需要登陆阿里云然后打开 https://dsw-dev.data.aliyun.com/#/ 即可即刻开始云上数据科学之旅。本书后面两个章节将详细介绍如何使用PAI-DSW这一简单好用的工具。
原文链接
本文为阿里云原创内容,未经允许不得转载。
云端IDE:阿里云机器学习与PAI-DSW | 《阿里云机器学习PAI-DSW入门指南》相关推荐
- 阿里云机器学习怎么玩?这本新手入门指南揭秘了!
想知道我是怎样免费在阿里云上玩机器学习的吗? 不慌,这就告诉你答案~ 它来了--阿里云向个人免费开放云端深度学习开发环境DSW(DataScienceWorkshop),还有免费GPU资源可以使用,实 ...
- Colaboratory:手把手教你使用Google免费的云端IDE进行深度学习(免费的GPU加速)的详细攻略
Colaboratory:手把手教你使用Google免费的云端IDE进行深度学习(免费的GPU加速)的详细攻略 目录 Colaboratory简介 Colaboratory使用步骤 (1).首先登陆谷 ...
- 以云战“疫”,这次阿里云又让人们惊了……
本文转载自CSDN博主「L-JingJing」的原创文章 近日,阿里云对外宣布其容器服务调度GPU云服务器启动加速计算,最快只需60秒即可完成新冠病毒的核酸对比工作:同时将向医疗科研机构.疾控中心等一 ...
- 中国电子与IBM携手构建健康云平台;微软推3款机器学习工具;【软件网每日新闻播报│第9-26期】
小编点评 2015年,中国电子和微软成立合资公司, 中国电子占股51%, 国产操作系统错失先机, 内牛满面. 昨天, 中国电子又和IBM凑一起搭了个健康云平台, IBM抢占健康云的坑, 国产云该如 ...
- 有赞和腾讯云、阿里云一同摘得“中国企业云科技服务商50强”
互联网时代的每一次技术变革都带来新的机会,而云计算这一诞生于2006年的新技术正在引领新的科技浪潮.正是从2006年开始,众多云计算公司借助云计算的东风,成长为数十亿.上百亿甚至超千亿美元市值的科技公 ...
- GitHub推出云端IDE,几秒完成开发环境配置,今后可以在浏览器里使用VS Code了
点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI 和其他科技公司一样,Gi ...
- 阿里巴巴公布“云钉一体”战略:阿里云与钉钉全面融合
点击上方蓝色"程序猿DD",选择"设为星标" 回复"资源"获取独家整理的学习资料! 来源:云头条 新浪科技讯 9月27日晚间消息,阿里巴巴公 ...
- 阿里云边缘容器服务、申通 IoT 云边端架构入选 2021 云边协同发展阶段性领先成果
2021 年 6 月 4 日,由中国信息通信研究院(以下简称"中国信通院")主办的 " 2021 云边协同大会 " 在北京举行.本次会议以 " 开启分 ...
- 8月24日云栖精选夜读 | 阿里开源富容器引擎 PouchContainer 的 network 连接机制
PouchContainer 是阿里巴巴集团开源的高效.轻量级企业级富容器引擎技术,拥有隔离性强.可移植性高.资源占用少等特性.可以帮助企业快速实现存量业务容器化,同时提高超大规模下数据中心的物理资源 ...
最新文章
- 范数和机器学习中的范数
- 还原特别慢_正手攻球最容易忽略的一步——还原
- pdf编辑 开源_新闻编辑室看到了开源的光芒
- weihan talk
- java 判断图片损坏_如何在Java中检测损坏的图像(PNG,JPG)
- python nonlocal的用法_python global和nonlocal用法解析
- CAGradientLayer简介 实现颜色渐变
- Python 数据结构与算法——递归
- jmeter中特殊的时间处理方式
- 我们究竟什么时候可以使用Ehcache缓存(转)
- 使用lambdaquery() 报空指针异常_ARMv8 异常处理简介
- 使用PS2EXE将PowerShell脚本编译为可执行程序
- MATLAB 线性拟合
- Google的设计原则
- Latex编辑论文常用package
- 《数据结构与算法》——树与二叉树之遍历总结
- RewriteCond %{REQUEST_URI}
- 这个650万科学大奖来了!今年颁给谁?
- 17年1月9日,小程序来了。深度解析2017微信公开课
- python批量添加经纬度照片水印,照片水印,坐标转换
热门文章
- 寒武纪 android实习
- VS2008鼠标右键不灵敏,TFS的Local Path无法打开对应文件夹
- nginx 服务器大文件上传时500错误
- 电商系统,剖析商品模块中商品表(spu)、规格表(sku)的数据库是如何设计的
- 回归常态啦 2020.12.08日记
- python locust在windows下的安装
- Python OS模块和文件处理
- UGUI之菜单动画效果制作思路
- 扫描文件存电子版方法
- 教你如何用python制作平面直角坐标系模拟器 python项目小发明 【安安教具】-【数学】-【平面直角坐标系】模拟器