开发人员和数据科学家应该熟悉这六个旨在简化机器学习过程的SageMaker工具。发现他们为你的模型提供的东西。

AWS的旗舰AI产品Amazon SageMaker自称是简化机器学习的一种方式,该服务的早期版本可能使某些IT团队感到渴望。

自2017年以来,开发人员,分析师和数据科学家一直在使用SageMaker在云中构建,训练和部署机器学习模型。托管服务使用户可以卸载与机器学习相关的日常任务,但是初始版本缺少一些通常与软件开发相关的工具,包括围绕调试,管理和协作的功能。

在2019年末,AWS通过SageMaker Studio,Experiments,Debugger等扩展了Amazon SageMaker功能时,解决了其中一些缺陷。本文深入研究了这些工具的工作方式,以及它们如何改进将机器学习模型从开发应用于生产所需的步骤。

SageMaker Studio添加了适用于AI的IDE

该集成开发环境(IDE)简化了与构建和部署机器学习模型有关的多个方面。最值得注意的是,它消除了为Jupyter notebook选择和管理基础架构的需求。

SageMaker notebook提供了使用单点登录(SSO)进行身份验证的选项,因此团队可以使用现有的公司登录凭据。开发人员可以与组织中的其他人共享他们的工作,包括notebook代码及其运行环境。SageMaker Studio的GUI也是用户友好的,并提供了这些功能和其他功能的合并视图。

SageMaker Experiments针对测试和开发工作

开发人员需要在任何交付周期中测试和遍历代码版本。对于机器学习模型,此过程特别具有挑战性,因为迭代依赖于特定的算法版本以及数据,模型和参数。

使用SageMaker Experiments,开发人员可以将特定模型的训练任务的不同元素分组并保存。例如,他们可以跟踪不同的模型,参数和数据集,以便可以对数据进行版本控制,复制和比较。

创建实验后,可以使用实验自己的Python SDK自动执行该实验。开发人员可以以编程方式创建迭代并开始一系列试运行,可以在SageMaker Studio中将其可视化。鉴于构建和评估培训模型的迭代性质,实验可以为开发人员节省大量时间。

SageMaker Autopilot推荐并自动进行模型构建

该AWS机器学习工具使实验更进一步。它根据SageMaker选择和配置的变量自动配置和运行迭代。例如,自动驾驶仪可以从一系列算法,数据预处理任务,实例和参数中进行选择,以找到针对机器学习用例的最准确模型。

通常,数据科学家需要手动配置这些方案并显式运行不同的迭代。使用自动驾驶仪,开发人员可以按列格式输入数据,指定要预测的列,然后自动驾驶仪运行迭代以找到最佳模型。需要注意的一个限制是,Autopilot当前仅支持列数据。

SageMaker调试器检测到潜在的错误

借助此机器学习功能,开发人员可以更好地对机器学习模型进行故障排除。调试器存储模型的快照,也称为张量。这些快照捕获了大量模型变量,例如参数,梯度和其他相关信息。

借助Debugger,开发人员可以使用这些快照来配置警报,以帮助他们了解模型何时何地失败。例如,可以将规则配置为检测输出太大还是太小。

调试器还附带了一组预配置的规则。如果检测到异常,则会通知开发人员,并可以通过访问SageMaker Studio的界面并分析其机器学习模型的特定快照来解决问题。IT团队可以使用此信息来隔离在特定时间点和特定条件下发生的问题。开发人员还可以对由检测到的异常触发的CloudWatch事件做出反应,并实施自动修复任务。

使用SageMaker Debugger功能时,开发人员必须通过添加对Debugger SDK的调用来检测其代码,这些调用定期将张量数据发送到Debugger。尽管步骤相对简单,但IT专业人员确实需要熟悉SDK,并在使用Debugger之前更新其项目中的源代码。

SageMaker Model Monitor跟踪预测质量

一旦在生产环境中部署了模型,就必须在应用程序级别跟踪任何潜在的异常情况。Model Monitor是一种托管的AWS机器学习工具,可收集生产环境中的输入和输出,并将它们与模型训练数据进行比较。这可以帮助应用程序所有者发现由生产数据引起的偏差,这些偏差可能会对预测准确性产生负面影响。

开发人员将Model Monitor配置为捕获请求和响应,然后将数据存储在Amazon S3中。然后,他们创建一个基准,该基准将用于将生产结果与培训环境进行比较。

优良作法是从在模型训练过程中使用的数据集创建基线,并已确认可以提供准确的结果。创建基准后,开发人员可以配置和调度作业以监视端点。这些作业使用来自生产环境中部署的模型的请求和响应,并且作业针对基准数据集运行这些方案。

如果生产请求不再产生在培训期间观察到的预期结果,则可以在监视作业的输出中检测到预期结果。可以使用SageMaker Studio GUI或以SDK编程方式访问这些结果。结果还可以作为CloudWatch指标发布,可以在自定义仪表板中可视化,也可以根据需要触发CloudWatch警报。

SageMaker预处理数据进行分析

数据科学家可以使用此AWS机器学习工具清理数据,包括转换和计算字段,调整列数,消除噪声或标准化格式,然后再将其输入培训或评估工作中。在评估数据之后,SageMaker Processing还可以转换数据。

开发人员必须使用SageMaker Processing SDK来配置和运行处理作业。处理任务(可能会占用大量资源)是在托管环境中执行的,可以通过SageMaker notebook或在通过AWS的云容器服务提供的Docker容器中执行。

原文链接:

https://searchcloudcomputing.techtarget.com/tip/6-Amazon-SageMaker-capabilities-developers-should-know-about?

了解新钛云服

招聘|挑战百万年薪

TiOps,支持多云环境安全远程运维,疫情期间免费对外开放,助力远程安全办公!

新钛云服正式获批工信部ISP/IDC(含互联网资源协作)牌照

深耕专业,矗立鳌头,新钛云服获千万Pre-A轮融资

新钛云服,打造最专业的Cloud MSP+,做企业业务和云之间的桥梁

新钛云服一周年,完成两轮融资,服务五十多家客户

上海某仓储物流电子商务公司混合云解决方案

新钛云服出品的部分精品技术干货

国内主流公有云VPC使用对比及总结

万字长文:云架构设计原则|附PDF下载

刚刚,OpenStack 第 19 个版本来了,附28项特性详细解读!

Ceph OSD故障排除|万字经验总结

七个用于Docker和Kubernetes防护的安全工具

运维人的终身成长,从清单管理开始|万字长文!

OpenStack与ZStack深度对比:架构、部署、计算存储与网络、运维监控等

什么是云原生?

IT混合云战略:是什么、为什么,如何构建?

六个机器学习开发人员应该了解的Amazon SageMaker功能相关推荐

  1. aws dynamodb_DynamoDB备忘单–您需要了解的有关2020 AWS认证开发人员助理认证的Amazon Dynamo DB的所有信息

    aws dynamodb The emergence of cloud services has changed the way we build web-applications. This in ...

  2. 关于amazon亚马逊SP-API申请注册,amazon亚马逊SPAPI开发人员资料注册,amazon亚马逊Selling Partner API申请注册详细指导

    关于amazon亚马逊SPAPI开发人员资料注册,amazon亚马逊开发人员资料申请注册,amazon亚马逊销售合作伙伴 API申请注册,amazon亚马逊SP-API申请注册,amazon亚马逊Se ...

  3. Web前端开发人员和设计师必读文章推荐【系列九】

    这篇文章主要收录了最近两个个月发布在梦想天空的优秀文章,特别推荐给 Web 开发人员和设计师阅读.梦天空博客关注 前端开发 技术,展示最新 HTML5 和 CSS3 技术应用,分享实用的 jQuery ...

  4. MySQL内部开发人员如何看待MySQL组复制?

    MySQL因为高性能.可扩展性和可用性被广泛应用于Web应用程序,成为支持高流量社交媒体.电商应用程序以及快速成长企业的IT平台基础.在MySQL 5.7.17版本中,MySQL Group Repl ...

  5. Microsoft Windows Workflow Foundation 入门:开发人员演练

    有关向 Windows 平台添加工作流支持的初步知识 Microsoft Windows Workflow Foundation (WWF) 是一个可扩展框架,用于在 Windows 平台上开发工作流 ...

  6. 实战 IE8 开发人员工具

    今天整理我收藏的漫画的时候发现 风云3 少了两集(486.487),这对于收藏者来说基本是不可忍受的: 从风云一到三,应该一集也不能少的: 决定上网去找找,不过溜达一圈常去的分享论坛,由于时间太长了而 ...

  7. 开发人员安全问题_开发人员需要了解的安全性

    开发人员安全问题 DevOps并不意味着每个人都必须是开发和运营方面的专家. 在角色往往更专业的大型组织中尤其如此. 而是,DevOps思维的发展方式使其更加关注关注点分离. 在一定程度上,运营团队可 ...

  8. web前端代码开发工具_Web开发人员的有用代码比较工具

    许多不同语言的开发人员都有着共同的成长难题. 冗长的源代码将在开发人员的整个职业生涯中成为一个棘手的问题,但是考虑较少的问题是编译和合并来自同一源的两个或更多副本的编辑. 幸运的是,对于这种情况,有非 ...

  9. 银河土星_设计师来自土星,开发人员来自木星:或者,为什么沟通很重要

    银河土星 by Albino Tonnina 通过白化Tonnina 设计师来自土星,开发人员来自木星:或者,为什么沟通很重要 (Designers are from Saturn, develope ...

最新文章

  1. 怎么打开外部文件_保存的DWG文件再次用CAD打开时提示文件损坏了怎么办?【AutoCAD教程】...
  2. python自学需要哪些基础知识-零基础学Python应该学习哪些入门知识及学习步骤安排...
  3. View工作原理(四)view的layout过程
  4. 永久白嫖!发现官方漏洞,希望不要被封杀!
  5. 企业即时通讯规模将达7亿
  6. scrot截图ubuntu
  7. JQuery选择器跨frame和层次选择
  8. Swap in C C++ C# Java
  9. 全网首发:编译jna:dispatch.h:30:34: fatal error: com_sun_jna_Function.h: 没有那个文件或目录
  10. linux整站下载工具
  11. 关于网络促销活动对大学生购物的影响的调研报告
  12. 数仓建设之IP库的匹配
  13. 瑞萨 RA2E1 触摸按键使用例程
  14. 技术分享 | 基于 Alertmanager 告警系统的改造
  15. 拼多多开店步骤是什么?在拼多多如何开店?
  16. sbt oracle,使用Oracle默认SBT接口测试磁带通道 | 学步园
  17. python项目-爬取妹子图
  18. 从“什么是程序化购买”到“程序化购买+”
  19. 最近,帮一个学生做了一个毕业设计
  20. Hrm-人力资源系统开发笔记02

热门文章

  1. Python对象及内存管理
  2. Pangle付款方式,Pangle付款时间?Pangle如何收款结汇?
  3. r9 5950x参数配置 r9 5950x配什么主板
  4. iphone手机里的计算机没有了怎么办,iPhone连到系统上的设备没有发挥作用怎么办...
  5. 如何一次性查询所有快递单号
  6. 跳槽带走100多核心骨干,导致盛大文学衰落的他,这次又“叛逃”腾讯!
  7. json-bigint
  8. linux内核mount过程超复杂的do_mount()、do_loopback()、attach_recursive_mnt()、propagate_mnt()函数详解
  9. aodv-uu-0.9.6编译移植Mini6410 组建ad-hoc网络
  10. 20210417 simulink导入CSV