机器学习是数据分析的最佳方法。 它还可以自动创建分析业务模型。 这就是机器学习在业务增长中发挥重要作用的原因。 因此,您的企业可能需要新的和受启发的想法,以将机器学习解决方案部署到您的企业中。 但是,机器学习的实施可能会带来一些挑战。

为了确定机器学习应用程序的部署挑战,企业需要全面了解当前的机器学习技术和当前的进步。

在这里,我将列出初创企业实施机器学习的挑战以及如何克服这些挑战。

1.模型部署面临的挑战

为了确定ML应用程序实施中的模型部署挑战,企业需要行业专家对当前的AI / ML技术有深刻的了解。 或者,雇用机器学习开发人员来解决机器学习模型与业务工作流之间缺乏兼容性的问题,这会影响ML应用程序的部署。

机器学习模型通常使用Java C Python R SQL等语言构建。 例如,Facebook的面部检测功能或Amazon的Alexa识别特定语音命令的功能已经取得了很大的进步。 具体而言,商业公司必须确保他们能够获得以下问题的答案:

哪种机器学习模型需要更新到您的业务档案?

您的企业有什么数据使用方式?

什么是适合您的机器学习模型的开发算法?

为了成功部署机器学习,企业需要对数据流,算法以及如何将其应用于不同流程有适当的了解。 对于拥有机械设备的公司,机器学习提供了一个平台,可以预测生产部门的主动措施和可能出现的故障。 需要观察特定算法以表征正常操作状态。

2.机器学习中的道德挑战

机器学习中的道德挑战涉及与如何使用数据有关的问题。 机器学习程序中存在种族偏见的某些实例,这些实例也无意中影响了ML技术的实施。

这是示例:

同样,在与客户服务代表交谈时,人们越来越难以理解他们是在与人交谈还是与机器交谈。 这只是使ML解决方案成为难以实施的技术。

两年前发生了一起著名的种族主义案件,其中谷歌面部识别软件对两个非洲裔美国年轻人的标签错误 ,该软件将这两个少年归为大猩猩。

谷歌面临着很多批评,人们开始怀疑机器智能是否可以被训练为故意种族主义的。 贴错标签的真正原因不是由于种族歧视,而是导致错误的真正原因在于应用程序培训集。

开发人员需要在道德和用户行为方面做出更透明的ML决策。 您的技术团队需要收集足够的道德规范方面的数据,以适当地训练ML应用程序。 这很重要,因为不同的情况需要不同的道德方法,并且应根据目标和行为设计系统,以便机器学习开发技术应使尽可能多的人受益并赋权。

3.与数据收集和存储有关的挑战

数据获取和存储是ML实施中的真正挑战。 仅以示例为例,一项医疗保健项目旨在削减其治疗肺炎患者的费用。 因此,他们实施了机器学习以对患者记录进行分类,以查看谁有高感染风险并且应该在医院就诊,以及谁有较低的肺炎感染风险。

仍然,它们无法理解数据记录,因此,机器学习对它们而言将毫无用处,甚至可能无用。 那么,应对此类挑战的正确方法是什么?

确实,建立正确的数据收集机制可能是您管理中最难的部分。 用户使用ML技术进行预测分析,而第一件事就是消除数据碎片。

例如,在旅行技术中,数据碎片化是主要问题之一。 酒店知道客人的信用卡详细信息,家庭住址,联系电话和其他详细信息。 此数据将传输到酒店内的不同部门。 因此,酒店团队并非总能收敛所有数据流。

好吧,那可能对客人有害。 大量数据和数据中的缺失值会降低预测准确性,这是错误的。 多亏机器学习,它提供的近似值和预测值被认为对于软件算法而言“更正确”。

这里描述的要点是基本而直接的。 但是,如果您需要解决数据获取和存储机制的方法,设置完整的基础结构以及寻找复杂的机器学习任务,则仍然需要机器学习专家。

4.与成本相关的挑战

精明的企业了解在业务活动中依赖数据驱动的决策的可能性。 而且,大量数据意味着大量存储。 那么,这些东西怎么会变得有用,又要花多少钱呢? 在许多情况下,需要对选件进行成本分析,以便做出明智的决定。

让我们看看开发定制机器学习模型所涉及的步骤,以及每个步骤的成本如何变化。

需求 :需求阶段是关于从模型了解您的业务需求的全部。 我们建议您对自己的业务有一个清晰的想法,因为太模糊的想法会使成本激增。

数据:您可以将数据视为业务模型的经验。 如果您以大量高质量的经验来培训业务模型,它将更好地了解如何解决我们的目标。 如果您的数据已准备好模型,则此过程的成本可以为零,否则,它需要一些投资。 而且,如果我们谈论要通过集群管理的大型数据集,则成本可能会成千上万。

模型:评估业务模型以有效地基准成本始终很重要。 评估和选择算法,训练业务模型,对其进行测试并实施还需要几天的时间。 这是您业务流程的核心部分,决定其成本确实不容易。

生产:测试算法并准备好进行生产后,需要管理两个主要活动:

  • 与您现有的业务设置集成。
  • 更新可能需要从新可用数据中学习或包含新功能的业务模型。

两者都不是必不可少的,因此在这里,成本可能从零到几千美元。

因此,机器学习算法和深度学习开发工作是要寻找的主要因素。 确实,性能比率取决于客户的业务目标和数据预测的成本。 机器学习项目需要时间才能取得更好的结果。 即使您很幸运,并且您的ML算法立即与基准测试相符,您的程序仍有可能有效运行或完全失败。

因此,连续监视只能保护您的ML模型免遭降级,但是随着时间的推移,情况会有所改善。 还要定义您的业务指标,尽早规划技术体系结构,这将决定ML事业的成败。

最后的话

希望对您而言,这是对企业初创公司ML实施世界的真正深入了解。 关键在于通过采用ML开发使您的企业拥有机器学习的核心功能,从而最大程度地减少挑战并创造更多收益。

From: https://hackernoon.com/4-ways-startups-can-overcome-implementation-challenges-of-machine-learning-dbgoi384n

初创企业克服机器学习实施挑战的4种方法相关推荐

  1. 克服当众讲话紧张的12种方法

    <克服当众讲话紧张的12种方法> 公众号:"王堃阳口才前线"专注演讲口才20年,学演说找王堃阳,专治各种不会说! 如果针对演讲紧张,你只有深呼吸的一种方法.可能你会收获 ...

  2. 机器学习模型部署的三种方法

    "企业机器学习需要从数据工程和数据平台的角度看待大局[...],"贾斯汀·诺曼(Justin Norman)在今年巴塞罗那的DataWorks峰会上关于机器学习模型的部署的演讲中说 ...

  3. 利用机器学习实施网络犯罪 6种有效途径触目惊心

    机器学习 被定义为"(计算机)没有明确编程的学习能力",这对于 信息安全 行业来说是一个巨大进步.这项技术,可以帮助安全分析师从恶意软件和日志分析,到尽可能的早期识别和修补漏洞.同 ...

  4. 【总结】机器学习划分数据集的几种方法

    最近搞了一个机器学习算法,精度高并且特征少,正当我狂喜之时,突然发现这只是在固定数据集上的结果. 如果随机生成数据集,还会有这样的效果吗? 这确实是一个问题,只在一个数据集上测试结果,很难证明算法鲁棒 ...

  5. 处理机器学习大数据的7种方法

    文章目录 目录 1.分配更多的内存 2.使用较小的样本 3.将数据提交至服务器上 4.更改数据格式 5.使用数据流方式或者逐行读入的方法 6.使用关系数据库 7.使用大数据平台 目录 在实际的生产过程 ...

  6. 进一步认识Deepchem的分子特征化: 将化学分子结构作为到随机森林\CNN\RNN\GNN等机器学习模型输入的三种方法

    '''by wufeil进一步认识分子特征化:将化学分子结构作为到随机森林\CNN\RNN\GNN等机器学习模型的输入如何将一个分子SMile表示的分子输入到机器学习/深度学习中呢?例如:CH3CH3 ...

  7. 解开机器学习模型黑盒的 4 种方法(终极指南)

    这是解释机器学习模型输出的终极指南 更多机器学习系列请看:芯媒机器学习系列文章和资料 许多人都认为机器学习模型的输出是莫名其妙的,模型预测或决策可能是可靠的,但你无法知道模型是根据什么做出的决策. 这 ...

  8. 企业视频会议系统接入互联网的八种方法

    近些年,视频会议因为其高效便捷渐渐为企业所用,能够有效的增加企业内外部交流的效率.互联网作为视频会议系统进行数据传输的桥梁,在企业视频会议中都有哪几种网络形式呢? ①:基于IP网络的系统 接入方式最简 ...

  9. 警告!中国90%AI初创企业将在两年内落败出局

    https://mp.weixin.qq.com/s/-RkyLda1jovaHBlBTsi-BA 近年来,中国涌现了一大批AI初创企业,但AI热潮也伴随着泡沫.由于近期市场资金紧缩,投资者发出警告, ...

最新文章

  1. 中科院aibench_中科院发布目标追踪数据集,万条视频,150万个边界框 | 快来下载...
  2. Silverlight杂记-控件相关
  3. OBS显示器捕获黑屏的解决方法
  4. Musical Theme
  5. python培训学习方法_python编程学习方法及技术进阶建议
  6. floyd判环算法(龟兔赛跑算法)
  7. 使用ACME部署生成阿里云免费HTTPS证书
  8. 即时通讯飞鸽传书民意soft需求
  9. 申请了:苹果已经在测试“毫米波”5G技术
  10. Sizeof的计算看内存分配
  11. firefox linux脚本启动,在Linux终端中使用后台运行模式启动程序的方法
  12. Python基础语法,基本数据类型及相关操作
  13. floquet端口x极化入射波_hfss和cst电磁媒质色散曲线dispersiondiagram研究方法.pdf
  14. 【UV打印机】PrintExp打印软件教程(九)-厂家模式(中)
  15. android获取角速度,android dyrscope sensor 角速度传感器调试
  16. s l m 尺码排序 php,尺码中LS是什么码?比M码大吗?还是说比S码还小?
  17. Drawable setBounds方法
  18. linux下Dnw配置(mini2440)
  19. 洲际酒店集团加速布局粤港澳大湾区,与华侨城酒店集团达成合作
  20. 基于Dubbox的微服实战学习3——使用Dubbox+SpringBoot实现微服架构

热门文章

  1. 一本通提高篇 哈希和哈希表 (二)哈希表
  2. 南卡和FILL蓝牙耳机哪个好?降噪效果强的蓝牙耳机全面测评
  3. kali删除启动栏图标的方法
  4. php 匹配反斜杠,正则表达式匹配反斜杠的方法
  5. 抽象类和接口的区别(浅显易懂)
  6. java运行cmd命令
  7. 设备点检巡检系统助力企业提高设备生产率
  8. 2021年全球防褥疮泡沫床垫收入大约261.4百万美元,预计2028年达到364.8百万美元
  9. 微信小程序去掉user agent style
  10. HTTP常见状态码详细解析