目录

模型的保存

模型的优化

离线应用还是在线应用?

一个简单部署方案

记录项目经历,学会总结和反思

多考虑一点,如何适合更多场景

监控与迭代

模型的监控

重新开启

总结


我们的目标是业务需求,而数据挖掘产出的结果。
不管是预测型的还是关联型的,都要结合业务场景,融入到业务流程中去。

模型部署本质――回归业务

模型如何保存?
如何根据业务需求优化?
如何最终上线服务?

模型的保存

模型保存的规范。

存放的位置、名字的定义、模型使用的算法、参数、数据、效果等。

模型的优化

模型训练阶段优化所追求的目标―—效果要尽量好。
模型应用阶段优化所追求的目标――在效果尽量不降低的前提下,适配应用的限制。

时延要求比较高的场景

如果业务应用无法忍受模型的响应时间,需要思考增加机器还是降低模型的复杂度以提高速度。

模型大小要求比较高的场景
期望把人脸识别模型部署到一个摄像装置的小型存储芯片上面,需要考虑降低模型的参数维度等。

离线应用还是在线应用?

如果使用新闻分类的类别标签结果,实时分发到用户App中分类模型需要部署成在线的应用服务以实时响应新的内容请求。
如果只需要对一批已有的新闻数据进行分类处理,之后只使用这些结果模型离线运行,把存储的新闻处理完,或者每隔一段时间去处理新的数据。

在线应用

一个简单部署方案

记录项目经历,学会总结和反思

从项目的需求发起,到数据准备,再到模型训练、评估、上线,这些环节都遇到了什么样的问题,我们解决了什么问题,又有哪些问题尚未解决,在时间等条件充裕的情况下还可以做哪些尝试。

多考虑一点,如何适合更多场景

我们的数据挖掘模型或结果能不能做成统一的服务,能不能应用在更多的地方

规划一个面向全公司更底层的标签体系架构以应对各种类似的业务。

监控与迭代

为了模型保持良好的效果,需要有一份迭代计划去维护和更新模型。

模型的监控

结果监控
结果监控主要是针对一些具体的指标进行监控。
还可以根据具体产出的结果在业务中的效果进行监控。

  • 针对每天新闻的分类标签进行排名统计,来查看每个标签的占比情况与初始数据是否接近。
  • 推荐系统中,可以对标签与CTR (点击率预估)的关系进行计算。
  • 一些App会主动负反馈,让用户自己选择不喜欢的标签。

人工定期复审

主要针对业务需求准确率的情况进行评估。
查看当前的模型效果是否还满足业务的需求,准确率情况是否有所变化。
跟业务进行沟通评估,确认当前的情况是否需要对模型进行重新训练。

Case收集与样本积累

重新开启

  • 准备数据阶段发现数据无法解决业务需求时,要返回去重新讨论业务需求与数据的问题。
  • 训练模型阶段发现数据与模型无法匹配,或者如果要更换其他模型时,要回到准备数据环节。
  • 模型评估的时候发现效果达不到预期可能要回到准备数据环节重新处理数据,甚至要回到理解业务阶段。

总结

介绍了一些关于模型保存、模型优化、模型部署的思路。讲解了关于项目总结,乃至模型监控等内容。

【数据挖掘】-模型怎么解决业务需求(五)相关推荐

  1. 从业务需求抽象成模型解决方案

    从业务需求调研,通过抽象转换成模型技术方案,本文将对这个过程做个拆解,供大家参考.以下我所说的可能都是错的,只是一家之见,欢迎大家在留言区多提意见和看法,互相共勉. 一.订单对象-信息需求 公司的运营 ...

  2. 模型剖析 | 如何解决业务运维的四大难题?

    欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由织云平台团队 发表于云+社区专栏 前言 作为业务运维,你是否经常会碰到这样的问题: 新业务上线,开发同学会对服务做性能测试,但是换一种 ...

  3. 五步法搞定BI业务需求梳理

    五步法搞定BI业务需求梳理.高手就是把复杂的事情简单化,简单的东西重复做.认真做. 五步法是哪五步 第一, 明确用户.商业智能BI项目的规划一切以用户需求为导向,首先需要明确各层次的需求用户.用户都不 ...

  4. 墨天轮访谈 | 百度云邱学达:GaiaDB如何解决云上场景的业务需求?

    分享嘉宾:邱学达 百度云原生数据库资深技术专家 整理:墨天轮社区 导读 业务上云的大背景对弹性与可靠性的要求越来越高,传统架构的单机数据库或是分片数据库已经很难支撑快速增长的业务,导致单机瓶颈.扩容缩 ...

  5. 【Salesforce】巧用公式字段及标准函数解决日期间隔业务需求

    巧用公式字段及标准函数解决日期间隔业务需求 文章目录 巧用公式字段及标准函数解决日期间隔业务需求 业务场景 公式字段特点 使用Salesforce提供的方法构建公式 判断是否达到一季度 判断有没有多余 ...

  6. 做好数据挖掘模型的9条经验总结

    数据挖掘是利用业务知识从数据中发现和解释知识(或称为模式)的过程,这种知识是以自然或者人工形式创造的新知识. 当前的数据挖掘形式,是在20世纪90年代实践领域诞生的,是在集成数据挖掘算法平台发展的支撑 ...

  7. 【1.6万字长文】华为战略管理方法论介绍(含开发战略到执行DSTE、业务领先模型BLM、业务执行力模型BEM、组织绩效和战略解码)

    第一本全方位阐述华为端到端战略管理体系的著作<华为战略管理法:DSTE实战体系>出版了!!当当网.京东均可下单购买. 第一本全方位阐述华为端到端战略管理体系的著作<华为战略管理法:D ...

  8. 业务需求复杂多变,IT部门应接不暇?自定义报表来帮您!

    从纸带打孔.到汇编语言.到高级语言,再到各种IDE.各种框架,人们始终在试图屏蔽底层的复杂性与难以理解性,通过归纳.抽象.封装,进而通过点拉拖拽及少量代码来快速完成应用程序的开发. 观远数据产品团队始 ...

  9. 博奥智源:”信息管理”系统 业务需求

    . "信息管理"监督系统项目 业务需求 (一)用好标准,全面归集数据.严格按照<高校科研经费监督数据规范1.0(试行)>的要求,打通校内科研.财务.招标采购.组织人事等 ...

最新文章

  1. 【阿圆实验】Consul HA 高可用方案
  2. 武汉大专计算机专业分数线,武汉专科大学有哪些 2019武汉专科大学排名及分数线...
  3. 切换器黑屏_机房的KVM切换器是什么,故障如何解决?
  4. 爱上经典之《蜗牛与黄鹂鸟》
  5. Linux上搭建h2引擎加载h2文件
  6. Camera_Hal3_User_Manual
  7. springboot实现条形码_java生成条形码(多种条码类型生成)
  8. 亲测~Win10开启系统自带Wifi热点步骤
  9. 小水智能-智能楼宇智慧建筑3D可视化系统,实现对实时数据的整合处理
  10. mysql5.1不支持中文,MySQL_MySQL5.1的中文支持的一个改进, MySQL 5.1的中文支持的一个改 - phpStudy...
  11. 图片转excel怎么弄?简单实用的方法
  12. 在网页中插入FLV视频,经测试兼容IE、火狐、谷歌等浏览器
  13. OpenMV感光元件参数设置
  14. 6.1 Python 单分支结构 if语句
  15. dhl软件_DHL的完整形式是什么?
  16. 网易实习生算法组编程题二:求数组的两个子数组和的最大值
  17. Ffmpeg快速命令使用 Ffmpeg选项详解 Ffmepg格式详解 常见视频文件格式详解
  18. Python使用K-means聚类分析
  19. mactxt文件如何转换成html,PDF转换成HTML文档首选ABBYY Mac
  20. MYSQL常用监控项

热门文章

  1. 戴尔R730服务器,双电源主用、备用功能设备。
  2. Oozie分布式工作流——流控制
  3. c语言编程新思路知到答案,C语言编程新思路章节答案
  4. 文本匹配相关方向总结(数据,场景,论文,开源工具)
  5. 阿里云物联网平台实现MQTT通信(MQTT.fx测试)
  6. 托福英语写作22范文
  7. 解决Win10环境变量Path的显示问题
  8. dlut 人工智能基础上机————创造营2020数据爬取
  9. 疫情期间居家办公软件参考
  10. 使用mspaint改变图片大小的一个小技巧记录