说明

我觉得这个概念可以把很多之前讲的概念串起来。概念是非常重要的(《反脆弱》有提到),找到合适的概念来表达思想可以更好的帮助思考和分析。

内容

数据工厂包含了两方面的解释:

  • 1 从业务上看。更多的和部署相关,通过算网、微服务、一键部署等方法构建了满足业务功能,接口调用的方法。关注data in & data out直接产生了经济价值。这个工厂的接单派货没啥两样。
  • 2 从技术上看。更多的和AI工具和模型相关。以PM和DM为主要工具构建的内容非常像一个工厂的制造过程。

我所研究的,无非是从数据到数据的变换方法,从输入数据到输出数据,能够产生经济价值。所以输出数据就是我的产品。为了能够更快更好的生产产品,我研究、实践了架构和部署相关的内容。使得我有足够的计算和存储资源来完成数据生产的任务。

1 业务

金融业当然是数据工厂的最好客户,因为他们的业务正好就是数据入和数据出。某种程度上说,不需要人是可以的。还有一些例如传媒、娱乐、电商等会有很多实际业务问题或者合规问题,不去碰。

世界世界中符合data in , data out且合规无问题的业务场景都是数据工厂的客户。

2 工厂基础

工厂的基础是维持运行的软硬件基础。

硬件基础(水、电、互联网啥的就不计入了)

<

序号 名称 作用

建模杂谈系列100 数据工厂相关推荐

  1. 建模杂谈系列159 数据“板材“模型

    说明 数据是抽象的,数据处理的工艺也是抽象的,我觉得需要有一些可见的模型进行类比才好记忆和思考.我一直把数据处理和实体制造进行类比,也可能是我过去做过一些制造业的管理咨询有关系,我觉得很自然. 本篇就 ...

  2. 建模杂谈系列225 小结与反思

    说明 一个项目结束了,趁这两三天在休息,把本次的收获和教训都盘点一下,然后再开始一个更刺激的项目. 短暂的停顿,是为了把过去一段时间辛苦的成果固化一下,把那些很容易消散的宝贵知识和经验可以给未来做决策 ...

  3. 建模杂谈系列226 流程与对象

    说明 鲁迅说:我家门前门前有两棵树,一棵是枣树,另一棵也是枣树. 从编程语言的角度,可以分为两大类(面向过程或面向对象),可以参考这篇文章 文章的内容其实不多,我贴一下: 对于两者的比较,文章这么说: ...

  4. 建模杂谈系列142 关于MVD的思考

    说明 概念的创建是重要的 现实中,数据的获取和处理(ETL)是很麻烦的事,以下是一些关于数据处理的思考. 内容 MVD(MultiVerse Data) 多元宇宙数据 借用了<奇异博士>里 ...

  5. 建模杂谈系列102 信息安全一二

    说明 现在考虑信息安全还偏早,并且纯技术的信息安全也并不可靠,本文简单梳理一下如何从大的层面确保信息安全. 内容 1 从数据存储上 1.1 AB类 首先,一些数据/算法永远不会存在公网机上.可部署在公 ...

  6. 建模杂谈系列61- 行业分类的逻辑

    说明 假设只从公司的名称上,能不能对行业分类? 理论上应该是可行的,但是就行业分类背后的逻辑来说,我觉得还是不太统一.本篇探讨一下行业分类的内在逻辑. 内容 1 为什么要行业 为什么有行业? 因为有社 ...

  7. 建模杂谈系列62- knime模型实例1- 流失预测 Churn Prediction

    说明 KNIME是一个开源的机器学习平台,有兴趣可以自己查一下怎么用,这里几篇都是关于其中的示例介绍. 内容 1 获取数据 原始程序读取了两个文件并拼接在一起 根据节点里的信息找到文件位置,拿出来 从 ...

  8. 建模杂谈系列81 项目元数据实践3

    说明 这个实践接着前面的总结,结合可用的时间,进行一定的升级. 内容 1 背景 在跑批时,由于目标库的空间不足,导致大约40%的结果没有存入.并且我发现,由于没有做交付的确认(向目标库查询),程序默认 ...

  9. 【业务建模_2】通用数据工具

    [业务建模_2]通用数据工具 背景 在公司做数据工作会接触很多相关工具,这里会汇总一些核心并更理想化的工具. 工具汇总 1.打点平台 module,op,参数数组(s0-s5),常用参数,[实际打点位 ...

最新文章

  1. 办公室影响同事关系的九种行为
  2. 树莓派.系统.官方下载中NOOBS和Raspbian的区别
  3. KingPaper初探Java之方法声明及重载
  4. 技术开发项目收获了什么_有幸入职字节跳动一年,附上百度、字节跳动等后台面经,谈谈我的收获!...
  5. 计算机二级offic考试题库2017,2017年9月计算机二级MSOffice考试题「带答案」
  6. python 面试宝典--集各家之所长,乱七八糟于一体
  7. Flowable 数据库表结构 ACT_HI_COMMENT
  8. 双十一图书大数据:金庸第1,Python第2,学霸们都买了这些书
  9. java 写文件时,输入换行字符.
  10. c语言求两个有序表合成差集代码,两个有序链表求差集,合并为一个有序链表...
  11. 浏览器向服务器发送的消息称为,网络是怎样连接之浏览器的探索之旅读书笔记(一)...
  12. android对接单片机wifi模块
  13. Python如何设置对数log坐标系的range
  14. Matlab 谢尔宾斯基三角形
  15. 程序猿生存指南-55 初为人师
  16. 颈椎护理小助手,轻松缓解颈部酸痛,宾多康智能颈枕按摩器体验
  17. [ vant ] vue移动端下拉刷新组件
  18. 分数化成有限小数的方法_分数化小数的方法|小数化分数题目
  19. 匈牙利命名法(Hungarian)
  20. 一点点对WebResource.axd的配置及使用[原创]

热门文章

  1. 【报告分享】2021上半年移动广告流量观察白皮书-APP GrowingMob研究院七麦数据(附下载)
  2. SQL练习——经典50题
  3. 根据文章中H标签自动生成文章目录
  4. 阿里云消息服务(Message Service)-基本概念
  5. SAP中五个报废率的计算逻辑
  6. android 手机屏幕横屏竖屏切换
  7. 【IntelliJ IDEA教程】提示信息Unmapped Spring configuration files found.Please configure Spring facet. 解决办法
  8. 最新hp笔记本驱动大全
  9. Elasticsearch(ES)简介及基本使用
  10. SG186电力营销业务应用ORACLE数据库复制软件招标公告