0x00 前言

最近遇到了一些朋友在群里讨论数据有哪些工作内容,看了一些讨论后总感觉不是很全面。今晚就顺便整理一波居士自己对数据工作内容的理解,这次会从数据团队的角度出发有哪些工作内容,希望能帮助大家理清思路。

0x01 数据团队的工作内容

鉴于很多从业人员和招聘信息上对一些名词的理解是不同的,居士对每个工作内容都会加入一些自己的说明。个人意见,仅供参考:

  • 数据平台建设

    • 大数据平台开发:

      主要包括的大数据平台搭建和二次开发

    • 数据系统开发:

      主要包括调度系统、元数据系统、数据接入系统等开发

    • 大数据平台运维:

      一般来讲主要是大数据集群的运维和运营

    • ETL开发:

      主要负责数据的接入和清洗工作

  • 数据公共服务

    • 数据埋点:

      数据埋点相关工作

    • 数据仓库:

      主要包括数据仓库的模型设计,也会包括元数据管理和数据治理相关的内容

    • 用户画像:

      主要包括用户画像体系的建设

  • 数据分析相关

    • 数据报表开发:

      主要就是各种报表开发

    • 业务分析:

      一般指运营或产品的idea验证、临时提取数据等需求

    • 数据分析:

      除了为运营或产品提供支持外,还需要专业的数据分析来分析整个公司的数据情况,一般来讲属于更中立一点的角色

  • 数据挖掘相关

    • 数据挖掘:

      和数据分析的工作有重合,一般来讲,数据分析跟多应用统计相关的技能,数据挖掘会多一些机器学习算法相关的技能

    • 机器学习:

      一般来讲是推荐系统、广告系统和lookalike系统这类便算法相关的工作内容,算法和工程都有

  • 数据产品

    • 数据产品规划:

      数据产品从理论上来讲会参与到数据开发相关的各个环节,但,更侧重产品规划

    • 数据运营:

      仍然是运营,但是会多一些数据的驱动

本来想画一个思维导图来组织内容,但是还没有想清楚比较好的组织方式,因此先罗列出来,后续再来改进。

0x02 闲谈

受欢迎程度

从受欢迎程度上来讲,机器学习相关的工作内容受欢迎程度最高,因为它的技术深度更深,同时更为流行。

大数据平台开发在13年-15年的时候,受欢迎程度同样很高的,近些年热度稍减。而且,随着 Hadoop 生态系统的成熟,大部分大数据平台开发的同学会逐步变为数据平台运营。

相对来讲,数据仓库属于一直不温不火的状态,但是随着数据行业逐渐理性,大家不再只关注搭建数据平台,而是开始关注数据的管理,数据仓库也开始受到了一定的重视。居士明显感觉了不少公司在经历了数据平台建设后,开始关注数据仓库的搭建。

重要程度

从重要程度上来讲,居士认为数据质量是最重要的,数据的准确性是保证所有数据价值的生命线,如果数据质量不能得到保证,那么一切数据结论都是不可信的。

因此,从数据质量的角度来看,数据仓库是最重要的,好的数据仓库设计能保证公司的数据质量。

0xFF 总结

关于数据团队的思考,将会是一个系列的文章,很多观点可能不成熟,但是居士会不断更新自己对于这个话题的认知,同时不断更新这个系列的文章。

那么,你自己的工作是属于文中描述的哪一部分或者是哪几部分呢,你对数据团队的工作内容又有什么自己的看法呢?

更多内容:

关于「数据分析师」的一些理解

数据分析师做成了提数工程师,该如何破局?

警惕,导致数据仓库失败的六大原因!你占了几条?

闲聊数据库和数据仓库的区别

数据对业务价值帮助的一些思考

数据仓库实践之业务数据矩阵的设计

漫谈数据仓库和范式

一种通用的数据仓库分层方法

《七天数据埋点之旅》指引篇

遇到不喜欢的工作,该怎么办?

数据团队思考:数据团队的工作内容相关推荐

  1. 大数据工程师岗位工作内容是什么

    如果你是大数据新人,或者想转行进入大数据领域,或者职业生涯上存在一些疑惑,大数据相关工作岗位很多,有大数据分析师.大数据挖掘算法工程师.大数据专家.大数据总监.大数据研究员.大数据科学家等等.接下来我 ...

  2. 数据科学工作者(Data Scientist) 的日常工作内容包括什么?

    作者:阿萨姆 众所周知,数据科学是这几年才火起来的概念,而应运而生的数据科学家(data scientist)明显缺乏清晰的录取标准和工作内容.即使在2017年,数据科学家这个岗位的依然显得" ...

  3. 百分点大数据技术团队:数据治理“PAI”实施方法论

    数据作为第五大生产要素,已逐渐成为政府和企业决策的重要手段与依据.面对数据多样化.数据需求个性化.数据应用智能化的需求,以及在2B和2G行业中数据质量参差不齐.数据应用难以发挥价值.数据资产难以沉淀等 ...

  4. 多表拆解 | 数据PM的工作内容

    本文由作者 董小矿 于社区发布 数据产品经理的工作内容有哪些?下文是根据自己在一家内容服务公司的相关工作经历,总结出的有关数据产品经理的工作思路.工作内容.之前一篇文章介绍了我司数据体系搭建过程,见: ...

  5. 数据草拟:使您的团队热爱数据的研讨会

    Learn the rules to Data Draw Up; a fun way to get your teams invested in data. 了解数据收集的规则: 一种让您的团队投入数 ...

  6. 极简实现 TiDB 冷热数据分层存储 | He3 团队访谈

    参加 Hackathon 可以接触到内核.工具.生态各个领域中志同道合的小伙伴,通过他们的项目学习到非常好的创意.大家的想法都很奇妙,充满了创新力,在平时的研发过程中,很少能接触到这些,Hackath ...

  7. 数据分析师的具体工作职责和工作内容有哪些?

    我和我们数据分析师总监深入聊了一下,这个答案不仅会和大家聊一下工作内容和工作职责,还会真心实意的和大家聊下这个工作是不是像想象中那么光鲜,有什么大家其实没想到的工作,其实很重要,也很闹心,也很有成长. ...

  8. Google 数据可视化团队:数据可视化指南(中文版)

    写在前面 今天分享一份谷歌数据可视化团队形成的一套全面的数据可视化指南, 涵盖了设计原则.图表分类.图表的选用.样式设计.交互设计.仪表板设计等方面. 数据可视化 数据可视化就是用图形描绘信息. 原则 ...

  9. vue获取当前选中行的数据_Vue编程的团队代码规范

    来源:https://www.javascriptcn.com/read-5ecef0f64d553e7cc39e1aba.html 规范与每个团队和个人都是息息相关的,因为其影响的不只是只是代码的维 ...

最新文章

  1. 设置超链接的HTML标签是______,如何对a超链接标签中包含的HTML标签进行样式设置...
  2. php 修改select标签,JS修改input,textarea,select标签的可读可写属性
  3. java的printf语法_java printf的一些常用的打印格式总结
  4. Maximum.TV 发布西班牙语Silverlight TV网站
  5. Mycat 安装配置
  6. PHP Reflection与依赖注入
  7. String类中的常用方法
  8. Nokia Imaging SDK滤镜使用入门
  9. chromium中的性能优化工具syzyProf
  10. hdu 5441 Travel (2015长春网赛)
  11. plsqldev连接远程oracle
  12. 临时邮箱获取验证信息
  13. python生成器详解
  14. 397. 整数替换【我亦无他唯手熟尔】
  15. Pygame实战:BOOM 这有一款超刺激的扎气球游戏等你来玩~
  16. 击败26个硕士,本科生“歪门邪道”月薪过万
  17. 特征工程(1)特征工程的简介
  18. JavaSE_笔试题_判断题1
  19. 安装、升级pip,但是python -m pip install --upgrade pip报错的解决办法
  20. RGB颜色空间和CIELab颜色空间互换(matlab代码)

热门文章

  1. 温商机器人企业_两大温商企业集团实现“上市公司集群化”
  2. ps -ef | grep mysql_ps -ef | grep使用详解
  3. Android手机平台的软件管家
  4. 403 (forbidden)
  5. linux下yum搭建lamp,linux下Yum搭建lamp网站架构
  6. moto+早期android手机,中坚力量:摩托罗拉XT701
  7. 暑假投影仪选购攻略!当贝F3和坚果J10,哪一款表现更出众?
  8. Windows下NTFS无损转换FAT32格式
  9. 高通骁龙660vs骁龙653性能提升点有哪些?
  10. vue 画一个小圆点