乐字节教育是集线上教育与线下培训于一体的全栈式教育机构,致力于研发高端IT技术,培养高端IT人才,让更多的人接受更好的教育是乐字节的教学理念。

最近发现有些同学并不太了解大数据开发工程师这个职位,所以想简单介绍一下什么是大数据开发工程师,当前互联网公司的数据开发到底是什么样子的?和一般的Java或者PHP工程师在工作上有什么区别?

什么不是大数据开发?

  • 仅使用数据库(关系型mysql,sqlserver,oracle等 非关系型 mongo redis等),尽管数据量达到千万级别,亿级别不是大数据开发。
  • 从业务系统的数据库中查询数据然后产出报表不是大数据开。
  • 端上(页面,h5,手机native)埋点上报数据记录到数据库中不是大数据开发。

什么是大数据开发

1. 大数据开发需要的技能

到智联上搜了一下大数据开发工程师这个职位,随便点了几个职位,截图如下:

所以说,现在互联网公司所指的大数据开发用到的工具是:hadoop,hive,hbase,spark,kafka等。

2. 大数据开发做的事情
  • 精简到一个词语就是:统计
  • 精简到两类指标就是:PV和UV
  • 精简到一句话就是:统计各种指标的PV和UV

PC互联网时代,各门户网站(比如:新浪,网易,搜狐)关注的是各自网站今天被打开了几次(pv),今天有多少人(uv)访问了网站。更复杂一点的比如:

  • 页面上某个按钮或者某个连接有多少人点击了几次
  • 某个页面上的热力图(点击地方越多,图上颜色越重)

移动互联网时代,手机应用被用户打开的次数和人数也是大家关注的重点,但是除此之外还多出了许多其他非常重要的数据,由于手机屏幕的限制,信息流成为了移动时代的主流。

各大门户网站非常关注自己的新闻客户端中:在信息流中曝光了多少篇文章,其中有多少篇文章被用户点击了。每篇文章阅读了长时间,因为用户点击的文章越多,使用客户端的时间越长,各公司的广告收入才越高,所以各公司想方设法推荐用户喜欢的内容。

3. 如何做这些事情

因为网站的浏览行为,手机客户端中文章的曝光或者点击这些数据非常大,基本以亿为单位起。所以传统的把统计信息放到数据库中的方式已经不能完成这项统计工作。(例如:wordpress博客中,用户每阅读一篇文章,mysql中就会更新这篇文章的阅读次数+1)

所以大数据是通过日志来统计这些指标。

比如:后台服务的日志(apache,tomcat,weblogic,nginx日志)

主要难点在于:

  • 日志量太大(一般大点的互联网公司,一个业务线每天的日志都有几个t,再大些的每天几十t,几百t也不奇怪),需要掌握大数据相关技术例如前面提到的hadoop,hive等。

  • 数据的及时性,从离线计算来说,一般每天零点,前一天的日志都接收完毕,开始计算前一天的数据,几点能计算完毕?要看各个公司各自的要求。

  • 数据的准确性。(这是重中之重,大数据开发的工作就是统计,统计的数据如果不准…)

  • 如果是实时计算,需要掌握实时相关技术。例如:每5分钟网站的在线人数。

  • 监控监控监控:监控任务是否失败,数据是否产出,产出的数据是否异常。

  • 容灾容灾容灾:如果任务失败如何补救。比如实时任务,由于某种原因13:00到14:00的数据没有,如何把数据补回来。

大数据开发和一般开发对比

在转做大数据开发之前,一直在用Java作业务系统:例如hr系统(考勤,薪资等),收费系统。

谈谈我个人对业务系统开发和大数据开发的理解:

业务系统:

一句话:对数据库的各种增删改查操作。

重点难点在于:

  • 对复杂业务的理解上(比如计算工资:基本工资,五险一金,全勤奖,高温补贴,报销,奖金,加班费…等等都需要计算)。
  • 线上服务的稳定,比如facebook,淘宝等网站高并发的压力下维持网站正常运行。

大数据开发

一句话:对字符串的各种算数。

重难点在于:

  • 数据的及时性。例如实时数据中,想知道 12:00~12:10这10分钟的用户数,如果这个数据在晚上20点才计算完成,那就没什么意义了。再比如,大家应该都有体验过:再手机上刷新闻的时候,你点了某一篇文章,再继续刷新闻,后面很快会出来不少和前面点击的那篇文章类似的文章,这就是根据你的点击给你及时推荐你有更大可能点的东西。
  • 数据的准确性。这个重要性不言而喻
  • 数据的稳定性和容灾。

**学互联网技术不能犹豫,否则你就和高薪擦肩而过了。**不论你是0基础还是转行,都有大牛老师手把手教你学习最新热门技术,找一份自己满意的高薪工作。
该文章转载自乐字节

Java开发工程师与大数据开发工程师有何区别?相关推荐

  1. php 内容采集_php开发工程师和大数据开发工程师有什么区别

    通过岗位职责.工作内容,告诉你php开发工程师和大数据开发工程师的区别?还为你对比php开发工程师和大数据开发工程师的学历要求.经验要求.工资待遇,为你揭晓php开发工程师和大数据开发工程师哪个好? ...

  2. 数据仓库工程师、大数据开发工程师、BI工程师、ETL工程师之间有什么区别?

    商务智能.商务智能工程师是商业智能行业的工程师.从需求分析师到数据仓库架构师.ETL工程师.数据分析工程师.报表开发工程师.数据挖掘工程师等,都可以称为BI工程师. ETL工程师:从事系统编程.数据库 ...

  3. 数据库开发工程师转行大数据开发可以吗?

    对有工作经验想转行大数据开发主要考察三个方面,一是基础,二是学习能力,三是解决问题的能力. 基础很好考察,给几道笔试题做完基本上就知道什么水平了.数据库开发工程师转大数据开发怎么样? 首先给大家普及一 ...

  4. 数据仓库工程师、大数据开发工程师、BI工程师、ETL工程师之间有什么区别?...

    商务智能.商务智能工程师是商业智能行业的工程师.从需求分析师到数据仓库架构师.ETL工程师.数据分析工程师.报表开发工程师.数据挖掘工程师等,都可以称为BI工程师. ETL工程师:从事系统编程.数据库 ...

  5. 大数据开发和java的前景_Java大数据开发前景好吗?

    在IT职业领域,Java一直以来都是占据着非常重要的位置的,而在进入大数据时代之后,Java也再次获得了更好的发展方向.在大数据应用开发当中,Java是重要的编程语言,学大数据需要Java基础.今天我 ...

  6. Java,php,运维工程师转型大数据开发怎么样?你属于哪一类?

    一:java转型大数据 "2019年可能会是过去十年里最差的一年,但却是未来十年里最好的一年".市场发展的受限,不仅波及了各个行业的从业者,就连IT领域也受到了影响,很多IT人开始 ...

  7. python大数据开发工程师_大数据开发工程师的职责

    大数据开发工程师的职责 大数据开发工程师的职责1 职责: 1.负责数据采集.数据存储.数据查询.数据计算等基础平台的设计和开发工作; 2.利用Hadoop.Spark.Flink等技术进行离线和实时数 ...

  8. python开发和大数据开发工程师_大数据开发工程师的岗位职责

    大数据开发工程师负责该领域的业务需求讨论,完成技术方案及数据开发.下面是学习啦小编整理的大数据开发工程师的岗位职责. 大数据开发工程师的岗位职责1 职责: 1.负责所分管团队的团队建设和日常管理工作; ...

  9. 大数据和java就业前景_java大数据开发的就业前景及未来趋势

    有这样一句话叫数据重构商业,流量改变未来.小编带你1分钟解读java大数据开发的就业前景及未来趋势,作为大数据岗位中的 "大熊猫",大数据工程师的收入待遇可以说达到了同类的顶级.j ...

最新文章

  1. Xamarin Essentials教程获取路径文件系统FileSystem
  2. C Implement a string class with basic functionality
  3. python【力扣LeetCode算法题库】11-盛最多水的容器
  4. VTK:IO之3DSImporter
  5. aardio学习笔记-变量与常量
  6. ad批量走线_AD PCB直角布线批量改为圆角,怎么批量修改呢?
  7. 深交所a股证券代码_深市和沪市的股票代码应该怎么区别?
  8. mysql long类型_MySQL数据类型笔记
  9. 传说有位游客在山顶大声谈论着小孤嫁彭郎的故事
  10. Android 显式意图(Intent) 与 隐式意图
  11. sql 的 where 和 having 的区别和用法
  12. drawio二次开发
  13. 混拨vps与单城市拨号vps有什么区别?
  14. GYM 101173 K.Key Knocking(构造)
  15. 《JavaScript学习笔记》
  16. ADC类型和技术指标
  17. 未来计算机的应用方向,计算机应用现状及未来方向
  18. part实现实现单个(上传图片和文件上传)
  19. 香港大学和清华大学计算机,香港大学在我国属于什么水平,有哪些优势、能够和清华北大相比吗...
  20. 基于AprilTag的位姿估计方法

热门文章

  1. 芝麻授权 java调用_【java】手机浏览器怎么调用支付宝进行用户授权呢?
  2. SVN搭建文件服务器
  3. 12个在线网站测速工具——web性能
  4. 【20天快速掌握Python】day10-面向对象基础
  5. 数字逻辑综合工具实践-DC-07 ——综合优化(二)和RTL coding 和DFT
  6. -- 38、查询课程编号为01且课程成绩在80分以上的学生的学号和姓名
  7. gensim相关功能函数及其案例
  8. 如何用python写汉诺塔游戏的辅助
  9. 简单运算器的设计与仿真
  10. react native生成APP报错:You have not accepted the license agreements of the following SDK components: