如果说大数据是每天写sql还不太精准(精准的是用各种方式写SQL)

**当你不创造东西时,你只会根据自己的感觉而不是能力去看待问题。**会不会转别的,看个人兴趣,大数据方向还有那么多。

瞅瞅方向:如数据分析师、大数据开发工程师、大数据分析师、数据开发工程师、大数据架构师、大数据运维工程师、ELT工程师、数据仓库工程师、大数据BI工程师等。

丰富自己的能力,到处都机会。

现如今,正式为了应对大数据的这几个特点,开源的大数据框架越来越多,越来越强,先列举一些常见的:

文件存储:Hadoop HDFS、Tachyon、KFS
离线计算:Hadoop MapReduce、Spark
流式、实时计算:Storm、Spark Streaming、S4、Heron
K-V、NOSQL数据库:HBase、Redis、MongoDB
资源管理:YARN、Mesos
日志收集:Flume、Scribe、Logstash、Kibana
消息系统:Kafka、StormMQ、ZeroMQ、RabbitMQ
查询分析:Hive、Impala、Pig、Presto、Phoenix、SparkSQL、Drill、Flink、Kylin、Druid
分布式协调服务:Zookeeper
集群管理与监控:Ambari、Ganglia、Nagios、Cloudera Manager
数据挖掘、机器学习:Mahout、Spark MLLib
数据同步:Sqoop
任务调度:Oozie

眼花缭乱的上面就有30多种吧,别说精通了,全部都会使用的,估计也没几个。

就我个人而言,主要经验是在第1个方向(开发/设计/架构)

入职了大半年后,经常加班,虽然累但学起来很快,不久就把大数据的相关组件,hadoop,hive,oozie ,shell,sparksql,spark ,sqoop,kylin,等等都学到了,还学会了用python处理数据,shell如何做工具脚本,怎样搭大数据平台,大数据仓库,都有所学习到,自己周末也是拼命的学习,因为在北京,你不努力,随时可能被淘汰。耐下心来慢慢学

关于数仓开发

数仓开发其实主要就是基于数仓模型对数据进行分层建模工作,整合加工数据完成OLAP,数仓分为实时数仓离线数仓两种。如果公司只有离线数仓,那么其实主要的工作内容用sql就可以完成了,可以用hive ql 或者是 spark sql 完成,当然也不排除需要应用到spark 算子去完成相关计算的逻辑,而且一些复杂的逻辑需要通过实现自定义函数来完成,这就要求不但要会写sql,而且还能有一定的代码功底。如果公司对数据的实时性要求比较高,那么还会有实时数仓的业务,实时部分当前比较流行的是flink去做,当然也有spark streaming去做的,这就要求对代码有比较深厚的掌握了。因为数据往往不是存在hive中的,而是hbase、clickhouse等这种实时性较强的内存数据库中,不但实时计算框架的各种api需要熟练掌握,对数据库的底层和调用也要掌握,而且实时数据一般来自消息队列如kafka,所以也需要对消息队列比较熟悉。

之前练过一个数仓项目很有收获,做这个项目电脑内存大点,基本现在工作用的都有讲的,是企业级实时数仓和离线数仓构建,值得一收。数仓实战项目,大数据千亿级数仓实战(离线数仓+实时数仓)_哔哩哔哩_bilibili2021重磅推出数仓项目实战,点赞,投币,收藏是对老师最大的鼓励哈。本课程采用由浅入深,层层递进的讲解方式, 让你轻松掌握企业级数仓架构的搭建及使用, 使用该架构可以胜任企业级实时数仓和离线数仓构建。, 视频播放量 34372、弹幕量 86、点赞数 477、投硬币枚数 269、收藏人数 1879、转发人数 90, 视频作者 黑马程序员, 作者简介 进阶学习、课程体验、就业指导,可联系播妞q:2291329369,相关视频:全网首次披露大数据Spark离线数仓工业项目实战,Hive+Spark构建企业级大数据平台,黑马程序员大数据项目实战教程_大数据企业级离线数据仓库,在线教育项目实战(Hive数仓项目完整流程),clickhouse+flink构建实时数仓,【好程序员】最新大数据用户画像项目教程,一套精通大数据用户画像项目实战,【尚硅谷】电商数仓V4.0丨大数据数据仓库项目实战,2019kettle8.2最新教程,大数据多源数据采集实战【企业实战项目免费首发 ,大数据采集,爬虫,ETL、Flume、Kettle】,离线+实时全栈数仓项目,大数据项目:基于Spark2.x新闻网大数据实时分析可视化系统项目,数仓工程师在大数据职位中优势,为啥up主推荐大数据上岸首选数仓,小伙伴围观![这里是图片002]https://www.bilibili.com/video/BV1bv411x7vr?spm_id_from=333.999.0.0

下面的也一定收藏起来有一天你一定会回来谢谢我的。

大数据-分布式数据存储

  • TiDB:大数据基础-TiDB数据库从入门到实践
  • Redis:2020年最新大数据redis系统教程
  • HBase:黑马程序员大数据教程HBase海量数据存储实战
  • Kafka:黑马程序员Kafka视频教程,大数据企业级消息队列kafka入门到精通

大数据-框架

  • Spark-大数据教程十天系统学习Spark分布式内存计算框架
  • Spark3.0新特性:大数据基础丨轻松掌握Spark3.0新特性
  • Flink:大数据自学精品教程Flink从入门到精通【大数据自学系列教程】
  • NiFi:大数据基础教程小白由浅入深快速掌握Nifi使用【全网首套完整版】
  • 大数据-数据湖架构-大数据新概念数据湖架构开发,大数据最新技术Delta Lake
  • 大数据-技术栈-ElasticStack:黑马程序员大数据教程丨快速掌握上手ElasticStack技术栈

大数据-生态圈工具

  • Azkaban:大数据Azkaban教程丨实现企业级自动化任务开发
  • Flume:大数据Flume教程丨大数据业务及数据采集和迁移需求
  • Hue:大数据Hue开发教程丨构建大数据可视化分析
  • Impala:大数据Impala教程丨构建高性能交互式SQL分析平台
  • Kudu:大数据NoSQL数据库Kudu丨构建高性能随机读写访问的数据存储系统
  • Oozie:大数据生态圈辅助工具Oozie丨实现企业级自动化任务开发
  • Sqoop:大数据Sqoop教程丨从零开始讲解大数据业务及数据采集和迁移需求

大数据项目

  • 疫情防控平台:大数据教程丨从数据爬取到分析再到可视化全流程搭建疫情防控作战平台
  • BI商业分析平台-3天从零快速搭建BI商业大数据分析平台
  • 反爬虫:2020年最新大数据实战教程|反爬虫系统项目实战(Lua+Spark+Redis+Hadoop框架)

电信号:

  • 流量运营分析系统:大数据项目丨企业级网站流量运营分析系统开发实战
  • 智数电商:数仓实战项目,大数据千亿级数仓实战(离线数仓+实时数仓)
  • 千面电商:_大数据实战之用户画像企业级项目,快速进入500强企业的捷径

先自我介绍一下,小编13年上师交大毕业,曾经在小公司待过,去过华为OPPO等大厂,18年进入阿里,直到现在。深知大多数初中级java工程师,想要升技能,往往是需要自己摸索成长或是报班学习,但对于培训机构动则近万元的学费,着实压力不小。自己不成体系的自学效率很低又漫长,而且容易碰到天花板技术停止不前。因此我收集了一份《java开发全套学习资料》送给大家,初衷也很简单,就是希望帮助到想自学又不知道该从何学起的朋友,同时减轻大家的负担。添加下方名片,即可获取全套学习资料哦

大数据开发写sql写烦了,要不要转?相关推荐

  1. 大数据开发,想写代码不给我写,到底是人性的扭曲,还是道德的沦丧?

    从面试到入职,其实中间的过程还是没啥曲折的,offer发得快,毕业后顺理成章的进去了.开始以为做开发,写写spark代码啥的,要不然写写SQL也行-其实不然,啥活都干,就是不写代码!至今已有四月有余了 ...

  2. 拼多多大数据开发工程师SQL实战解析

    不久前,裸考国内知名电商平台拼多多的大数据岗位在线笔试,问答题(写SQL)被虐的很惨,完了下来默默学习一波.顺便借此机会复习一下SQL语句的用法. 本文主要涉及到的SQL知识点包括CREATE创建数据 ...

  3. 一文读懂大数据平台——写给大数据开发初学者的话!

     一文读懂大数据平台--写给大数据开发初学者的话! 文|miao君 导读: 第一章:初识Hadoop 第二章:更高效的WordCount 第三章:把别处的数据搞到Hadoop上 第四章:把Hado ...

  4. 写给大数据开发初学者的话 | 附教程

    导读: 第一章:初识Hadoop 第二章:更高效的WordCount 第三章:把别处的数据搞到Hadoop上 第四章:把Hadoop上的数据搞到别处去 第五章:快一点吧,我的SQL 第六章:一夫多妻制 ...

  5. 写给大数据开发初学者的话

    PS:原文分为五个章节,这里直接合并为一篇文章,原文地址:http://lxw1234.com/archives/2016/11/779.htm 经常有初学者在博客和QQ问我,自己想往大数据方向发展, ...

  6. 写给大数据开发初学者的话5

    见:http://lxw1234.com/archives/2017/01/832.htm 至此,你的大数据平台底层架构已经成型了,其中包括了数据采集.数据存储与计算(离线和实时).数据同步.任务调度 ...

  7. 写给大数据开发初学者的话4

    见:http://lxw1234.com/archives/2016/11/795.htm 如果你已经按照<写给大数据开发初学者的话3>中第五章和第六章的流程认真完整的走了一遍,那么你应该 ...

  8. 写给大数据开发初学者的话3

    前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家.点击跳转到教程. 如果你已经按照<写给大数据开发初学者的话2>中第三章和第四章的流程认真完整的走了一遍,那 ...

  9. 写给大数据开发初学者的话2

    见 : http://lxw1234.com/archives/2016/11/782.htm 如果你已经按照<写给大数据开发初学者的话>中第一章和第二章的流程认真完整的走了一遍,那么你应 ...

最新文章

  1. 为什么在 Verilog HDL 设计中一定要用同步而不能用异步时序逻辑?
  2. 如何将自己的代码放到github上
  3. mysql安装注意步骤,mysql安装步骤
  4. 计算机与生命科学专业排名,2019软科世界一流学科排名发布,54个专业TOP10牛校榜单全给你...
  5. Android 8.0学习(25)---系统的应用图标适配
  6. 滴滴怒怼美团;阿里麻吉宝刷屏;B站、爱奇艺上市 | CSDN 极客头条
  7. 批处理定时执行任务_如何让你的西门子Wincc V14,每天定时自动执行某任务
  8. 天津联通集中备份系统应用
  9. python机器学习搭建空气质量AQI(air quality index)预测模型
  10. Java递归算法经典实例
  11. Dubbo 源码解析 —— Directory
  12. Protus 8.6 及以上如何找到library文件夹
  13. 使用Racket语言给图片添加文字logo
  14. 论文阅读笔记《Low-shot Visual Recognition by Shrinking and Hallucinating Features》
  15. HTMl--基础样式的使用
  16. 大米手机现身了,小米一脸蒙圈?大米好么?好在哪里呢?
  17. Qt 配置使用IPP库
  18. The last dimension of the inputs to `Dense` should be defined. Found `None`.
  19. pdf转图片png的python函数变更
  20. 汇纳科技张宏俊:加强布局AI大数据,为实体商业服务

热门文章

  1. 转SAP MM T-code
  2. 计算机组成原理专有名词对应英文全称
  3. html美化页面的语言,HTML代码美化
  4. 普林斯顿大学计算机科学研究生条件,普林斯顿大学计算机科学硕士专业
  5. 思软协同OA办公系统工作流程解决方案
  6. 数据结构:学生档案管理系统(C++版)
  7. anacoda里面安装包显示失败_解决安装失败!
  8. 阿里短信 ajax,阿里大于-短信验证码接口
  9. 为什么程序员转行之后啥都能干?
  10. 【JAVA学习笔记】