前言:

本书以Hadoop和Spark为核心,阐述了基于这两种通用大数据处理平台的应用开发技术。

在Hadoop生态圈中,从HDFS初识分布式存储系统;以MapReduce详解f分布式计算的步骤;利用HBase分析适合非结构化数据存储的分布式数据库;利用Hive分析将SQL查询转化为分布式计算的过程;并结合项目案例“音乐排行榜”练习Hadoop核心技能点的运用;同时,介绍了几种离线处理系统中常用的辅助工具。

在Spark生态圈中,从Scala开始介绍多范式编程;并从Spark Core、Spark SQL、Spark Streaming三个方面来分析对比Hadoop生态圈中的分布式计算、Hive、 流式计算的可替换方案和它们各自的优势。

设计思路

本书共12章,内容包括Hadoop初体验、Hadoop分布式文件系统、Hadoop分布式计算框架、Hadoop 新特性、Hadoop 分布式数据库、Hadoop 综合实战一音 乐排行榜、数据仓库Hi

五年经验大佬带你掌握 基于Hadoop与Spark的大数据开发实战相关推荐

  1. 【ADS层表-V1】前端页面所需的数据库设计——大数据开发实战项目(五)

    文章目录 前言 TiTan数据运营系统--数据库 表的具体设计 前言 如果你从本文中学习到丝毫知识,那么请您点点关注.点赞.评论和收藏 大家好,我是爱做梦的鱼,我是东北大学大数据实验班大三的小菜鸡,非 ...

  2. 基于 uni-app 和 uni-cloud 小程序项目开发实战

    基于 uni-app 和 uni-cloud 小程序项目开发实战 前言 一.技术栈 二.环境搭建 三.项目功能介绍 1.地图地点搜索及路线规划 2.uniCloud服务空间 3.AI识图 4.上拉框组 ...

  3. go+vue——基于gin框架和gorm的web开发实战

    go+vue--基于gin框架和gorm的web开发实战 gin框架 视频.资料.笔记 安装Go环境, 添加环境变量(可能自动添加好) 下载 Go 环境变量 goland 报错: GOROOT is ...

  4. 移动基于Percona XTRADB Cluster的大数据解决方式

    移动基于Percona XTRADB Cluster的大数据解决方式          一.移动的去IOE之旅      近期由于"棱镜门"事件的曝光.引起了国家对信息安全问题的注 ...

  5. MaxCompute,基于Serverless的高可用大数据服务

    2019年1月18日,由阿里巴巴MaxCompute开发者社区和阿里云栖社区联合主办的"阿里云栖开发者沙龙大数据技术专场"走近北京联合大学,本次技术沙龙上,阿里巴巴高级技术专家吴永 ...

  6. 【项目实战课】人人免费可学!基于Pytorch的图像分类简单任务数据增强实战

    欢迎大家来到我们的项目实战课,本期内容是<基于Pytorch的图像分类简单任务数据增强实战>.所谓项目实战课,就是以简单的原理回顾+详细的项目实战的模式,针对具体的某一个主题,进行代码级的 ...

  7. 基于实战开发垂直搜索引擎_基于DDD的微服务设计和开发实战

    作者:欧创新.邓頔.文艺 你是否还在为微服务应该拆多小而争论不休?到底如何才能设计出收放自如的微服务?怎样才能保证业务领域模型与代码模型的一致性?或许本文能帮你找到答案. 本文是基于 DDD 的微服务 ...

  8. ddd 访问权限_基于DDD的微服务设计和开发实战

    作者:欧创新.邓頔.文艺 你是否还在为微服务应该拆多小而争论不休?到底如何才能设计出收放自如的微服务?怎样才能保证业务领域模型与代码模型的一致性?或许本文能帮你找到答案. 本文是基于 DDD 的微服务 ...

  9. MaxCompute,基于Serverless的高可用大数据服务 1

    为什么80%的码农都做不了架构师?>>>    摘要:2019年1月18日,由阿里巴巴MaxCompute开发者社区和阿里云栖社区联合主办的"阿里云栖开发者沙龙大数据技术专 ...

  10. 使用Java语言开发在线电影推荐网 电影推荐系统 豆瓣电影爬虫 基于用户、物品的协同过滤推荐算法实现 SSM(Spring+SpringMVC+Mybatis)开发框架 机器学习、人工智能、大数据开发

    使用Java语言开发在线电影推荐网 电影推荐系统 豆瓣电影爬虫 基于用户.物品的协同过滤推荐算法实现 SSM(Spring+SpringMVC+Mybatis)开发框架 机器学习.人工智能.大数据开发 ...

最新文章

  1. 当个新手很幸福!网络创业之新手小白一样可以吸粉又赚钱
  2. 永洪Desktop关于MAC系统使用问题
  3. 批量修改Service Order description的report
  4. 判断一个无符号整数是不是2的幂
  5. stm32f429vref怎么接_STM32如何通过内部VREF得到实际的VDDA值
  6. 启动不起来_电脑启动不起来该怎么办
  7. windows环境下unicode编程总结
  8. Python 函数参数 传引用还是传值
  9. 生成式对抗网络GAN汇总
  10. Ackerman阿克曼函数的递归与非递归(栈)实现
  11. mysql基础-基本的命令行操作
  12. html5 心形照片墙,教你两种“心形拼图”法|制作照片墙,3分钟搞定!
  13. 策略路由(Policy-Based-Route)
  14. wxformbuilder软件制作gui界面教程
  15. Redis缓存过期策略
  16. 一套系统让打工人瑟瑟发抖,监控员工离职动态。
  17. telnet 正在连接127.0.0.1:9123...无法打开到主机的连接。 在端口 23: 连接失败
  18. CDN+P2P直播应用
  19. Nginx实战应用--对于构建虚拟主机,Socket的作用,你学废了吗?
  20. 宁波三中机器人_宁波三中三个男生做了个机器人 获奥林匹克中国总决赛冠军...

热门文章

  1. android-759b1c是什么,可分离Android操作系统报告:硬件环境检测文件(三)(分析)...
  2. java培训后能掌握哪些技能?
  3. Soft Skills: The software developer‘s life manual
  4. 【论文解读】语义分割医学图像分割论文合集
  5. GraphSPD: Graph-Based Security Patch Detection with Enriched Code Semantics
  6. UE4和C++中的UI第一篇(摆放ui和让UI可以写上逻辑)
  7. 2021年全球与中国汽车ACC系统行业市场规模及发展前景分析
  8. 大数据学习(二十二)hive中sort by、cluster by、order by的区别
  9. Win10安装3.5无法安装.net framework 3.5
  10. IBM联手Hacera推出基于区块链网络的分布式“黄页”系统