MapReduce课后练习
1【单选题】
下列说法错误的是________。
A、Map函数将输入的元素转换成<key,value>形式的键值对
B、Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写
C、不同的Map任务之间不能互相通信
D、MapReduce框架采用了Master/Slave架构,包括一个Master和若干个Slave
2【单选题】
在使用MapReduce程序WordCount进行词频统计时,对于文本行“hello hadoop hello world”,经过WordCount程序的Map函数处理后直接输出的中间结果,应该是下面哪种形式________。
A、<“hello”,1>、<“hello”,1>、<“hadoop”,1>和<“world”,1>
B、<“hello”,1,1>、<“hadoop”,1>和<“world”,1>
C、<“hello”,<1,1>>、<“hadoop”,1>和<“world”,1>
D、<“hello”,2>、<“hadoop”,1>和<“world”,1>
3【单选题】
在词频统计中,对于文本行"hello hadoop hello world",经过WordCount的Reduce函数处理后的结果是________。
A、<“hello”,2><“hadoop”,1><“world”,1>
B、<“hadoop”,1><“hello”,2><“world”,1>
C、<“hello”,1,1><“hadoop”,1><“world”,1>
D、<“hadoop”,1><“hello”,1><“hello”,1><“world”,1>
4【单选题】
关于Hadoop MapReduce的叙述错误的是________。
A、MapReduce采用“分而治之”的思想
B、MapReduce的输入和输出都是键值对的形式
C、MapReduce将计算过程划分为Map任务和Reduce任务
D、MapReduce的设计理念是“数据向计算靠拢”
5【单选题】
Hadoop MapReduce计算的流程是________。
A、Map任务—Shuffle—Reduce任务
B、Map任务—Reduce任务—Shuffle
C、Reduce任务—Map任务—Shuffle
D、Shuffle—Map任务—Reduce任务
6【单选题】
编写MapReduce程序时,下列叙述错误的是______。
A、reduce函数所在的类必须继承自Reducer类
B、map函数的输出就是reduce函数的输入
C、reduce函数的输出默认是有序的
D、启动MapReduce进行分布式并行计算的方法是start()。
7【多选题】
下列关于传统并行计算框架(比如MPI)和MapReduce并行计算框架比较正确的是__ABCD______。
A、前者相比后者学习起来更难
B、前者是共享式(共享内存/共享存储),容错性差,后者是非共享式的,容错性好
C、前者适用于实时、细粒度计算、计算密集型,后者适用于批处理、非实时、数据密集型
D、前者所需硬件价格贵,可扩展性差,后者硬件便宜,扩展性好
8
【多选题】
MapReduce体系结构主要由哪几个部分组成___ABCD_____。
A、TaskTracker
B、Task
C、JobTracker
D、Client
9
【多选题】
对MapReduce的体系结构,以下说法正确的是___ABCD_____。
A、分布式编程架构
B、以数据为中心,更看重吞吐率
C、分而治之的思想
D、将一个任务分解成多个子任务
10
【多选题】
MapReduce为了保证任务的正常执行,采用________等多种容错机制。
A、重复执行
B、重新开始整个任务
C、推测执行
D、直接丢弃执行效率低的作业
11
【多选题】
关于MapReduce的shuffle过程,叙述正确的是___ABCD_____。
A、Shuffle分为Map任务端的Shuffle和Reduce任务段的Shuffle
B、Map任务的输出结果不是立即写入磁盘,而是首先写入缓存
C、并非所有场合都可以使用合并操作
D、每个Reduce任务真正开始之前,大部分时间都在从Map端领取所需的数据
12
【判断题】
MapReduce设计的一个理念就是“计算向数据靠拢”,而不是“数据向计算靠拢”,因为,移动数据需要大量的网络传输开销。
答案:√
13
【判断题】
两个键值对<“hello”,1>和<“hello”,1>,如果对其进行归并(merge),会得到<“hello”,<1,1>>,如果对其进行合并(combine),会得到<“hello”,2>。
答案:√
14
【判断题】
HDFS集群开始启动时,其处于安全模式,可以进行读操作,不能进行写操作。
答案:√
15
【判断题】
HDFS是分布式文件系统,其命名空间包括块、目录和文件。
答案:√
16
【判断题】
Map的主要工作是将多个任务的计算结果进行汇总。
答案:×
17
【判断题】
在Hadoop中每个应用程序被表示成一个作业,每个作业又被分成多个任务,JobTracker的负责作业的分解、状态监控以及资源管理。
答案:√
MapReduce课后练习相关推荐
- 《大数据技术原理与应用》(第七章 MapReduce 课后答案)
第七章 MapReduce 参考资料 1.林子雨_大数据技术原理与应用课后习题_NPU_阿夏的博客-CSDN博客 2.林子雨编著<大数据技术原理与应用(第3版)>教材官网_厦门大学数据库 ...
- mapreduce之partition分区
听了超哥的一席课后逐渐明白了partition,记录一下自己的理解!(thanks 超哥) package partition;import java.io.IOException; import j ...
- mapreduce的规约(Combiner)
听了超哥的一席课后逐渐明白了Combiner,记录一下自己的理解!(thanks 超哥) 首先贴上两段代码: code1: package combine;import java.io.IOExcep ...
- 《大数据基础——基于Hadoop与Spark》课后习题——第一章部分答案
仅用于我个人的学习.书籍为人民邮电出版社的<大数据技术基础--基于Hadoop与Spark>.课后习题选择是我个人认为有用的.记录下来是为了督促我学习:) 共好 1.请指出以下术语的基本含 ...
- HCIA-Big Data华为认证大数据工程师 课程笔记 + 课后习题
点击进入习题专辑(含答案) 文章目录 一.大数据发展趋势与鲲鹏大数据 导读 大数据时代的机遇与挑战 华为鲲鹏解决方案 课后习题 二.HDFS分布式文件管理系统和ZooKeeper 导读 HDFS分布式 ...
- Spark课后练习来了
Spark课后练习来了 想要筑建高楼,必先打好地基.学好基础才是走向大牛的关键.废话不多说,各位,请接题. 不好意思,拿错了.下边的才是 ↓ ↓ ↓ 文章目录 Spark课后练习来了 1.创建一个1- ...
- 云计算导论(第2版)课后题答案
云计算课后习题答案 第1章 1.6 习题 1.美国国家标准与技术研究院(NIST)是如何定义云计算的? 答案:云计算是一种按使用量付费的模式,这种模式提供可用的.便捷的.按需的网络访问, 进入可配置的 ...
- 【NoSQL数据库技术与应用】【课本代码】【课后题答案】【持续更新】
文章目录 一.课本代码 第1章 初识NoSQL 第2章 文档存储数据库MongoDB 第3章 MongoDB数据库操作 3.8 使用Java操作MongoDB 1.搭建JAVA环境 (1)Java配置 ...
- 大数据课程——课后练习3
大数据课程--课后练习3 1.请简述Spark的主要组件及其主要功能. Spark Core:该组件是Spark的核心模块,主要包含两个功能:一是负责任务调度.内存管理.错误恢复与存储系统交互等:二是 ...
最新文章
- AWS — AWS ECS
- linux内核之accept实现
- linux系统路由功能记录
- Javascript的怪癖
- idea报Can’t Open Local Terminal
- python3.7不能用_解决Python3.7.0 SSL低版本导致Pip无法使用问题
- lisp钢管_技术专栏集合管道模式(上)
- CSU 1027 Smallbox魔方
- python计算文件大小的方法_使用Python计算目录的大小?
- iphone 制作在线播放器
- hashcode和equals方法详细解析, hashmap对于hashcode方法的使用
- I2C总线协议原理介绍
- 电压源和电流的关联参考方向_什么是电流,电压的关联参考方向?
- 基于python 爬虫的数据库设计开题报告_爬虫开题报告
- 1000. 合并石头的最低成本
- 数理统计——AQI预测
- Android8.0 WIFI ap Tethering 相关知识
- apidoc 自动化生成 api接口文档
- 从零开始学WEB前端——CSS基础
- ColumnTransformer()函数
热门文章
- Matrix.postScale
- Python 能写游戏吗?有没有什么开源项目?
- 同样是做物联网,新华三有什么不同?
- ‘A’ is an inaccessible base of ‘B’解决方案
- Activiti流程引擎
- app软件著作权版权和上架经验分享
- 巨头间的战争,我眼中的的“淘宝为什么屏蔽百度抓取”
- 编号或者编码自动生成
- java date now_Date now=new Date()方法获取时间为什么不对,求大神指教!!!
- 怎样用DDX选强势股