读流程详述

以hadoop fs -get /a.txt /root为例,三副本,文件切成了三个block,分别存放在三台DataNode上。

1.客户端发起下载文件请求。

2.NameNode收到请求后,进行权限检查以及文件目录检查。

3.获取文件的block信息,由于block是三副本,所以会按网络情况进行排序获得主机列表。

4.将三个block的主机列表返回给客户端。之所以返回主机列表是担心只返回一台主机,万一网络出了故障就无法取数据了。

5.客户端同时和三个DataNode建立pipeline(这里只是为了说明过程,而假定的返回的最优主机是三台,实际有可能是一台或者两台,也就是说比如三个block都从DataNode1上取)

6.分别按package为单位读取block。

7.读取完成后,在本地进行合并。

面试问题

1.请简述HDFS读流程

客户端发起读请求,NameNode进行权限检查以及文件目录检查,之后获取block的主机列表返回给客户端。客户端和每个列表的第一台主机建立pipeline开始读数据。读完后在本地合并。

(面试经典问题)HDFS下载文件(读)流程相关推荐

  1. HDFS设计思路,HDFS使用,查看集群状态,HDFS,HDFS上传文件,HDFS下载文件,yarn web管理界面信息查看,运行一个mapreduce程序,mapreduce的demo

    26 集群使用初步 HDFS的设计思路 l 设计思想 分而治之:将大文件.大批量文件,分布式存放在大量服务器上,以便于采取分而治之的方式对海量数据进行运算分析: l 在大数据系统中作用: 为各类分布式 ...

  2. HDFS设计思路,HDFS使用,查看集群状态,HDFS,HDFS上传文件,HDFS下载文件,yarn web管理界面信息查看,运行一个mapreduce程序,mapreduce的demo...

    26 集群使用初步 HDFS的设计思路 l 设计思想 分而治之:将大文件.大批量文件,分布式存放在大量服务器上,以便于采取分而治之的方式对海量数据进行运算分析: l 在大数据系统中作用: 为各类分布式 ...

  3. F2FS源码分析-2.3 [F2FS 读写部分] F2FS的一般文件读流程分析

    F2FS源码分析系列文章 主目录 一.文件系统布局以及元数据结构 二.文件数据的存储以及读写 F2FS文件数据组织方式 一般文件写流程 一般文件读流程 目录文件读流程(未完成) 目录文件写流程(未完成 ...

  4. 客户端从服务端下载文件的流程分析

    客户端从服务端下载文件的流程分析: 浏览器发送一个请求,请求访问服务器中的某个网页(如:down.php),该网页的代码如下. 服务器接受到该请求以后,马上运行该down.php文件 运行该文件的时候 ...

  5. 快手Android上机面试:设计一个下载文件的框架

    设计文件下载 一个开放的上机面试题,快手第一面就问到这个,听起来很随意,让你能想到什么就写什么,但我觉得没那么简单,我总结面试官考的是以下几点吧: 第一:考文件下载功能的实现 第二:考代码习惯,代码风 ...

  6. 使用 Xshell7 从远程服务器下载文件的流程【图示】

    一.下载 Xshell7 如下Xshell的介绍来自于:Linux系列 -- XShell破解版安装教程 - Donner - 博客园 ​ 下载地址: XShell - DownloadXShell, ...

  7. hadoop 提高hdfs删文件效率----hadoop删除文件流程解析

    前言 这段时间在用hdfs,由于要处理的文件比较多,要及时产出旧文件,但是发现hdfs的blocks数一直在上涨,经分析是hdfs写入的速度较快,而block回收较慢,所以分心了一下hadoop删文件 ...

  8. hdfs读写流程_深度探索Hadoop分布式文件系统(HDFS)数据读取流程

    一.开篇 Hadoop分布式文件系统(HDFS)是Hadoop大数据生态最底层的数据存储设施.因其具备了海量数据分布式存储能力,针对不同批处理业务的大吞吐数据计算承载力,使其综合复杂度要远远高于其他数 ...

  9. Hadoop 核心编程之 HDFS 的文件操作

    前言 本文并没有打算介绍 HDFS 的读写流程,虽然这是一块比较重要的内容.如果你感兴趣,可以去搜索相关资料.如果一遍没有看懂,请看第二遍. 本文还是以代码为主,并附以简短的说明,帮助你理解代码的逻辑 ...

最新文章

  1. Sublime Text 自动换行
  2. WCF4.0新特性体验(3):标准终结点(Standard Endpoints)
  3. 全国铁路查询系统_火车票查询时刻表 全国列车时刻表 火车时刻表查询系统使用说明...
  4. mysql数据库元表_mysql中元数据库information_schema学习之TABLES表
  5. 【QGIS入门实战精品教程】4.7:QGIS如何将矢量数据转为GeoJSON格式?
  6. 分治算法求最大最小值c语言,[蓝桥杯][算法提高VIP]和最大子序列 (C语言代码)分治法...
  7. Yahoo,希望你和微软Bing能过的幸福
  8. int基本类型变成Integer包装类
  9. 以命令行的方式运行activity
  10. JavaScript符号基础
  11. iTunes 11.2更新下载:改善播客阅读
  12. 808协议与php通讯,车载808协议对接、交通部794对接、部标808协议809协议对接
  13. Ubuntu 16.04 安装caffe(CPU)以及编译问题处理
  14. 木兰当事人回应!承认部分基于 Python 二次开发
  15. Ant design vue pro 添加多页签
  16. 程序员读《三体》后看到了什么?
  17. github用相对路径显示图片_【图文详解】如何利用Github在Markdown中插入图片?
  18. 苦尽甘来 一个月学通JavaWeb(三十五 数据库)
  19. 2. ansible常用模块
  20. WebShell箱子简介与原理

热门文章

  1. Hadoop系列 (三):HDFS详细介绍
  2. mysql数据类型转换
  3. 程序设计:蒜头君的数轴
  4. 中国“红客联盟”有多厉害?一场大决战,攻占美国1600多个网站!
  5. 微信公众号如何接入ChatGPT机器人
  6. ‘utf-8‘ codec can‘t decode byte 0xb9 in position 24: invalid start byte
  7. 10. Windows窗体
  8. 用keil刚打开项目后,跳出的与pdsc文件相关的错误解决方法
  9. 算法提高 质数的后代(合数为两个素数的乘积)
  10. Non-terminating decimal expansion; no exact representable decimal result