​hadoop作为大数据的基础框架组件,其包括hdfs,mapreduce和yarn三大组件。为了方便开发环境进行本地开发和测试,可以在windows环境搭建hadoop环境。

1. 下载文件

http://archive.apache.org/dist/hadoop/core/hadoop-2.7.7/
https://github.com/steveloughran/winutils

2. 执行解压和配置

2.1 配置文件core-site.xml

<configuration><property><name>fs.defaultFS</name><value>hdfs://192.168.22.56:9000</value></property>
</configuration>

这里配置hdfs的端口为9000,也可以根据实际情况,配置为其它的端口。

2.2 修改配置文件hdfs-site.xml

<configuration><property><name>dfs.replication</name><value>1</value></property><property><name>dfs.namenode.http-address</name><value>192.168.22.56:50070</value></property><property>  <name>dfs.namenode.name.dir</name>    <value>/D:/sdks/hadoop-2.7.7/data/dfs/namenode</value></property><property>   <name>dfs.datanode.data.dir</name>    <value>/D:/sdks/hadoop-2.7.7/data/dfs/datanode</value>    </property>
</configuration>

这里配置的web界面地址为50070,可以通过浏览器在该端口访问hdfs。

2.3 重命名mapred-site.xml.template为mapred-site.xml

<configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property><property><name>mapred.job.tracker</name><value>hdfs://192.168.22.56:9001</value></property>
</configuration>

2.4 修改配置文件yarn-site.xml

<configuration><!-- Site specific YARN configuration properties --><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.nodemanager.aux-services.mapreduce.shuffle.calss</name>     <value>org.apache.hadoop.mapred.ShuffleHandler</value></property></configuration>

3. 初始化及启动

3.1 格式化namenode的hdfs

hdfs namenode –format

3.2 启动所有服务

在sbin目录下找到start-all.cmd并执行

start-all.cmd

3.3 查看运行服务

jps
D:\sdks\jdk1.8.0_191\bin>jps
37828 QuorumPeerMain
45828 NodeManager
53748 Jps
10168 ResourceManager
42060 NameNode
56156 DataNode

3.4 查看Web页面

http://localhost:50070/

这里因为网络更换原因,截图的ip地址有所不同。

http://localhost:8088/

4. 测试和使用

4.1 创建hdfs的目录

在bin目录下,执行下面的命令。

hadoop fs –mkdir /user
hadoop fs –mkdir /user/input

4.2 上传文件

hadoop fs –put e:/test.txt /user/input

查看文件内容:

hadoop fs –cat /user/input/test.txt

4.3 执行mapreduce任务

hadoop jar D:/sdks/hadoop-2.7.7/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.7.jar wordcount /user/input/ /user/output

4.4 查看执行结果

windows安装部署hadoop 2.7.7相关推荐

  1. CentOS 7.4 安装部署 hadoop 2.6 文档 V1.3

    ########################################################################## ################ CentOS 7 ...

  2. Geoserver Windows 安装部署教程

    Geoserver Windows 安装部署教程 JRE 安装部署 不论是基于tomcat部署geoserver,还是直接安装geoserver的二进制文件,都需要Java环境,geoserver可以 ...

  3. Nginx windows安装部署

    一.Nginx简介 Nginx (engine x) 是一个高性能的HTTP和反向代理服务器,也是一个IMAP/POP3/SMTP服务器.Nginx是由伊戈尔·赛索耶夫为俄罗斯访问量第二的Ramble ...

  4. MediaWiki在Windows安装部署——部署mediawiki

    前置条件: XAMPP安装:https://blog.csdn.net/henni_719/article/details/86357949 配置phpMyAdmin:https://blog.csd ...

  5. Nginx 反向代理 Windows安装部署教程

    一.Nginx简介 Nginx (engine x) 是一个高性能的HTTP和反向代理服务器,也是一个IMAP/POP3/SMTP服务器.它也是一种轻量级的Web服务器,可以作为独立的服务器部署网站( ...

  6. putty上传文件到linux_基于windows安装部署putty小工具及相关功能介绍

    概述 PuTTY是一个Telnet.SSH.rlogin.纯TCP以及串行接口连接软件.较早的版本仅支持Windows平台,在最近的版本中开始支持各类Unix平台,并打算移植至Mac OS X上.除了 ...

  7. Cloudera Manager 4.6 安装部署hadoop CDH集群

    Cloudera Manager 4.6 安装详解 1. Cloudera Manager介绍 1.1. 功能介绍 Cloudera Manager是一个针对hadoop集群的管理工具,功能包括:cd ...

  8. 1_node for windows 安装部署

    Node.js 安装配置 本章节我们将向大家介绍在 Windows 和 Linux 上安装 Node.js 的方法. 本安装教程以 Node.js v4.4.3 LTS(长期支持版本)版本为例. No ...

  9. Hadoop伪分布式集群的安装部署

    Hadoop伪分布式集群的安装部署Hadoop伪分布式集群的安装部署 首先可以为Linux虚拟机搭建起来的最初状态做一个快照,方便后期搭建分布式集群时多台Linux虚拟机的准备. 一.如何为虚拟机做快 ...

最新文章

  1. IDEA2021.3.2拉取maven报错maven-default-http-blocker解决方法
  2. Kaggle神器LightGBM最全解读!
  3. linux远程安装本机软件,我的电脑怎样让对方远程装软件?
  4. jQuery知识简介
  5. CUDA函数库调用问题解决
  6. [USACO Mar08] 牛跑步 --k短路
  7. Docker for Windows 中文文档(3)——Docker Settings
  8. 下面属于javascript内部对象的有_JavaScript quot;thisquot;原理-转载阮一峰
  9. PythonCookbook读书笔记
  10. 校友全剧透CMU :ME + 转CS + 其他主要项
  11. 入门HTML之表格入门基本属性
  12. C++ Boost库分类总结
  13. CAJViwer安装提示:请求的操作需要提升
  14. chrome浏览器最新离线版下载 30-72版本全
  15. 漫步者蓝牙只有一边有声音_为什么我蓝牙耳机只有一边有声音?
  16. 购物清单(Python实现)
  17. 解决uniapp静态文件字体包太大打包大小超出限制
  18. js检测开发者工具是否打开 防止别人调试代码
  19. Elasticsearch API接口介绍
  20. 大数据培训技术使用spark对phoenix的读写

热门文章

  1. 让我们使用JavaScript制作一个可以正常工作的Guitar
  2. 合创视觉学ui设计作品集包含哪些内容?
  3. 新大陆C/C++开发实习生面试
  4. 如何按签收时间筛选快递单号并导出
  5. PDB Database - AlphaFold DB PDB 数据集的多维度分析与整理 (2)
  6. 数据分析进阶 - 相关分析(卡方检验)
  7. 二次美化自采集壁纸网站源码
  8. x86汇编语言复习总结
  9. openGL-梁友栋-Barsky算法
  10. 科技新品 | 军规级户外运动智能手表;本田赛车合作款金属计时表;富士影像数字印刷设备...