前言

本篇博客内容是在虚拟机的CentOS7系统上搭建Hadoop集群的步骤,Hadoop集群的节点分为namenode和datanode,namenode可以看作是Hadoop的master节点,datanode可以看作是node节点,一个集群一般由一个namenode和多个datanode组成

一.准备工作

1.1 修改主机名

修改network文件vi /etc/sysconfig/network,添加配置
主节点配置:

NETWORKING=yes
HOSTNAME=hadoop-master

node点配置:

NETWORKING=yes
HOSTNAME=hadoop-node01

1.2 配置主机名和IP的映射关系

修改hosts文件vi /etc/hosts

1.3 配置静态ip

我的另一篇博客有配置静态ip的方法CentOS7和Ubuntu16设置静态ip的方法

1.4 关闭防火墙


查看防火墙状态

firewall-cmd --state

关闭防火墙

systemctl stop firewalld.service

禁止防火墙开机自启

systemctl disable firewalld.service

二.Hadoop集群搭建

在Hadoop集群的namenode和datanode的安装方式是相同的,但启动方式不同,namenode和datanode均需要进行以下步骤进行安装

2.1 安装jdk

首先上传jdk压缩包并解压
修改配置文件profilevim /etc/profile
添加以下内容,JAVA_HOME要改成你的jdk的位置,可以cd进jdk所在文件夹然后使用pwd命令

export JAVA_HOME=/usr/local/application/JDK/jdk1.8.0_11
export PATH=$PATH:$JAVA_HOME/bin

重新加载配置文件

source /etc/profile

2.2 安装Hadoop

上传Hadoop压缩包并解压,Hadoop解压完成后,只需要修改Hadoop中的五个配置文件即可,五个配置文件均在Hadoop中的etc/hadoop目录下,master节点和node节点的配置相同,均需要进行以下步骤的配置

1.hadoop-env.sh

修改export JAVA_HOME的配置,原来的配置为{JAVA_HOME},这样是得不到jdk的地址的,将其删除,改为jdk所在的绝对路径

export JAVA_HOME=/usr/local/application/JDK/jdk1.8.0_11

2.core-site.xml

添加两条配置,第一条指定Hadoop所使用的文件系统schema(URI),指定NameNode的地址,第二条指定hadoop运行时产生文件的存储目录,指定为Hadoop根目录下的tmp文件。我的Hadoop所在路径为/usr/local/application/hadoop/hadoop-2.6.4/

<property><name>fs.defaultFS</name><value>hdfs://hadoop-master:9000</value>
</property>
<property><name>hadoop.tmp.dir</name><value>/usr/local/application/hadoop/hadoop-2.6.4/tmp</value>
</property>

注意要在两个configuration标签之间添加配置

3.hdfs-site.xml

这条配置用于指定HDFS副本的数量,默认是3

<property><name>dfs.replication</name><value>2</value>
</property>

4.mapred-site.xml

由于sbin目录下是没有直接给出mapred-site.xml文件的,所以要先用命令创建一个mapred-site.xml文件mv mapred-site.xml.template mapred-site.xml,然后添加配置,指定mr运行在yarn上

<property><name>mapreduce.framework.name</name><value>yarn</value>
</property>

5.yarn-site.xml

这两条配置用于指定ResourceManager的位置及reducer获取数据的方式

<property><name>yarn.resourcemanager.hostname</name><value>hadoop-master</value>
</property>
<property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value>
</property>

2.3 将Hadoop配置到PATH

全部配置完成后,需将Hadoop配置到PATH中
修改配置文件profilevim /etc/profile,添加以下内容,注意修改HADOOP_HOME

export HADOOP_HOME=/usr/local/application/hadoop/hadoop-2.6.4
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

重新加载配置文件

source /etc/profile

2.4 Hadoop集群启动

首先启动namenode节点

启动namenode节点前,必须要先初始化namenode
运行命令

hadoop namenode -format

当看到如下图红圈所示信息时,表示namenode节点format成功,如果有错,说明之前的配置文件中很可能配置有错误,可以查看log文件寻找报错信息
格式化成功后,运行命令启动namenode节点

hadoop-daemon.sh start namenode

namenode节点成功启动后,在浏览器输入http://192.168.110.138:50070/访问namenode节点的50070端口即可看到Hadoop的管理界面,这时候集群还没有datanode节点

启动datanode节点

只需要在datanode节点上运行命令

hadoop-daemon.sh start datanode

datanode节点便可以根据配置信息自动接入集群,在Hadoop集群管理页面中可以看到datanode的信息

原生Hadoop集群搭建过程记录相关推荐

  1. hadoop集群搭建过程中不适用hostname发现slave,而是通过ip

    需求 搭建hadoop集群时,默认使用hostname发现集群 如果不配置hostname的话,报错日志: Unresolved datanode registration: hostname can ...

  2. Hadoop集群搭建过程中ssh免密码登录(二)

    一.为什么设置ssh免密码登录 在集群中,Hadoop控制脚本依赖SSH来执行针对整个集群的操作.例如,某个脚本能够终止并重启集群中的所有守护进程.所以,需要安装SSH,但是,SSH远程登陆的时候,需 ...

  3. Hadoop集群重启过程记录

    1. brain02~04启动zk su - hadoop sudo service zookeeper-server restart 2. brain01~03启动JN sudo service h ...

  4. 大数据Hadoop集群搭建

    大数据Hadoop集群搭建 一.环境 服务器配置: CPU型号:Intel® Xeon® CPU E5-2620 v4 @ 2.10GHz CPU核数:16 内存:64GB 操作系统 版本:CentO ...

  5. Hadoop详解(五)——ZooKeeper详解,ZooKeeper伪分布搭建和集群搭建,Hadoop集群搭建,sqoop工具的使用

    ZooKeeper简介 什么是ZooKeeper? ZooKeeper是Google的Chubby一个开源的实现,是Hadoop分布式协调服务. 它包含了一个简单的原语集,分布式应用程序可以基于它实现 ...

  6. Hadoop集群搭建(超级超级详细)

    Hadoop集群搭建(超级超级详细) 1.集群规划 安装VMware,使用三台 Ubuntu18.04 虚拟机进行集群搭建,下面是每台虚拟机的规划: 主机名 IP 用户 HDFS YARN hadoo ...

  7. ssh无密登录配置详解(hadoop集群搭建)

    ssh无密登录原理 Hadoop集群搭建时,配置ssh是给yarn用的,最好先清空.ssh目录下的文件,再生成密钥,在节点中含有resourcemanager的服务器(有多个resourcemanag ...

  8. Hadoop集群搭建之Hadoop组件安装

    兵马未动,粮草先行 --汉语成语 系列文章目录 Hadoop集群搭建之Linux系统安装 Hadoop集群搭建之Hadoop组件安装 文章目录 系列文章目录 前言 一.IP和主机名称配置 (一)Had ...

  9. 好程序员大数据笔记之:Hadoop集群搭建

    好程序员大数据笔记之:Hadoop集群搭建在学习大数据的过程中,我们接触了很多关于Hadoop的理论和操作性的知识点,尤其在近期学习的Hadoop集群的搭建问题上,小细节,小难点拼频频出现,所以,今天 ...

  10. Hadoop 集群搭建

    Hadoop 集群搭建 2016-09-24 杜亦舒 目标 在3台服务器上搭建 Hadoop2.7.3 集群,然后测试验证,要能够向 HDFS 上传文件,并成功运行 mapreduce 示例程序 搭建 ...

最新文章

  1. 开源项目越来越商业友好,谁来负责开发者友好呢?
  2. 现代密码学1.3--古典密码/historical cipher
  3. 全球及中国皮革和纺织品用甲酸行业竞争调查分析及投资规划报告2021年版
  4. MySQL两表联查,根据不同条件获得不同数据
  5. python相机拍照显示时间_python让图片按照exif信息里的创建时间进行排序的方法...
  6. 浅谈代码的执行效率(2):编译器的威力 [摘自赵劼老师的博客]
  7. cisco 2960-24 配置(生产环境)
  8. pcb钻孔披锋改善报告_高速高频PCB技术 || 玻纤效应对高速信号的影响
  9. 亚马逊开源模型设计神器:AutoGluon,三行代码自动生成SOTA模型!
  10. 少年,你知道怎么用一行代码解决分布式事务问题吗?
  11. html密码验证 并跳转页面,vuejs 实现前后端分离登录验证和页面自动跳转
  12. Aplication的意义和生命周期,与Context的关系,以及关于Aplication和Context相关问题的记录和解决办法...
  13. 猎户座计划软件测试,三星Exynos4412
  14. Linux中的用户切换:su和su - 的区别
  15. pytorch cpu版本安装_小白学pytorch 01-安装C++/Python版本pytorch
  16. 正则修饰符、用敏感词库替换
  17. Ultra Fast Deep Lane Detection with Hybrid Anchor Driven Ordinal Classification论文解读
  18. java多线程提交,如何按照时间顺序获取线程结果,看完你就懂了 | Java工具类
  19. 计算机的屏幕多少平方,27寸电脑显示器一般长宽各是多少厘米?
  20. 普歌-飞灵团队-nuxt中jQuery报e.indexOf is not a function错误

热门文章

  1. mysql 内置存储过程_数据库:mysql内置功能-存储过程
  2. Spring AOP异常处理(error at ::0 formal unbound in pointcut)
  3. 实战Python:详解利用Python和Pygame实现飞机大战
  4. MYSQL中TRUNCATE和DELETE的区别
  5. 如何快速删除代码中的空行?eclipse删除空行超实用
  6. 分布式存储系统学习笔记(二)—分布式文件系统(3)—Facebook文件系统(Haystack)
  7. CVPR 2021|人脸属性风格解耦
  8. 【纪中集训2019.3.23】Deadline
  9. 关于tomcat 开启gc日志后每隔1小时full gc的问题
  10. 微信手机开发 ios android 您没有APP支付权限