HA集群的搭建注意事项:

1.修改Linux主机名
2.修改IP
3.修改主机名和IP的映射关系 /etc/hosts
4.关闭防火墙
5.ssh免登陆
6.安装JDK,配置环境变量等
7.注意集群时间要同步

安装步骤:

1.安装配置zooekeeper集群

link

2.安装配置hadoop集群

link

3.修改core-site.xml

<configuration>
<!-- 集群名称在这里指定!该值来自于hdfs-site.xml中的配置 -->
<property>
<name>fs.defaultFS</name>
<value>hdfs://cluster1</value>
</property>
<!-- 这里的路径默认是NameNode、DataNode、JournalNode等存放数据的公共目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/export/servers/hadoop-2.6.0-cdh5.14.0/HAhadoopDatas/tmp</value>
</property><!-- ZooKeeper集群的地址和端口。注意,数量一定是奇数,且不少于三个节点-->
<property>
<name>ha.zookeeper.quorum</name>
<value>node01:2181,node02:2181,node03:2181</value>
</property>
</configuration>

4.hdfs-site.xml

<configuration>
<!--指定hdfs的nameservice为cluster1,需要和core-site.xml中的保持一致 -->
<property>
<name>dfs.nameservices</name>
<value>cluster1</value>
</property>
<!-- cluster1下面有两个NameNode,分别是nn1,nn2 -->
<property>
<name>dfs.ha.namenodes.cluster1</name>
<value>nn1,nn2</value>
</property>
<!-- nn1的RPC通信地址 -->
<property>
<name>dfs.namenode.rpc-address.cluster1.nn1</name>
<value>node01:8020</value>
</property>
<!-- nn1的http通信地址 -->
<property>
<name>dfs.namenode.http-address.cluster1.nn1</name>
<value>node01:50070</value>
</property>
<!-- nn2的RPC通信地址 -->
<property>
<name>dfs.namenode.rpc-address.cluster1.nn2</name>
<value>node02:8020</value>
</property>
<!-- nn2的http通信地址 -->
<property>
<name>dfs.namenode.http-address.cluster1.nn2</name>
<value>node02:50070</value>
</property>
<!-- 指定NameNode的edits元数据在JournalNode上的存放位置 -->
<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://node01:8485;node02:8485;node03:8485/cluster1</value>
</property>
<!-- 指定JournalNode在本地磁盘存放数据的位置 -->
<property>
<name>dfs.journalnode.edits.dir</name>
<value>/export/servers/hadoop-2.6.0-cdh5.14.0/journaldata</value>
</property>
<!-- 开启NameNode失败自动切换 -->
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>
<!-- 指定该集群出故障时,哪个实现类负责执行故障切换 -->
<property>
<name>dfs.client.failover.proxy.provider.cluster1</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
<!-- 配置隔离机制方法,多个机制用换行分割,即每个机制暂用一行-->
<property>
<name>dfs.ha.fencing.methods</name>
<value>
sshfence
</value>
</property>
<!-- 使用sshfence隔离机制时需要ssh免登陆 -->
<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/root/.ssh/id_rsa</value>
</property>
<!-- 配置sshfence隔离机制超时时间 -->
<property>
<name>dfs.ha.fencing.ssh.connect-timeout</name>
<value>30000</value>
</property>
</configuration>

5.修改mapred-site.xml

<configuration>
<!-- 指定mr框架为yarn方式 -->
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

6.yarn-site.xml

<configuration>
<!-- 开启RM高可用 -->
<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
</property>
<!-- 指定RM的cluster id -->
<property>
<name>yarn.resourcemanager.cluster-id</name>
<value>yrc</value>
</property>
<!-- 指定RM的名字 -->
<property>
<name>yarn.resourcemanager.ha.rm-ids</name>
<value>rm1,rm2</value>
</property>
<!-- 分别指定RM的地址 -->
<property>
<name>yarn.resourcemanager.hostname.rm1</name>
<value>node01</value>
</property>
<property>
<name>yarn.resourcemanager.hostname.rm2</name>
<value>node02</value>
</property>
<!-- 指定zk集群地址 -->
<property>
<name>yarn.resourcemanager.zk-address</name>
<value>node01:2181,node02:2181,node03:2181</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>

7.修改slaves

node01
node02
node03

8.将软件拷贝到所有节点

scp -r   hadoop-2.6.0-cdh5.14.0 node02:/$PWD
scp -r   hadoop-2.6.0-cdh5.14.0 node03:/$PWD

9.实现远程无密码访问

ssh-keygen
ssh-coyp-id

10.启动zookeeper集群(所有节点都开启)

bin/zkServer.sh start

11.手动启动journalnode

hadoop-daemon.sh start journalnode

12.格式化namenode

hdfs namenode -format{在主节点执行}
把hadoop.tmp.dir配置的目录下所有文件拷贝到另一台namenode节点所在的机器
scp -r HAhadoopDatas node02:/$PWD

13.格式化ZKFC(在active上执行即可)

hdfs zkfc -formatZK

14.启动HDFS(在node01上执行)

start-dfs.sh

HDFS-HA集群搭建(搭建的时候,请仔细仔细再仔细!!!)相关推荐

  1. Hadoop 2.x 完全分布式HA集群环境搭建

    Hadoop 2.x 完全分布式HA集群环境搭建 目录 Hadoop 2.0 环境搭建 前提:环境准备 第一步:修改hadoop-env.sh配置文件,配置好JAVA_HOME环境变量 第二步:修改h ...

  2. (超详细)基于Zookeeper的Hadoop HA集群的搭建

    基于Zookeeper的Hadoop HA集群的搭建 JunLeon--go big or go home 前言: 高可用(high availability,HA)指的是若当前工作中的机器宕机了,系 ...

  3. Hadoop HA集群的搭建

    HA 集群搭建的难度主要在于配置文件的编写, 心细,心细,心细! ha模式下,secondary namenode节点不存在... 集群部署节点角色的规划(7节点) ----------------- ...

  4. Hadoop4——HA集群的搭建(高可用)

    Hadoop--高可用(HA) 配置文件的截图是最初的,有一些小错误,想要配置文件可以评论.可以先浏览操作步骤. 一.配置须知:集群主节点 二.安装配置zookeeper 前提:jdk和hadoop环 ...

  5. Redis Cluster高可用(HA)集群环境搭建详细步骤

    1.为什么要有集群 由于Redis主从复制架构每个数据库都要保存整个集群中的所有数据,容易形成木桶效应,所以Redis3.0之后的版本添加特性就是集群(Cluster) 2.Redis集群架构说明 架 ...

  6. 深入浅出学大数据(五)Hadoop再探讨High Availability(HA)集群搭建及YARN原理介绍

      大家好,我是不温卜火,昵称来源于成语-不温不火,本意是希望自己性情温和.作为一名互联网行业的小白,博主写博客一方面是为了记录自己的学习过程,另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样 ...

  7. 7.HDFS之——NameNode的概述、自动Name的概述、NameNode HA 集群搭建

    7.HDFS NameNode HA 7.1 NameNode HA概述 所谓HA(High Availablity [əˌveɪlə'bɪləti] ),即高可用(7x24小时服务不中断).通过主备 ...

  8. 对HA的简单认识以及HA集群删除

    高可用集群HA,英文全称为High Availability,简单来说,集群就是一组计算机,它们作为一个整体向用户提供一组网络资源,这些单个的计算机系统就是集群的节点. 高可用集群的出现就是为了使集群 ...

  9. Hadoop-2.8.5的HA集群搭建

    一.Hadoop HA 机制的学习 1.1.Hadoop 2.X 的架构图 2.x版本中,HDFS架构解决了单点故障问题,即引入双NameNode架构,同时借助共享存储系统来进行元数据的同步,共享存储 ...

  10. hadoop2.8 ha 集群搭建

    简介: 最近在看hadoop的一些知识,下面搭建一个ha (高可用)的hadoop完整分布式集群: hadoop的单机,伪分布式,分布式安装 hadoop2.8 集群 1 (伪分布式搭建 hadoop ...

最新文章

  1. 在Ubuntu 16.04.5 LTS上安装pygame模块
  2. 美国微生物科学院22年院士公布!舒跃龙、黄力、卢洪洲、赵国屏!
  3. bzoj 1189 紧急疏散 网络流
  4. git diff命令输出的含义
  5. 看完这篇后,别再说你不懂JVM类加载机制了~
  6. java和c 对接_java和objective-C对接笔记
  7. Safe handle has been closed异常的原因及解决思路
  8. MaxRects纹理合并算法as3实现
  9. 【链表相加】程序员面试金典——2.5链式A+B
  10. 分析和比较ABAQUS、MARC、Adina、ANSYS三种CAE软件
  11. 运用类似于沙盘模拟的方式熟悉业务
  12. 湖南中医药高等专科学校计算机试题,湖南中医药高等专科学校2020年单招文化基础考试考纲...
  13. python面向对象编程指南pdf_Python面向对象编程指南(pdf+epub+mobi+txt+azw3)
  14. 邓紫棋歌曲计算机音乐数字,邓紫棋播放量最高的十首歌曲
  15. 前端通过【bitly】Api,将长链接转换短连接
  16. 努比亚z11mini 使用 移动物联卡
  17. 水利水电课程指导之建筑制图基础_第一章1.3 平面图形的尺寸标注
  18. 数据可视化Matplotlib-中
  19. 基于制导武器的分布式半实物仿真系统ETest研究
  20. 【一行代码系列】Python 的多线程

热门文章

  1. Linux命令之tree(3)
  2. Invalid configuration information-please run SETUP program. 戴尔笔记本 故障
  3. 配置gitlib推送代码自动触发jenkins部署方案
  4. python入门书籍简介
  5. 蔡高厅高等数学22-导数的概念、两种表现形式
  6. python编程实现:从1到n报数,凡是报到3或者包含3的倍数的人退出,剩余的人从n+1开始继续报数,如此循环,直到剩余一个人,求这个人是原来的几号位
  7. Win10系统管理中没有本地用户和组如何添加?
  8. python中str和repr_关于Python中repr和str用法的区别?
  9. chatgpt赋能python:Python用什么软件搜题?推荐4款具有高效与准确性的题库搜索工具
  10. 有关苹果证书介绍(Certificates, Identifiers Profiles)