运行环境:
系统:centos6.9
jdk:jdk1.8.0_201

搭建版本:
hadoop:hadoop-2.7.2

环境说明:
集群环境至少需要 3 个节点(也就是 3 台服务器设备):1 个 Master,2 个 Slave,节点之间局域网连接

1、首先需要分别将三台服务器的opt目录改为qiqi用户的

chown -R qiqi: /opt/

2、在opt目录下创建文件夹 modules 和 文件夹software,所有的安装包放在software下面,解压文件放在modules下面

3、准备工作,安装 JDK,在三台机器上配置 JDK 环境

tar -zvxf /opt/software/jdk-8u201-linux-x64.tar.gz -C /opt/modules/

4、配置环境变量(切换到root目录下):vi /etc/profile

# set java
export JAVA_HOME=/opt/madules/jdk1.8.0_201
export JRE_HOME=$JAVA_HOME/jre
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tool.jar
export PATH=$PATH:$JAVA_HOME/bin:$JAVA_HOME/jre/bin

5、执行命令:source /etc/profile 使之配置环境生效

6、添加 Hosts 映射关系(三个节点都要添加):vi /etc/hosts 添加内容如下(ip地址加节点)


192.168.147.12 c1 192.168.147.13 c2192.168.147.14 c3

7、修改节点与主机名:vi /etc/sysconfig/network

HOSTNAME=localhost.localdomain    #修改 localhost.localdomain  为 c1 即HOSTNAME要对应的是主机名与节点名

8、设置集群之间 SSH 无密码登陆

CentOS 默认安装了 ssh,如果没有你需要先安装 ssh 。集群环境的使用必须通过 ssh 无密码登陆来执行,本机登陆本机必须无密码登陆,主机与从机之间必须可以双向无密码登陆,从机与从机之间无限制。

a、关闭selinux


b、防火墙

[root@c1 ~]# service iptables stop #关闭防火墙,(我的已关闭,所以下面没显示)
[root@c1 ~]# chkconfig iptables off #永久关闭防火墙
[root@c1 ~]# service iptables status #查看防火墙状态
iptables: Firewall is not running. # 防火墙已关闭

c、配置ssh,配置ssh需要切换到普通用户下,即qiqi

[qiqi@c1 ~]$ cd ~/.ssh/
[qiqi@c1 .ssh]$ ssh-keygen -t rsa #生成密匙,连续四次回车,我的已经生成,就不展示了

d、ssh复制给其他服务器(包括自己)

ssh-copy-id c1 #在c1中操作(会有yes 和输入密码选项),修改节点,复制密匙   

在前面配置的HOSTNAME和防护墙都需要重启生效!重启后进行下面的配置

9、将hadoop的安装包解压到modules 文件夹下,将hadoop的安装文件夹重新命名为hadoop

tar -zvxf /opt/software/hadoop-2.7.2.tar.gz -C /opt/modules/

10、配置环境变量

#set hadoopexport HADOOP_HOME=/opt/madules/hadoopexport CLASSPATH=$($HADOOP_HOME/bin/hadoop classpath):$CLASSPATHexport PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

11、执行命令:source /etc/profile 使之配置环境生效

12、修改hadoop配置文件,会用到(Notepad)


配置完成点击关闭

双击/

13、配置文件
a、在第一类配置文件中修改JAVA_HOME
配置hadoop-env.sh

export JAVA_HOME=/opt/modules/jdk1.8.0_201
export HADOOP_HOME=/opt/modules/hadoop

配置mapred-env.sh

# export JAVA_HOME=/home/y/libexec/jdk1.6.0/
export JAVA_HOME=/opt/madules/jdk1.8.0_201

配置yarn-env.sh

export JAVA_HOME=/opt/madules/jdk1.8.0_201

b、需要修改的第二类文件
slaves --->配置datanode

配置core-site.xml

<configuration>
<property><name>fs.defaultFS</name>
#配置主节点<value>hdfs://c1:9000</value></property><property><name>hadoop.tmp.dir</name>
#启动hadoop集群时,存放初始化文件,需要我们自己创建<value>/opt/modules/hadoop/hadoop-qiqi</value></property>
</configuration>

在命令窗新建缓存目录

 hadoop fs -mkdir hadoop

配置hdfs-site.xml

<configuration><property><name>dfs.replication</name><value>3</value></property><property><name>dfs.namenode.http-address</name><value>c1:50070</value></property><property><name>dfs.namenode.secondary.http-address</name><value>c1:50090</value></property>
</configuration>

配置yarn-site.xml

<configuration><!-- Site specific YARN configuration properties --><property><name>mapreduce.framework.name</name><value>yarn</value></property><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.resourcemanager.hostname</name><value>c1</value></property><property><name>yarn.log-aggregation-enable</name><value>true</value></property><property><name>yarn.log-aggregation.retain-seconds</name><value>86400</value></property><property><name>mapreduce.jobhistory.address</name><value>c1:10020</value></property><property><name>mapreduce.jobhistory.webapp.address</name><value>c1:19888</value></property></configuration>

14、将配置好的hadoop环境复制到其他节点的modules目录下

scp -r hadoop/ qiqi@c2:/opt/modules/
scp -r hadoop/ qiqi@c3:/opt/modules/

15、配置完成,初始化集群(切换到hadoop目录下)

bin/hadoop namenode -format

16、启动集群

sbin/start-all.sh

17、输入jps查看进程

18、打开本地浏览器输入 c1:50070查看hdfs文件系统的页面
19、本地浏览器输入 c1:8088查看yarn资源管理页面

hadoop搭建之hadoop安装相关推荐

  1. windows下搭建hadoop 搭建本地hadoop开发环境

    一.下载所需文件 1.JDK下载地址:https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.h ...

  2. Hadoop-2.8.0集群搭建、hadoop源码编译和安装、host配置、ssh免密登录、hadoop配置文件中的参数配置参数总结、hadoop集群测试,安装过程中的常见错误

    25. 集群搭建 25.1 HADOOP集群搭建 25.1.1集群简介 HADOOP集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起 HDFS集群: 负责海量数据 ...

  3. hadoop集群的搭建(分布式安装)

    集群 计算机集群是一种计算机系统,他通过一组松散集成的计算机软件和硬件连接起来高度紧密地协同完成计算工作. 集群系统中的单个计算机通常称为节点,通常通过局域网连接. 集群技术的特点: 1.通过多台计算 ...

  4. Hadoop伪分布式配置和搭建,hadoop单机安装,wordcount实例测试,hadoop安装java目录怎么找,问题及问题解决方法

    Hadoop伪分布式配置和搭建,hadoop单机安装,wordcount实例测试,hadoop安装java目录怎么找,问题及问题解决方法 环境说明 系统:ubuntu18.04 主机名:test1 用 ...

  5. CentOS7 搭建Ambari-Server,安装Hadoop集群(一)

    2017-07-05:修正几处拼写错误,之前没发现,抱歉! 第一次在cnblogs上发表文章,效果肯定不会好,希望各位多包涵. 编写这个文档的背景是月中的时候,部门老大希望我们能够抽时间学习一下Had ...

  6. Hadoop集群搭建之Hadoop组件安装

    兵马未动,粮草先行 --汉语成语 系列文章目录 Hadoop集群搭建之Linux系统安装 Hadoop集群搭建之Hadoop组件安装 文章目录 系列文章目录 前言 一.IP和主机名称配置 (一)Had ...

  7. Hadoop入门(上):大数据特点、大数据前景、大数据组织结构、Hadoop组成、Hadoop版本介绍、Hadoop运行环境搭建、CentOS6安装JDK、安装Hadoop、Hadoop目录结构

    资料来源于尚硅谷 本篇文章目录 第1章·大数据概论 1.1.大数据概念. 1.2.大数据特点(4V) 1.3.大数据应用场景 1.4.大数据发展前景 1.5·大数据部门业务流程分析. 1.6·大数据部 ...

  8. Windows下使用IDEA+Maven搭建本地Hadoop环境

    IDEA结合Maven搭建本地MapReduce环境 文章目录 IDEA结合Maven搭建本地MapReduce环境 前言 环境 配置Maven 新建项目 初始化 添加apache源 添加Hadoop ...

  9. hadoop hive集群_基于伪分布式Hadoop搭建Hive平台详细教程

    一.搭建环境的前提条件 环境:Linux系统 Hadoop-2.6.0 MySQL 5.6 apache-hive-2.3.7 这里的环境不一定需要和我一样,基本版本差不多都ok的,所需安装包和压缩包 ...

最新文章

  1. MATLAB修改工作环境
  2. 【机器学习】机器学习中缺失值处理方法大全(附代码)
  3. CodeForces - 1426F Number of Subsequences(dp)
  4. python爬取景点信息_python 爬取马蜂窝景点翻页文字评论的实现
  5. 删数问题(信息学奥赛一本通-T1321)
  6. 故障闪烁过渡网页幻灯片特效源码
  7. 南华桌面计算机,南华大学计算机应用基础试题题.doc
  8. find python3_Python3 rfind()方法
  9. 在FreeBSD上彻底禁用sendmail
  10. Servlet(2)
  11. 《论语》《大学》《中庸》和孟子
  12. 家庭安防监控设备搭建
  13. [Python] os.path.splitext(path):分离文件名与扩展名
  14. spring源码-bean加载整体流程
  15. SSTI 模板注入url_for和get_flashed_messages之[WesternCTF2018]shrine
  16. nicegram安卓_Nicegram测试版
  17. 把html页面保存为图片格式
  18. ansible dnf模块详解
  19. 不要做一个只会抱怨的人
  20. 上海贝尔2452交换机_通信网络-OmniSwitch 6250可堆叠的快速以太网交换机系列.pdf

热门文章

  1. Vue.js 服务器端渲染指南
  2. php+彩票中奖判断,彩票算法 – PHP – 数学似乎不错,但功能是否有效?
  3. doc转docx文件会乱吗_利用python将doc文件转换为docx
  4. coreldraw x5 选择工具快捷键_CorelDRAW设置和优化提高工作效率
  5. linux 快速启动程序,centos7快速启动应用程序教程
  6. qjsonarray 合并_QJsonObject和QJsonArray的巨坑
  7. 怎么用html做随机颜色,JavaScript 实现网站标签随机颜色的方法
  8. 大一上期c语言实验报告2,大一上期C语言实验报告1熟悉实验环境
  9. jediscluster的maxAttempts的理解
  10. PWM级联方案。UART接口的单总线控制多个PWM输出。数字舵机,舵机级联方案