1、hadoop安装及其文件结构
Hadoop安装
安装过程亲测有效,在安装过程中根据自己的喜好和实际环境更改部分内容即可。
1.安装jdk
a)下载jdk-8u65-linux-x64.tar.gzb)tar开$>su centos ; cd ~$>mkdir downloads$>cp /mnt/hdfs/downloads/bigdata/jdk-8u65-linux-x64.tar.gz ~/downlooads$>tar -xzvf jdk-8u65-linux-x64.tar.gzc)创建/soft文件夹(根目录下创建)$>sudo mkdir /soft$>sudo chown centos:centos /softd)移动tar开的文件到/soft下$>mv ~/downloads/jdk-1.8.0_65 /soft/e)创建符号连接#符号连接分为软连接和硬链接,硬链接与原文件有着相同的inode号,可以理解成是对原文件的一份复制,但是这个复制出来#的文件与原文件有相同的inode号。当删除原文件时,建立的硬链接的文件依然存在。#软连接就是建立了一个新文件。文件当中存储的内容可以认为是原文件的一个指针。#硬链接只能链接到文件,软链接可以链接到文件和文件夹。#这里使用链接的方法是为了切换三种模式的方便。就相当于用一个指针不断的切换指向,而整个系统后面的内容不需要调整$>ln -s /soft/jdk-1.8.0_65 /soft/jdkf)验证jdk安装是否成功$>cd /soft/jdk/bin$>./java -version
2.centos配置环境变量
1.编辑/etc/profile$>sudo nano /etc/profile...export JAVA_HOME=/soft/jdkexprot PATH=$PATH:$JAVA_HOME/bin2.使环境变量即刻生效$>source /etc/profile3.进入任意目录下,测试是否ok$>cd ~$>java -version
3.安装hadoop
1.安装hadoopa)下载hadoop-2.7.3.tar.gzb)tar开$>su centos ; cd ~$>cp /mnt/hdfs/downloads/bigdata/hadoop-2.7.3.tar.gz ~/downloads$>tar -xzvf hadoop-2.7.3.tar.gzc)无d)移动tar开的文件到/soft下$>mv ~/downloads/hadoop-2.7.3 /soft/e)创建符号连接$>ln -s /soft/hadoop-2.7.3 /soft/hadoopf)验证jdk安装是否成功$>cd /soft/hadoop/bin$>./hadoop version2.配置hadoop环境变量$>sudo nano /etc/profile...export JAVA_HOME=/soft/jdkexprot PATH=$PATH:$JAVA_HOME/binexport HADOOP_HOME=/soft/hadoopexport PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin3.生效$>source /etc/profile
4.配置hadoop
hadoop三种模式,分别是本地模式(local)、伪分布模式(pseudo)、全分布(full)。
- 本地模式。指的是最初始的模式,配置文件均为空的。
- 伪分布模式。用一台主机模拟多台主机。hadoop的守护程序在本地计算机上运行,模拟集群环境,并且是相互独立的Java进程。在这种模式下,Hadoop使用的是分布式文件系统,各个作业也是由JobTraker服务,来管理的独立进程。在单机模式之上增加了代码调试功能,允许检查内存使用情况,HDFS输入输出,以及其他的守护进程交互。类似于完全分布式模式,因此,这种模式常用来开发测试Hadoop程序的执行是否正确。
- 完全分布式。真实的集群环境。
4.1 配置伪分布模式
根据前文配置路径进行
a)进入/soft/etc/hadoop目录b)编辑core-site.xml<?xml version="1.0"?><configuration><property><name>fs.defaultFS</name><value>hdfs://localhost/</value></property></configuration>c)编辑hdfs-site.xml<?xml version="1.0"?><configuration><property><name>dfs.replication</name><value>1</value></property></configuration>d)编辑mapred-site.xml注意:cp mapred-site.xml.template mapred-site.xml<?xml version="1.0"?><configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property></configuration>e)编辑yarn-site.xml<?xml version="1.0"?><configuration><property><name>yarn.resourcemanager.hostname</name><value>localhost</value></property><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property></configuration>f)配置SSH1)检查是否安装了ssh相关软件包(openssh-server + openssh-clients + openssh)$yum list installed | grep ssh2)检查是否启动了sshd进程$>ps -Af | grep sshd3)在client侧生成公私秘钥对。$>ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa4)生成~/.ssh文件夹,里面有id_rsa(私钥) + id_rsa.pub(公钥)5)追加公钥到~/.ssh/authorized_keys文件中(文件名、位置固定)$>cd ~/.ssh$>cat id_rsa.pub >> authorized_keys6)修改authorized_keys的权限为644.$>chmod 644 authorized_keys7)测试$>ssh localhost
4.2配置完全分布式
0.修改主机名<hosts是解析文件完成ip到主机名的映射>
1./etc/hostnames201
2./etc/hosts127.0.0.1 localhost192.168.231.201 s201192.168.231.202 s202192.168.231.203 s203192.168.231.204 s204
1.克隆主机,修改主机名和Ip地址,主机名和IP地址可以根据自己实际情况自己就可以。几台机子搞好后要ping一下是不是通的才可以啊。
0.将虚拟机的网络连接方式改为桥接模式,这样每台主机相当于一台真实主机。1.克隆3台client(centos7)右键centos-7-->管理->克隆-> ... -> 完整克隆2.启动client3.启用客户机共享文件夹。4.修改hostname和ip地址文件[/etc/hostname]s202[/etc/sysconfig/network-scripts/ifcfg-ethxxxx]...IPADDR=192.168.xxx.xxx5.重启网络服务$>sudo service network restart6.修改/etc/resolv.conf文件nameserver 192.168.231.27.其余几台重复以上3 ~ 6过程.
2.准备完全分布式主机的ssh
这里的ssh是当前用户名下的ssh,对于一些需要root权限的命令还需要建立root权限的ssh。方法与这个相同,只不过在操作时把用户切换成root用户就可。
1.删除所有主机上的/home/centos/.ssh/*#前面配伪分布的时候生成了ssh的2.在s201主机上生成密钥对#这里是把s201当成了master$>ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa3.将s201的公钥文件id_rsa.pub远程复制到202 ~ 204主机上。并放置/home/centos/.ssh/authorized_keys#这样就把公钥发给了每一台slaves,master拿着私钥就可以免密登录任何一台主机了。 $>scp id_rsa.pub centos@s201:/home/centos/.ssh/authorized_keys$>scp id_rsa.pub centos@s202:/home/centos/.ssh/authorized_keys$>scp id_rsa.pub centos@s203:/home/centos/.ssh/authorized_keys$>scp id_rsa.pub centos@s204:/home/centos/.ssh/authorized_keys
3.配置完全分布式(${hadoop_home}/etc/hadoop/)
1. [core-site.xml]<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><property><name>fs.defaultFS</name><value>hdfs://s201/</value></property></configuration>[hdfs-site.xml]<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><property><name>dfs.replication</name><value>3</value></property></configuration>[mapred-site.xml]不变[yarn-site.xml]<?xml version="1.0"?><configuration><property><name>yarn.resourcemanager.hostname</name><value>s201</value></property><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property></configuration>2. [slaves]<etc/full>s202s203s2043.etc/full/[hadoop-env.sh]<centos的坑,不是必须配的>...export JAVA_HOME=/soft/jdk...4.分发配置$>cd /soft/hadoop/etc/$>scp -r full centos@s202:/soft/hadoop/etc/$>scp -r full centos@s203:/soft/hadoop/etc/$>scp -r full centos@s204:/soft/hadoop/etc/
到现在完全的分布式已经配好了,我们现在来梳理一下现在我们系统上的文件结构。
1、hadoop安装及其文件结构相关推荐
- Hadoop安装及eclipse配置
Hadoop安装 彻底关闭防火墙 chkconfig iptables off 查看主机名 hostname 修改主机名 vim /etc/sysconfig/network 修改之后不会立即执行需要 ...
- Hadoop安装与配置问题说明
说明:本博客对Hadoop安装与配置过程中可能存在的问题做简单记录 启动Hadoop hadoop@ubuntu16:/usr/local/java/hadoop/hadoop-2.7.1$ ./sb ...
- Hadoop 安装详解--新手必备
准备: 这次学习,我使用的是虚拟机vmware,安装了3台虚拟机,系统为centos 5(其它版本亦可),主机名依次命名为hdfs1.hdfs2.hdfs3,ip地址一次为:172.16.16.1.1 ...
- hadoop安装部署(伪分布及集群)
hadoop安装部署(伪分布及集群) @(HADOOP)[hadoop] hadoop安装部署伪分布及集群 第一部分伪分布式 一环境准备 二安装hdfs 三安装YARN 第二部分集群安装 一规划 一硬 ...
- hadoop安装与配置
转:链接: Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04 Hadoop集群安装配置教程_Hadoop2.6.0_Ubuntu/CentOS 转载于:http ...
- Hadoop安装及配置
Hadoop的三种运行模式 单机模式(Standalone,独立或本地模式):安装简单,运行时只启动单个进程,仅调试用途: 伪分布模式(Pseudo-Distributed):在单节点上同时启动nam ...
- 大数据学习(2-1)-Hadoop安装教程-单机模式和伪分布模式(Ubuntu14.04LTS)
文章目录 目录 1.linxu的安装 1.1安装Linux虚拟机 1.2安装Linux和Windows双系统 2.Hadoop的安装 2.1 Hadoop安装前配置 2.1.1 配置Hadoop用户 ...
- Hadoop伪分布式配置和搭建,hadoop单机安装,wordcount实例测试,hadoop安装java目录怎么找,问题及问题解决方法
Hadoop伪分布式配置和搭建,hadoop单机安装,wordcount实例测试,hadoop安装java目录怎么找,问题及问题解决方法 环境说明 系统:ubuntu18.04 主机名:test1 用 ...
- hadoop服务器系统设置win10,win10系统hadoop安装配置的设置技巧
win10系统使用久了,好多网友反馈说关于对win10系统hadoop安装配置设置的方法,在使用win10系统的过程中经常不知道如何去对win10系统hadoop安装配置进行设置,有什么好的办法去设置 ...
最新文章
- 为什么不采用“两次握手”建立连接呢?
- 请你解释一下什么是线程池(thread pool)?
- 网络知识:路由器要不要每天重启?很多人都做错了,难怪网速慢
- 楼梯计算机公式,各种楼梯面积的计算公式汇总
- Git管理代码常用术语
- Java Web文件下载
- Python: str.split()和re.split()的区别
- 在日本租房有什么经验建议分享?
- python基础----Day06
- hexo入门学习(六):文章图片存储到七牛云
- 教程 | Rhino Compute Sevice介绍及环境搭建
- 我开发了一款软件,完成了舔狗的绝地反杀(代码开源)!
- 奇虎360起诉瑞星和中关村在线
- 工厂模式与建造者模式
- Download模块 (十三)
- FLT3_ITD分析
- ISO转换QCOW2格式
- 销售业绩管理系统 c语言作业,管理信息系统知识
- Echarts主题和调色盘以及颜色渐变
- stm32 程序结构