Hadoop安装

安装过程亲测有效,在安装过程中根据自己的喜好和实际环境更改部分内容即可。

1.安装jdk
        a)下载jdk-8u65-linux-x64.tar.gzb)tar开$>su centos ; cd ~$>mkdir downloads$>cp /mnt/hdfs/downloads/bigdata/jdk-8u65-linux-x64.tar.gz  ~/downlooads$>tar -xzvf jdk-8u65-linux-x64.tar.gzc)创建/soft文件夹(根目录下创建)$>sudo mkdir /soft$>sudo chown centos:centos /softd)移动tar开的文件到/soft下$>mv ~/downloads/jdk-1.8.0_65 /soft/e)创建符号连接#符号连接分为软连接和硬链接,硬链接与原文件有着相同的inode号,可以理解成是对原文件的一份复制,但是这个复制出来#的文件与原文件有相同的inode号。当删除原文件时,建立的硬链接的文件依然存在。#软连接就是建立了一个新文件。文件当中存储的内容可以认为是原文件的一个指针。#硬链接只能链接到文件,软链接可以链接到文件和文件夹。#这里使用链接的方法是为了切换三种模式的方便。就相当于用一个指针不断的切换指向,而整个系统后面的内容不需要调整$>ln -s /soft/jdk-1.8.0_65 /soft/jdkf)验证jdk安装是否成功$>cd /soft/jdk/bin$>./java -version
2.centos配置环境变量
    1.编辑/etc/profile$>sudo nano /etc/profile...export JAVA_HOME=/soft/jdkexprot PATH=$PATH:$JAVA_HOME/bin2.使环境变量即刻生效$>source /etc/profile3.进入任意目录下,测试是否ok$>cd ~$>java -version
3.安装hadoop
    1.安装hadoopa)下载hadoop-2.7.3.tar.gzb)tar开$>su centos ; cd ~$>cp /mnt/hdfs/downloads/bigdata/hadoop-2.7.3.tar.gz ~/downloads$>tar -xzvf hadoop-2.7.3.tar.gzc)无d)移动tar开的文件到/soft下$>mv ~/downloads/hadoop-2.7.3 /soft/e)创建符号连接$>ln -s /soft/hadoop-2.7.3 /soft/hadoopf)验证jdk安装是否成功$>cd /soft/hadoop/bin$>./hadoop version2.配置hadoop环境变量$>sudo nano /etc/profile...export JAVA_HOME=/soft/jdkexprot PATH=$PATH:$JAVA_HOME/binexport HADOOP_HOME=/soft/hadoopexport PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin3.生效$>source /etc/profile
4.配置hadoop

hadoop三种模式,分别是本地模式(local)、伪分布模式(pseudo)、全分布(full)。

  • 本地模式。指的是最初始的模式,配置文件均为空的。
  • 伪分布模式。用一台主机模拟多台主机。hadoop的守护程序在本地计算机上运行,模拟集群环境,并且是相互独立的Java进程。在这种模式下,Hadoop使用的是分布式文件系统,各个作业也是由JobTraker服务,来管理的独立进程。在单机模式之上增加了代码调试功能,允许检查内存使用情况,HDFS输入输出,以及其他的守护进程交互。类似于完全分布式模式,因此,这种模式常用来开发测试Hadoop程序的执行是否正确。
  • 完全分布式。真实的集群环境。
4.1 配置伪分布模式

根据前文配置路径进行

        a)进入/soft/etc/hadoop目录b)编辑core-site.xml<?xml version="1.0"?><configuration><property><name>fs.defaultFS</name><value>hdfs://localhost/</value></property></configuration>c)编辑hdfs-site.xml<?xml version="1.0"?><configuration><property><name>dfs.replication</name><value>1</value></property></configuration>d)编辑mapred-site.xml注意:cp mapred-site.xml.template mapred-site.xml<?xml version="1.0"?><configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property></configuration>e)编辑yarn-site.xml<?xml version="1.0"?><configuration><property><name>yarn.resourcemanager.hostname</name><value>localhost</value></property><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property></configuration>f)配置SSH1)检查是否安装了ssh相关软件包(openssh-server + openssh-clients + openssh)$yum list installed | grep ssh2)检查是否启动了sshd进程$>ps -Af | grep sshd3)在client侧生成公私秘钥对。$>ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa4)生成~/.ssh文件夹,里面有id_rsa(私钥) + id_rsa.pub(公钥)5)追加公钥到~/.ssh/authorized_keys文件中(文件名、位置固定)$>cd ~/.ssh$>cat id_rsa.pub >> authorized_keys6)修改authorized_keys的权限为644.$>chmod 644 authorized_keys7)测试$>ssh localhost
4.2配置完全分布式

0.修改主机名<hosts是解析文件完成ip到主机名的映射>

1./etc/hostnames201
2./etc/hosts127.0.0.1 localhost192.168.231.201 s201192.168.231.202 s202192.168.231.203 s203192.168.231.204 s204

1.克隆主机,修改主机名和Ip地址,主机名和IP地址可以根据自己实际情况自己就可以。几台机子搞好后要ping一下是不是通的才可以啊。

    0.将虚拟机的网络连接方式改为桥接模式,这样每台主机相当于一台真实主机。1.克隆3台client(centos7)右键centos-7-->管理->克隆-> ... -> 完整克隆2.启动client3.启用客户机共享文件夹。4.修改hostname和ip地址文件[/etc/hostname]s202[/etc/sysconfig/network-scripts/ifcfg-ethxxxx]...IPADDR=192.168.xxx.xxx5.重启网络服务$>sudo service network restart6.修改/etc/resolv.conf文件nameserver 192.168.231.27.其余几台重复以上3 ~ 6过程.

2.准备完全分布式主机的ssh

这里的ssh是当前用户名下的ssh,对于一些需要root权限的命令还需要建立root权限的ssh。方法与这个相同,只不过在操作时把用户切换成root用户就可。

    1.删除所有主机上的/home/centos/.ssh/*#前面配伪分布的时候生成了ssh的2.在s201主机上生成密钥对#这里是把s201当成了master$>ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa3.将s201的公钥文件id_rsa.pub远程复制到202 ~ 204主机上。并放置/home/centos/.ssh/authorized_keys#这样就把公钥发给了每一台slaves,master拿着私钥就可以免密登录任何一台主机了。   $>scp id_rsa.pub centos@s201:/home/centos/.ssh/authorized_keys$>scp id_rsa.pub centos@s202:/home/centos/.ssh/authorized_keys$>scp id_rsa.pub centos@s203:/home/centos/.ssh/authorized_keys$>scp id_rsa.pub centos@s204:/home/centos/.ssh/authorized_keys

3.配置完全分布式(${hadoop_home}/etc/hadoop/)

1.      [core-site.xml]<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><property><name>fs.defaultFS</name><value>hdfs://s201/</value></property></configuration>[hdfs-site.xml]<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><property><name>dfs.replication</name><value>3</value></property></configuration>[mapred-site.xml]不变[yarn-site.xml]<?xml version="1.0"?><configuration><property><name>yarn.resourcemanager.hostname</name><value>s201</value></property><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property></configuration>2.    [slaves]<etc/full>s202s203s2043.etc/full/[hadoop-env.sh]<centos的坑,不是必须配的>...export JAVA_HOME=/soft/jdk...4.分发配置$>cd /soft/hadoop/etc/$>scp -r full centos@s202:/soft/hadoop/etc/$>scp -r full centos@s203:/soft/hadoop/etc/$>scp -r full centos@s204:/soft/hadoop/etc/

到现在完全的分布式已经配好了,我们现在来梳理一下现在我们系统上的文件结构。

1、hadoop安装及其文件结构相关推荐

  1. Hadoop安装及eclipse配置

    Hadoop安装 彻底关闭防火墙 chkconfig iptables off 查看主机名 hostname 修改主机名 vim /etc/sysconfig/network 修改之后不会立即执行需要 ...

  2. Hadoop安装与配置问题说明

    说明:本博客对Hadoop安装与配置过程中可能存在的问题做简单记录 启动Hadoop hadoop@ubuntu16:/usr/local/java/hadoop/hadoop-2.7.1$ ./sb ...

  3. Hadoop 安装详解--新手必备

    准备: 这次学习,我使用的是虚拟机vmware,安装了3台虚拟机,系统为centos 5(其它版本亦可),主机名依次命名为hdfs1.hdfs2.hdfs3,ip地址一次为:172.16.16.1.1 ...

  4. hadoop安装部署(伪分布及集群)

    hadoop安装部署(伪分布及集群) @(HADOOP)[hadoop] hadoop安装部署伪分布及集群 第一部分伪分布式 一环境准备 二安装hdfs 三安装YARN 第二部分集群安装 一规划 一硬 ...

  5. hadoop安装与配置

    转:链接: Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04 Hadoop集群安装配置教程_Hadoop2.6.0_Ubuntu/CentOS 转载于:http ...

  6. Hadoop安装及配置

    Hadoop的三种运行模式 单机模式(Standalone,独立或本地模式):安装简单,运行时只启动单个进程,仅调试用途: 伪分布模式(Pseudo-Distributed):在单节点上同时启动nam ...

  7. 大数据学习(2-1)-Hadoop安装教程-单机模式和伪分布模式(Ubuntu14.04LTS)

    文章目录 目录 1.linxu的安装 1.1安装Linux虚拟机 1.2安装Linux和Windows双系统 2.Hadoop的安装 2.1 Hadoop安装前配置 2.1.1 配置Hadoop用户 ...

  8. Hadoop伪分布式配置和搭建,hadoop单机安装,wordcount实例测试,hadoop安装java目录怎么找,问题及问题解决方法

    Hadoop伪分布式配置和搭建,hadoop单机安装,wordcount实例测试,hadoop安装java目录怎么找,问题及问题解决方法 环境说明 系统:ubuntu18.04 主机名:test1 用 ...

  9. hadoop服务器系统设置win10,win10系统hadoop安装配置的设置技巧

    win10系统使用久了,好多网友反馈说关于对win10系统hadoop安装配置设置的方法,在使用win10系统的过程中经常不知道如何去对win10系统hadoop安装配置进行设置,有什么好的办法去设置 ...

最新文章

  1. 为什么不采用“两次握手”建立连接呢?
  2. 请你解释一下什么是线程池(thread pool)?
  3. 网络知识:路由器要不要每天重启?很多人都做错了,难怪网速慢
  4. 楼梯计算机公式,各种楼梯面积的计算公式汇总
  5. Git管理代码常用术语
  6. Java Web文件下载
  7. Python: str.split()和re.split()的区别
  8. 在日本租房有什么经验建议分享?
  9. python基础----Day06
  10. hexo入门学习(六):文章图片存储到七牛云
  11. 教程 | Rhino Compute Sevice介绍及环境搭建
  12. 我开发了一款软件,完成了舔狗的绝地反杀(代码开源)!
  13. 奇虎360起诉瑞星和中关村在线
  14. 工厂模式与建造者模式
  15. Download模块 (十三)
  16. FLT3_ITD分析
  17. ISO转换QCOW2格式
  18. 销售业绩管理系统 c语言作业,管理信息系统知识
  19. Echarts主题和调色盘以及颜色渐变
  20. stm32 程序结构

热门文章

  1. 画论91 黄宾虹《画语集萃》
  2. 创建boot项目卡在resolving dependenciesof
  3. Python分析《我不是药神》豆瓣评论
  4. 土肥圆的并行学习日记
  5. 设计模式之门面模式和调停者模式
  6. Hill Cipher 希尔密码 已知明文密文 求秘钥方法
  7. 没啥价值,不建议读——关于2019北京半程马拉松参赛体会
  8. 计算机组成原理:定点数和浮点数、校验码
  9. onfocus 事件onblur 事件
  10. 密度图的密度估计_scikitlearn — 密度估计