需要软件:

ssh:fedore 9 自带。

jdk:http://java.sun.com/javase/downloads/index.jsp,下最近版本jdk-6u18-linux-i586

Hadoop:http://apache.etoak.com/hadoop/core/hadoop-0.20.1/,最新版本0.20.1,据说这个版本jdk必须1.6以上。

三种运行模式:

单机(非分布式)模式,伪分布式运行模式(用不同进程模仿分布式运行中的各类结点),分布式运行模式。

其中前两种运行模式体现不了Hadoop分布式计算的优势,并没有什么实际意义,但对程序的测试及调试很有帮助。现在只有一台机器, 主要想了解基于Hadoop的分布式并行程序是如何运行的。

单机模式安装步骤:

1.解压安装包至:/usr/local/hadoop

如果安装jdk已经设置了路径,安装完毕。否则:

2.cd /usr/local/hadoop/conf,修改hadoop-env.sh,最后一行添加:export JAVA_HOME=/usr/local/jdk1.6.0_18(jdk路径).

看看这玩意怎么跑的:

1.

[root@localhost hadoop]# mkdir input

[root@localhost hadoop]# cp conf/*.xml input

[root@localhost hadoop]# bin/hadoop jar hadoop-0.20.1-examples.jar grep input output 'dfs[a-z.]+'

10/01/26 00:22:54 INFO jvm.JvmMetrics: Initializing JVM Metrics with processName=JobTracker, sessionId=

10/01/26 00:22:54 INFO mapred.FileInputFormat: Total input paths to process : 5

...

[root@localhost hadoop]# cat output/*

1    dfsadmin

[root@localhost hadoop]# ls output/

part-00000

程序是hadoop自带的,把conf下的xml文件拷贝到input下作为输入,找到并显示所有与最后一个正则表达式匹配的行,输出到output.

jar 是 bin/hadoop 脚本定义的参数,会调用 Hadoop 自己的一个工具类 RunJar,这个工具类能够执行一个 Jar 文件。

2.

[root@localhost hadoop]# mkdir test-in

[root@localhost hadoop]# echo "hello world bye world" > test-in/file1.txt

[root@localhost hadoop]# echo "hello hadoop googbye hadoop" > test-in/file2.txt

[root@localhost hadoop]# bin/hadoop jar hadoop-0.20.1-examples.jar wordcount  test-in test-out

10/01/26 00:43:46 INFO jvm.JvmMetrics: Initializing JVM Metrics with processName=JobTracker, sessionId=

10/01/26 00:43:46 INFO input.FileInputFormat: Total input paths to process : 2

...

[root@localhost hadoop]# cat test-out/*

bye    1

googbye    1

hadoop    2

hello    2

world    2

[root@localhost hadoop]# ls test-out/

part-r-00000

这个程序也是hadoop自带的,统计各个单词出现次数。

刚开始上网搜的结果都是修改fs.default.name,mapred.job.tracker等等,都是分布式运行模式的配置,没想到单机模式这么简单,浪费了不少时间。

linux下的单机工具,Linux下单机模式的Hadoop部署相关推荐

  1. linux 下qt 终端隐藏在后台_20 个 Linux 终端下的生产力工具 | Linux 中国

    来试下这些开源工具.你的效率一定会提升. 来源:https://linux.cn/article-12274-1.html 作者:Alan Smithee 译者:Xiaobin.Liu 诚然,很多人使 ...

  2. linux配置文件密码加密工具,Linux下利用openssl对文件进行加密和解密

    转载地址:http://hi.baidu.com/edeed/item/99206a096b62d0e1ff240db8 --建立文件test.txt, 特意写入中英文# cd /tmp # echo ...

  3. linux 串口转网口工具,linux下串口调试工具/串口终端推荐: picocom(转)

    Servlet 3.0 异步模式 Servlet 3.0标准新增了异步处理的支持. 进行异步处理的Servlet和作用于该Servlet的拦截器都必须声明对于异步处理的支持. java 资源监控 ht ...

  4. Linux下阅读docx工具,Linux装机必备软件及工具.docx

    Linux装机必备软件及工具 Linux装机必备软件及工具首先说明一下ubuntu的软件安装大概有几种方式:CODE:首先说明一下ubuntu的软件安装大概有几种方式:1.deb包的安装方式deb是d ...

  5. linux rsa密钥生成工具,linux下生成rsa密钥的方法

    首先生成密钥,用命令ssh-keygen –t rsa 运行后可以一直空格,生成密钥,id_rsa和id_rsa.pub文件 ,默认放在/root/.ssh/下,.ssh文件是隐藏的,要显示隐藏文件才 ...

  6. linux 命令行 翻译工具,linux 命令行下的翻译工具

    linux 命令行下的翻译工具 Luo Weifeng 2011-7-16 第一种:著名的StarDict的命令行版sdcv 安装主程序: #apt-get install sdcv 安装词库: 21 ...

  7. linux 系统后门检测工具,Linux系统的各种后门和日志工具详细介绍[2]

    chfn 提升本地普通用户权限的程序 运行chfn 在它提示输入新的用户名时 如果用户输入rookit密码 他的权限就被提升为root chsh 提升本地用户权限的程序 运行chsh 在它提示输入新的 ...

  8. linux bes二进制查看工具,Linux的命令及工具

    1.查看系统运行的进程 # ps auxw 2.netstat命令 查看系统监听的服务 # netstat -ln -a所有的有效连接信息列表,包括已建立的连接(ESTABLISHED),也包括监听连 ...

  9. linux mysql异地备份工具,Linux中MySQL的异地自动备份

    Linux中MySQL的异地自动备份 文/李来祥 [摘要]@@ 随着校园网应用的日益丰富,Linux系统下MySQL数据库的应用也越来越广泛.然而数据的意外丢失对于校园网应用来说是很大的损失,业务数据 ...

  10. centos下python编程工具_CentOS下python的下载及安装

    针对" CentOS下python的下载及安装 "的问题,下面由IT产品经理-陆亦晓为您解答: Python这门编程语言在数据分析.数据发掘以及服务端开发等方面都有非常好的使用,我 ...

最新文章

  1. Java之Spring mvc详解(非原创)
  2. Science重磅!人类特有基因触发猴子长出更强大的大脑
  3. 第一章 Oracle 11g 数据库——在Windows 上安装部署
  4. 联想高校AI精英挑战赛中大收官,“人工智能眼科机器人”获全国总决赛最后入场券
  5. 【Win 10应用开发】Adaptive磁贴模板的XML文档结构
  6. android圆角柱状图,MPAndroidChart 圆角柱状图-Go语言中文社区
  7. 《BGP设计与实现》一2.10 案例研究:BGP内存的使用评估
  8. py验证码-联众验证码接入
  9. 6款好用的文字云工具
  10. 使用canvas压缩图片大小
  11. 转载:“凤求凰”的解释,有才
  12. cur前缀_每个人必知的英语前缀大全
  13. Zookeeper之Leader选举
  14. 沉默是否是无言的抗争
  15. StarRocks 在中移物联网 PGW 实时会话业务领域的应用
  16. 【Maya】后台拍屏:以指定摄像机的视口拍屏
  17. 【Javaweb】TCP原理(三次握手四次挥手)
  18. 解决Win7系统插入耳机或音响没有声音教程
  19. 修复Linux 的GRUB引导文件
  20. 强制root工具kingoroot

热门文章

  1. java访问数据库方式_java数据库访问(二)—JDBC方式(配合连接池)
  2. 刷新页面,无论点击多少次让Element UI的Message消息提示弹出一个
  3. 推荐中的attention有什么作用?
  4. 他与她,一个两年前的故事
  5. 论文浅尝 - AAAI2020 | 迈向建立多语言义元知识库:用于 BabelNet Synsets 义元预测...
  6. 论文浅尝 | Interaction Embeddings for Prediction and Explanation
  7. 论文浅尝 | 基于知识图谱嵌入的 Bootstrapping 实体对齐方法
  8. 技术动态 | 自底向上构建知识图谱全过程
  9. 面向中文自然语言处理的60余类系统开源实践项目与工业探索索引
  10. 【秒懂】号称最为简明实用的Django上手教程