点击关注上方“知了小巷”,

设为“置顶或星标”,第一时间送达干货。

Hadoop YARN日志查看方式

实验环境CDH6.3.2

Hadoop版本

$ hadoop versionHadoop 3.0.0-cdh6.3.2Source code repository http://github.com/cloudera/hadoop -r 9aff20de3b5ecccf3c19d57f71b214fb4d37ee89Compiled by jenkins on 2019-11-08T13:49ZCompiled with protoc 2.5.0From source with checksum f539c87da37534aad732f2a7ddcc59This command was run using /opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/jars/hadoop-common-3.0.0-cdh6.3.2.jar

Hive版本

hive> select version();OK2.1.1-cdh6.3.2 rb3393cf499504df1d2a12d34b4285e5d0c02be11Time taken: 0.877 seconds, Fetched: 1 row(s)

运行一个示例MapReduce任务-计算圆周率

$ sudo -u hdfs hadoop jar /opt/cloudera/parcels/CDH/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar pi 10 100WARNING: Use "yarn jar" to launch YARN applications.Number of Maps  = 10Samples per Map = 100Wrote input for Map #0...Wrote input for Map #9Starting Job...Job Finished in 26.594 secondsEstimated value of Pi is 3.14800000000000000000

YARN日志重要性

应用程序日志(以及关联的Container日志)在对可能出现异常的YARN应用程序进行调试上、性能优化上相当重要。YARN提供了一个良好的框架,通过日志聚合收集、存储以及界面查看应用程序日志。

YARN提供了两种查看日志的方式:ResourceManager Web UI查看日志和Job HistoryServer Web UI查看日志;一个是查看当前正在执行以及历史的所有任务,第二个是可以查看历史的所有任务。

ResourceManager Web UI

从CDH里面点击链接进行访问,默认是域名(hostname)和默认端口8088:
http://zlxx-test1-110:8088/cluster

  • zlxx-test1-110:YARN ResourceManager角色所在服务器的hostname。
  • 8088:yarn-site.xml中配置的yarn.resourcemanager.webapp.address默认值。

ResourceManager Web UI页面

如上图,最左边包含Cluster和Tools两个菜单。Cluster下面主要包括:About、Nodes、Node Labels和Applications、Scheduler。

查看已完成的YARN应用列表

http://zlxx-test1-110:8088/cluster/apps/FINISHED

Scheduler
YARN调度器的相关信息,最主要的是Application Queues

Tools

如果没有服务器登录或操作权限,则可以通过Tools下的Local Logs查看异常日志信息和Configuration服务器配置文件信息,比如搜索webapp.adress配置。
http://zlxx-test1-110:8088/conf

Job HistoryServer Web UI

JobHistory是JobHistory Server上收集到的日志,内容只包括历史存档的YARN应用。

  • zlxx-test1-110:JobHistory Server角色所在服务器的hostname。
  • 19888:yarn-site.xml中配置的mapreduce.jobhistory.webapp.address默认值。

http://zlxx-test1-110:19888/jobhistory

Retired Jobs下有13列信息:

  • Submit Time:MR Job的提交时间
  • Start Time:MR Job的运行开始时间
  • Finish Time:MR Job的运行结束时间
  • Job ID:MR Job运行时被分配的Job ID
  • Name:Job名称,一般不需要特别指定
  • User:提交Job的用户,一般是对应的服务器所在的Linux用户
  • Queue:提交Job的队列名称
  • State:Job运行结束后的最终状态,SUCCESSED、KILLED、FAILED
  • Maps Total:Job运行所分配的总的Map数量
  • Maps Completed:运行完成的Map数量
  • Reduces Total:Job运行所分配的总的Reduce数量
  • Reduces Completed:运行完成的Reduce数量
  • Elapsed Time:14:46:51-14:46:36=15sec,从Job运行开始到Job运行结束所消耗的时间(long)
  1. 图中Job提交时间是2020.12.11 14:46:27 CST,Job运行开始时间是2020.12.11 14:46:36 CST,从Job提交到Job运行开始,还会经历被YARN集群的调度队列Accept的过程,如果两个时间间隔比较长,则意味着YARN Scheduler的Queue资源利用紧张,需要注意集群队列的资源分配情况是否合理。
  2. Job运行时分配的Map数量和最终完成的Map数量,可能由于集群节点故障或者Map失败,使得两个的数量不一致。
  3. Reduce数量和Map是类似的。

猜你喜欢

  • ClouderaManager6.3.1+CDH6.3.2+PHOENIX-5.0.0集成部署

  • 大数据基础:Linux操作系统(下)

  • 大数据基础:Linux操作系统(上)

  • Apache Kafka客户端KafkaProducer

点一下,代码无 Bug

hadoop yarn 获取日志_Hadoop YARN日志查看方式相关推荐

  1. hadoop yarn 获取日志_Hadoop YARN配置参数剖析(2)—权限与日志聚集相关参数

    注意,配置这些参数前,应充分理解这几个参数的含义,以防止误配给集群带来的隐患.另外,这些参数均需要在yarn-site.xml中配置. 1.    权限相关配置参数 这里的权限由三部分组成,分别是:( ...

  2. hadoop yarn 获取日志_在 YARN 中简化用户日志的管理和使用

    Hadoop 的用户日志有很多的用途, 首先最重要的是, 它们能用来调试 MapReduce 应用(application)的问题, 可能是应用本身的问题, 或者在极少数的情况下, 当在集群中执行应用 ...

  3. yarn 怎么查看有多个job在跑_flink on yarn 模式下提示yarn资源不足问题分析

    背景 在实时计算平台上通过YarnClient向yarn上提交flink任务时一直卡在那里,并在client端一直输出如下日志: (YarnClusterDescriptor.java:1036)- ...

  4. Hadoop生态圈(九)YARN架构深入学习

    1. YARN框架概述 1.1 YARN产生和发展简史 1.1.1 Hadoop演进阶段 数据.程序.运算资源(内存.cpu)三者组在一起,完成了数据的计算处理过程.在单机环境下,这些都不是太大问题. ...

  5. Hadoop性能调优、YARN的内存和CPU配置

    转 Hadoop性能调优.YARN的内存和CPU配置 2018年06月12日 21:01:54 toto1297488504 阅读数:2417 转: https://blog.csdn.net/deh ...

  6. Hadoop技术(二)资源管理器YARN和分布式计算框架MapReduce

    资源管理器YARN和分布式计算框架MapReduce 第一章 Hadoop MapReduce 是什么 一 MapReduce 介绍 1. 基本介绍 2. MR数据流程方向 3. MR 原语/ 核心思 ...

  7. filebeat获取nginx的access日志配置

    filebeat获取nginx的access日志配置产生nginx日志的服务器即生产者服务器配置: 拿omp.chinasoft.com举例: 1.nginx.conf主配置文件添加日志格式log_f ...

  8. Hadoop实例之利用MapReduce实现日志清洗(附源代码)

    通过hadoop的分布式文件系统与MR完成日常日志文件的数据处理,以求达到数据清洗的目的. 日志数据格式: 27.19.74.143 - - [30/Mar/2015:17:38:20 +0800] ...

  9. oracle的asmcmd获取归档日志,分析oracle的联机日志和归档日志

    logminer和配置 安装logminer 以sqlplus / as sysdba登录系统数据库系统,ORACLE默认安装logminer,如果没有安装,执行SQL脚本安装 --安装logmine ...

最新文章

  1. 用Cmake编译Opencv源码,生成动态库
  2. 通读AFN②--AFN的上传和下载功能分析、SessionTask及相应的session代理方法的使用细节...
  3. java 字符串对齐_最佳字符串对齐的Java实现
  4. linux中resize的含义,linux的resize2fs命令
  5. UOJ#386. 【UNR #3】鸽子固定器(链表)
  6. 7月共处理钓鱼网站1921个:非CN域名达1911 个
  7. cursor游标(mysql)
  8. pybaobabdt 推荐一款超高颜值的模型可视化库
  9. I - 数塔(动态规划)数塔问题
  10. 201703:SuiteCRM自定义筛选界面
  11. 四 实例 图像的手绘效果
  12. 冯言冯语说DSP(二)序列的z变换
  13. Android_Provision
  14. 复旦大学python教程_复旦大学大数据学院本科生课程学习手册.PDF
  15. python爬虫实战-如何批量爬取唯品会商品信息>>>
  16. 电脑打开“我的电脑”、“资源管理器”很慢的解决办法。
  17. laravel 条形码
  18. rabbitMQ概述/在springboot下测试五种模式
  19. html图片左右转换,jquery实现图片左右切换的方法
  20. Kdevelop安装与使用说明

热门文章

  1. linux每日命令(13):more命令
  2. makeObjectsPerformSelector 方法的用法
  3. GitHub 源代码疑遭泄漏
  4. 外汇交易所巨头 Travelex 遭攻击暂停服务,详情不明
  5. zookeeper学习02 使用
  6. AndroidStudio基本设置,以及一些使用小技巧
  7. Redis添加密码认证Cacti监控读取Redis状态值为-1的最快速解决方案
  8. iOS真机UI调试利器——Reveal
  9. cocos2d-x-3.0 build不成功
  10. struts2:表单标签