详解 WordCount 运行后历史日志记录

2024-06-07 15:58

本文主要是介绍详解 WordCount 运行后历史日志记录,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在 《Hadoop-2.5.0-cdh5.3.2 HA 安装》 一文中我们已经详细讲述了如何搭建 HA 模式,同时最后还演示了运行其自带的 wordcount 程序,详情请参考 运行 Hadoop自带 wordcount 程序 。先简要回顾下:

  • 一 Hadoop 日志基本概念
    • 1 运行 wordcount 程序
    • 2 控制台输出结果
  • 二 Hadoop History 服务器网页详解
    • 1 ResourceManager Web 界面
    • 2 application 界面
    • 3 Job Overview 界面
    • 4 小结
  • 三 Hadoop 任务运行日志 Container 日志 收集过程详解
  • 四 Hadoop 作业日志收集过程详解
    • 1 步骤一启动作业的 ApplicationMaster 并写日志至 HDFS
    • 2 步骤二HDFS 内转移历史运行日志
    • 3 步骤三 周期转移 done_intermediate 中的日志文件到 done 目录
    • 4 概念拓展


一. Hadoop 日志基本概念

1. Hadoop 系统服务日志

2. Mapreduce 程序日志

  • 作业运行日志
  • 任务运行日志 (Container 日志)

其中需要我们关注容易混淆的概念:

  • Mapreduce 程序日志 的查看是需要开启 历史日志服务器 后才能查看到
  • 其中 日志聚集 功能是针对 任务运行日志 (Container 日志) 而言的!

更多关于Hadoop 日志原理以及相应配置请参考:http://blog.csdn.net/u011414200/article/details/50338073


1.1 运行 wordcount 程序

  • 已经启动了必需的各项进程:namenode、datanode、resourcemanager、nodemanager、JobHistoryServer 等

  • 确保当前 hdfs 不处于安全模式

hdfs dfsadmin -safemode leave
  • 确保已经在 HDFS 中创建了相关目录 /data/wordcount/output ,以下 /tmp 及其以下目录是启动 JobHistoryServer 后系统自动生成的

  • 上传了测试数据集 slaves

    这里写图片描述

hadoop fs -put /usr/local/cluster/hadoop/etc/hadoop/slaves /data/wordcount/
  • 进入程序所在目录,并运行程序
cd /usr/local/cluster/hadoop/share/hadoop/mapreduce 
hadoop jar hadoop-mapreduce-examples-2.5.0-cdh5.3.2.jar wordcount /data/wordcount /output/wordcount

1.2 控制台输出结果

15/12/22 00:30:36 INFO input.FileInputFormat: Total input paths to process : 1
15/12/22 00:30:37 INFO mapreduce.JobSubmitter: number of splits:1
15/12/22 00:30:37 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1450714294593_0001
15/12/22 00:30:37 INFO impl.YarnClientImpl: Submitted application application_1450714294593_0001
15/12/22 00:30:37 INFO mapreduce.Job: The url to track the job: http://master5:8088/proxy/application_1450714294593_0001/
15/12/22 00:30:37 INFO mapreduce.Job: Running job: job_1450714294593_0001
15/12/22 00:30:43 INFO mapreduce.Job: Job job_1450714294593_0001 running in uber mode : false
15/12/22 00:30:43 INFO mapreduce.Job:  map 0% reduce 0%
15/12/22 00:30:49 INFO mapreduce.Job:  map 100% reduce 0%
15/12/22 00:31:04 INFO mapreduce.Job:  map 100% reduce 100%
15/12/22 00:31:05 INFO mapreduce.Job: Job job_1450714294593_0001 completed successfully
15/12/22 00:31:05 INFO mapreduce.Job: Counters: 49File System CountersFILE: Number of bytes read=48FILE: Number of bytes written=212385FILE: Number of read operations=0FILE: Number of large read operations=0FILE: Number of write operations=0HDFS: Number of bytes read=125HDFS: Number of bytes written=30HDFS: Number of read operations=6

这篇关于详解 WordCount 运行后历史日志记录的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1039627

相关文章

Java Stream流使用案例深入详解

《JavaStream流使用案例深入详解》:本文主要介绍JavaStream流使用案例详解,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录前言1. Lambda1.1 语法1.2 没参数只有一条语句或者多条语句1.3 一个参数只有一条语句或者多

SpringBoot整合mybatisPlus实现批量插入并获取ID详解

《SpringBoot整合mybatisPlus实现批量插入并获取ID详解》这篇文章主要为大家详细介绍了SpringBoot如何整合mybatisPlus实现批量插入并获取ID,文中的示例代码讲解详细... 目录【1】saveBATch(一万条数据总耗时:2478ms)【2】集合方式foreach(一万条数

Python装饰器之类装饰器详解

《Python装饰器之类装饰器详解》本文将详细介绍Python中类装饰器的概念、使用方法以及应用场景,并通过一个综合详细的例子展示如何使用类装饰器,希望对大家有所帮助,如有错误或未考虑完全的地方,望不... 目录1. 引言2. 装饰器的基本概念2.1. 函数装饰器复习2.2 类装饰器的定义和使用3. 类装饰

MySQL 中的 JSON 查询案例详解

《MySQL中的JSON查询案例详解》:本文主要介绍MySQL的JSON查询的相关知识,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录mysql 的 jsON 路径格式基本结构路径组件详解特殊语法元素实际示例简单路径复杂路径简写操作符注意MySQL 的 J

Python ZIP文件操作技巧详解

《PythonZIP文件操作技巧详解》在数据处理和系统开发中,ZIP文件操作是开发者必须掌握的核心技能,Python标准库提供的zipfile模块以简洁的API和跨平台特性,成为处理ZIP文件的首选... 目录一、ZIP文件操作基础三板斧1.1 创建压缩包1.2 解压操作1.3 文件遍历与信息获取二、进阶技

一文详解Java异常处理你都了解哪些知识

《一文详解Java异常处理你都了解哪些知识》:本文主要介绍Java异常处理的相关资料,包括异常的分类、捕获和处理异常的语法、常见的异常类型以及自定义异常的实现,文中通过代码介绍的非常详细,需要的朋... 目录前言一、什么是异常二、异常的分类2.1 受检异常2.2 非受检异常三、异常处理的语法3.1 try-

Java中的@SneakyThrows注解用法详解

《Java中的@SneakyThrows注解用法详解》:本文主要介绍Java中的@SneakyThrows注解用法的相关资料,Lombok的@SneakyThrows注解简化了Java方法中的异常... 目录前言一、@SneakyThrows 简介1.1 什么是 Lombok?二、@SneakyThrows

Java中字符串转时间与时间转字符串的操作详解

《Java中字符串转时间与时间转字符串的操作详解》Java的java.time包提供了强大的日期和时间处理功能,通过DateTimeFormatter可以轻松地在日期时间对象和字符串之间进行转换,下面... 目录一、字符串转时间(一)使用预定义格式(二)自定义格式二、时间转字符串(一)使用预定义格式(二)自

Redis Pipeline(管道) 详解

《RedisPipeline(管道)详解》Pipeline管道是Redis提供的一种批量执行命令的机制,通过将多个命令一次性发送到服务器并统一接收响应,减少网络往返次数(RTT),显著提升执行效率... 目录Redis Pipeline 详解1. Pipeline 的核心概念2. 工作原理与性能提升3. 核

Python正则表达式语法及re模块中的常用函数详解

《Python正则表达式语法及re模块中的常用函数详解》这篇文章主要给大家介绍了关于Python正则表达式语法及re模块中常用函数的相关资料,正则表达式是一种强大的字符串处理工具,可以用于匹配、切分、... 目录概念、作用和步骤语法re模块中的常用函数总结 概念、作用和步骤概念: 本身也是一个字符串,其中