【hadoop】 3003-mapreduce任务的提交

2023-11-29 04:32

本文主要是介绍【hadoop】 3003-mapreduce任务的提交,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、通过Eclipse下本地运行

可以参考  【hadoop】 3002-mapreduce程序统计单词个数示例 章节的演示


二、集群方式通过jar包形式运行
1、处理数据的作业达成jar包并上传hdfs
[hadoop@cloud01 HDFSdemo]$ pwd
/home/hadoop/workspace/HDFSdemo
[hadoop@cloud01 HDFSdemo]$ ll
total 139844
drwxrwxr-x. 5 hadoop hadoop      4096 Feb 24 18:10 bin
-rw-rw-r--. 1 hadoop hadoop       440 Feb 20 06:56 core-site.xml
-rw-rw-r--. 1 hadoop hadoop       256 Feb 20 06:56 hdfs-site.xml
drwxrwxr-x. 2 hadoop hadoop      4096 Feb 20 06:34 lib
-rw-rw-r--. 1 hadoop hadoop       253 Feb 20 06:56 mapred-site.xml
drwxrwxr-x. 5 hadoop hadoop      4096 Feb 24 18:10 src
-rw-rw-r--. 1 hadoop hadoop 143167974 Feb 24 21:41  wc.jar
-rw-rw-r--. 1 hadoop hadoop       434 Feb 20 06:56 yarn-site.xml

2、启动yarn,执行start-yarn.sh 命令 
[hadoop@cloud01 HDFSdemo]$ start-yarn.sh

[hadoop@cloud01 HDFSdemo]$ jps
22901 Jps
17507 DataNode
22510  NodeManager
17414 NameNode
2721
22413  ResourceManager


3、分布式执行wc.jar 
[hadoop@cloud01 ~]$ hadoop jar workspace/HDFSdemo/wc.jar mapreduce.WordCount 

3.1 执行过程日志情况
-- 连接ResourceManager: client.RMProxy: Connecting to ResourceManager
-- 获取分片,每个分片对应一个Map任务:input.FileInputFormat: Total input paths to process : 1
--生成本次运行的job编码:mapreduce.JobSubmitter: Submitting tokens for job: job_1424843731958_0002
--运行要执行的jar文件:mapreduce.Job: Running job: job_1424843731958_0002
--显示map和reduce执行进度
15/02/24 22:09:30 INFO mapreduce.Job:  map 0% reduce 0%
15/02/24 22:09:39 INFO mapreduce.Job:  map 100% reduce 0%
15/02/24 22:09:52 INFO mapreduce.Job:  map 100% reduce 100%
15/02/24 22:09:53 INFO mapreduce.Job: Job job_1424843731958_0002 completed successfully

3.2 MR整个过程的进程变化情况
ResourceManage,NodeManager->RunJar->MRAppMaster->YarnChild

随着MR程序进度的执行,响应的进程也随着退出,退出的顺序为
YarnChild->MRAppMaster->RunJar


3.3 图形方式给出对应的处理流程
图1


图2



file:/tmp/hadoop-hadoop/mapred/staging/hadoop1721666591/.staging/job_local1721666591_0001
file:/tmp/hadoop-hadoop/mapred/staging/hadoop1721666591/.staging/job_local1721666591_0001/job.xml

常见问题
1、INFO ipc.Client: Retrying connect to server: cloud01/192.168.2.31:8032. Already tried 9 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)

该问题是因为yarn没有启动,需要执行start-yarn.sh 



这篇关于【hadoop】 3003-mapreduce任务的提交的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/431457

相关文章

一文详解MySQL如何设置自动备份任务

《一文详解MySQL如何设置自动备份任务》设置自动备份任务可以确保你的数据库定期备份,防止数据丢失,下面我们就来详细介绍一下如何使用Bash脚本和Cron任务在Linux系统上设置MySQL数据库的自... 目录1. 编写备份脚本1.1 创建并编辑备份脚本1.2 给予脚本执行权限2. 设置 Cron 任务2

IDEA实现回退提交的git代码(四种常见场景)

《IDEA实现回退提交的git代码(四种常见场景)》:本文主要介绍IDEA实现回退提交的git代码(四种常见场景),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1.已提交commit,还未push到远端(Undo Commit)2.已提交commit并push到

MySQL中的两阶段提交详解(2PC)

《MySQL中的两阶段提交详解(2PC)》:本文主要介绍MySQL中的两阶段提交(2PC),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录引言两阶段提交过程sync_binlog配置innodb_flush_log_at_trx_commit配置总结引言在Inn

Django之定时任务django-crontab的实现

《Django之定时任务django-crontab的实现》Django可以使用第三方库如django-crontab来实现定时任务的调度,本文主要介绍了Django之定时任务django-cront... 目录crontab安装django-crontab注册应用定时时间格式定时时间示例设置定时任务@符号

Android实现定时任务的几种方式汇总(附源码)

《Android实现定时任务的几种方式汇总(附源码)》在Android应用中,定时任务(ScheduledTask)的需求几乎无处不在:从定时刷新数据、定时备份、定时推送通知,到夜间静默下载、循环执行... 目录一、项目介绍1. 背景与意义二、相关基础知识与系统约束三、方案一:Handler.postDel

springboot使用Scheduling实现动态增删启停定时任务教程

《springboot使用Scheduling实现动态增删启停定时任务教程》:本文主要介绍springboot使用Scheduling实现动态增删启停定时任务教程,具有很好的参考价值,希望对大家有... 目录1、配置定时任务需要的线程池2、创建ScheduledFuture的包装类3、注册定时任务,增加、删

Spring Boot 集成 Quartz并使用Cron 表达式实现定时任务

《SpringBoot集成Quartz并使用Cron表达式实现定时任务》本篇文章介绍了如何在SpringBoot中集成Quartz进行定时任务调度,并通过Cron表达式控制任务... 目录前言1. 添加 Quartz 依赖2. 创建 Quartz 任务3. 配置 Quartz 任务调度4. 启动 Sprin

Linux之计划任务和调度命令at/cron详解

《Linux之计划任务和调度命令at/cron详解》:本文主要介绍Linux之计划任务和调度命令at/cron的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux计划任务和调度命令at/cron一、计划任务二、命令{at}介绍三、命令语法及功能 :at

将Java项目提交到云服务器的流程步骤

《将Java项目提交到云服务器的流程步骤》所谓将项目提交到云服务器即将你的项目打成一个jar包然后提交到云服务器即可,因此我们需要准备服务器环境为:Linux+JDK+MariDB(MySQL)+Gi... 目录1. 安装 jdk1.1 查看 jdk 版本1.2 下载 jdk2. 安装 mariadb(my

SpringQuartz定时任务核心组件JobDetail与Trigger配置

《SpringQuartz定时任务核心组件JobDetail与Trigger配置》Spring框架与Quartz调度器的集成提供了强大而灵活的定时任务解决方案,本文主要介绍了SpringQuartz定... 目录引言一、Spring Quartz基础架构1.1 核心组件概述1.2 Spring集成优势二、J