liunx下ETL(kettle)脚本定时任务(crontab)启动失败定位及解决

2024-05-24 23:18

本文主要是介绍liunx下ETL(kettle)脚本定时任务(crontab)启动失败定位及解决,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

现象:

       最近项目有使用ETL工具kettle进行数据抽取更新,最终在服务器上执行时需要进行定时启动;通过crontab-e配置之后发现没有启动成功,由于只有子用户权限,没有root用户及sudo权限,经过一番排查及操作才得以解决,故记录下来;

原有步骤:

1.kettle脚本的编写

Date=`date +%Y%m%d%H%M%S`
/app/ETL/kettle/kitchen.sh -file=/app/ETL/work/test/test.kjb -logfile=/app/ETL/work/test/log/etl_${Date}.log

命名为start_job.sh;并授权整个/app/ETL/目录744权限,脚本编写过程中推荐使用绝对路径;

执行./start_job.sh运行正常且日志打印正常;

2.编写crontab -e

通过crontab -e编写定时任务:

00 15 * * * /bin/sh /app/ETL/work/test/start_job.sh

出现crontab: installing new crontab表示定时任务编写成功,但等待发现任务并没有执行;

原因定位:

1.由于环境集中管理,手上并没有root用户及sudo权限,无法查询crontab日志;

有权限的可以通过日志查看;crontab 日志路径如下:/var/log/cron

2.由于无日志,通过service crond status查看crontab运行状态正常,并配置测试定时任务:

00 16 * * * date >> /app/time.log

发现测试任务运行正常;

3.通过网上一番查找,定位原因:

 crontab有一个坏毛病,就是它总是不会缺省的从用户profile文件中读取环境变量参数,经常导致在手工执行某个脚本时是成功的,但是到crontab中试图让它定期执行时就是会出错。

如执行ETL这个脚本需要java_home变量,有可能你使用的这个用户的java版本与root不一致,或者root账户就没有安装java;

我这里就是root账户下的jdk是1.7但ETL需要的是1.8;

解决方法:

解决方法有两个:

1.在elk脚本中指定相关变量:

start_job.sh编写如下:

set ff=unix
#!/bin/bash
export JAVA_HOME=/app/jdk1.8.0_181
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH
Date=`date +%Y%m%d%H%M%S`
/app/ETL/kettle/kitchen.sh -file=/app/ETL/work/test/test.kjb -logfile=/app/ETL/work/test/log/etl_${Date}.log

2.在crontab -e指定当前用户配置文件:

55 01 * * * . ~/.bash_profile;/bin/sh /app/ETL/work/test/start_job.sh

 其中. ~/.bash_profile;就是表示当前用户的隐藏配置文件;

推荐使用第二种方式;

关联问题记录:

1.在编写start_job.sh脚本时会出现/bin/sh^M: bad interpreter错误,可通过脚本头部添加 set ff=unix解决

2.crontab -e生效后不是立即就可以执行,需要2-3分钟之后,所以测试时要注意配置的corn时间;

 

这篇关于liunx下ETL(kettle)脚本定时任务(crontab)启动失败定位及解决的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/999811

相关文章

MySQL 定时新增分区的实现示例

《MySQL定时新增分区的实现示例》本文主要介绍了通过存储过程和定时任务实现MySQL分区的自动创建,解决大数据量下手动维护的繁琐问题,具有一定的参考价值,感兴趣的可以了解一下... mysql创建好分区之后,有时候会需要自动创建分区。比如,一些表数据量非常大,有些数据是热点数据,按照日期分区MululbU

SQL Server配置管理器无法打开的四种解决方法

《SQLServer配置管理器无法打开的四种解决方法》本文总结了SQLServer配置管理器无法打开的四种解决方法,文中通过图文示例介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录方法一:桌面图标进入方法二:运行窗口进入检查版本号对照表php方法三:查找文件路径方法四:检查 S

怎样通过分析GC日志来定位Java进程的内存问题

《怎样通过分析GC日志来定位Java进程的内存问题》:本文主要介绍怎样通过分析GC日志来定位Java进程的内存问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、GC 日志基础配置1. 启用详细 GC 日志2. 不同收集器的日志格式二、关键指标与分析维度1.

Java进程异常故障定位及排查过程

《Java进程异常故障定位及排查过程》:本文主要介绍Java进程异常故障定位及排查过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、故障发现与初步判断1. 监控系统告警2. 日志初步分析二、核心排查工具与步骤1. 进程状态检查2. CPU 飙升问题3. 内存

Redis出现中文乱码的问题及解决

《Redis出现中文乱码的问题及解决》:本文主要介绍Redis出现中文乱码的问题及解决,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1. 问题的产生2China编程. 问题的解决redihttp://www.chinasem.cns数据进制问题的解决中文乱码问题解决总结

Golang如何对cron进行二次封装实现指定时间执行定时任务

《Golang如何对cron进行二次封装实现指定时间执行定时任务》:本文主要介绍Golang如何对cron进行二次封装实现指定时间执行定时任务问题,具有很好的参考价值,希望对大家有所帮助,如有错误... 目录背景cron库下载代码示例【1】结构体定义【2】定时任务开启【3】使用示例【4】控制台输出总结背景

在Golang中实现定时任务的几种高效方法

《在Golang中实现定时任务的几种高效方法》本文将详细介绍在Golang中实现定时任务的几种高效方法,包括time包中的Ticker和Timer、第三方库cron的使用,以及基于channel和go... 目录背景介绍目的和范围预期读者文档结构概述术语表核心概念与联系故事引入核心概念解释核心概念之间的关系

Python中Tensorflow无法调用GPU问题的解决方法

《Python中Tensorflow无法调用GPU问题的解决方法》文章详解如何解决TensorFlow在Windows无法识别GPU的问题,需降级至2.10版本,安装匹配CUDA11.2和cuDNN... 当用以下代码查看GPU数量时,gpuspython返回的是一个空列表,说明tensorflow没有找到

springboot如何通过http动态操作xxl-job任务

《springboot如何通过http动态操作xxl-job任务》:本文主要介绍springboot如何通过http动态操作xxl-job任务的问题,具有很好的参考价值,希望对大家有所帮助,如有错... 目录springboot通过http动态操作xxl-job任务一、maven依赖二、配置文件三、xxl-

解决未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4‘问题

《解决未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4‘问题》:本文主要介绍解决未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4... 目录未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4‘打开pom.XM