Linux alarm signal (SIGALRM) to detach process isAlive

2024-06-12 03:48

本文主要是介绍Linux alarm signal (SIGALRM) to detach process isAlive,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

题记

最近做项目遇到的问题,程序跑了多个process,每个process都是相互独立的,为了解耦,类似于微服务的架构,我们要求系统可以detach 到 主线程跑飞,死循环等其他bug 问题,最初的设计方案是:每个process 都会给每一个monitor的process 去发送keep alive 消息,由monitor去收集每个module的keep alive消息,然后去判断是否process 跑飞等情况。但是这种方案,由于需要多一个monitor模块,在本来内存有限的嵌入式设备上,有点得不偿失,后来就想能否有linux 系统内部的 实现可以达到我们的要求,也就是 SIGALRM

1. Signal & Semaphore 区别

Signal: 是通过软中断信号通知进程发生了异步事件。进程之间可以通过系统调用kill 发送软中断信号,内核也可以因为内部事件而给进程发送信号,通知进程发生了某个事件。

Semaphore: 信号量是用来操作系统进程间同步访问共享资源。信号量在创建时需要设置一个初始值,表示同时可以有几个任务可以访问该信号量保护的共享资源,初始值为1就变成互斥锁(Mutex),即同时只能有一个任务可以访问信号量保护的共享资源。

2. SIGALRM 以及python code 实现
SIGALRM是在定时器终止时发送给进程的信号,在进行阻塞式系统调用时,为避免进程陷入无限的等待,可以为阻塞式系统调用设置定时器。
#include <unistd.h>
unsigned int alarm(unsigned int seconds);

在alarm成功调用后,开始计时,超过该事件将触发SIGALARM信号,然后会调到handler 执行。如下 是python的例子,

import signal,time,sys,thread,tracebackclass Example:def __init__(self):self.handler_counter = 0self.retry_counter = 3passdef timout_handler(self, signum, frame):'''timeout handler when failed to send signal alarmthere is a retry to make sure main thread hung'''self.handler_counter += 1print "call timeout_handler counter: " + str(self.handler_counter)if self.handler_counter == self.retry_counter:print("Have retry %s, exit process", self.retry_counter)traceback.print_stack(frame)  # print tracebacksys.exit()def monitor_alive(self, threadName, delay):'''monitor alive to send alarm message every (delay + 1) second, if after (delay + 1) doesn't receive response fromkernel, will interrupt timout_handler'''count = 0while True:time.sleep(delay)signal.alarm(delay + 1)print "sign_time count " + str(count)# below if logic to mock 3 time timeoutif count == 2:time.sleep(delay)if count == 4:time.sleep(delay)if count == 6:time.sleep(delay)count += 1print "%s: %s" % (threadName, time.ctime(time.time()))if __name__ == '__main__':example = Example()# register handler# only could set signal handler in main thread# https://stackoverflow.com/questions/44151888/why-only-main-thread-can-set-signal-handler-in-pythonsignal.signal(signal.SIGALRM, example.timout_handler)thread.start_new_thread(example.monitor_alive, ("Thread-1", 2,))while True:time.sleep(2)print('main thread ')

运行结果:

sign_time count 0
Thread-1: Sat Jun  9 10:52:43 2018
main thread 
sign_time count 1
Thread-1: Sat Jun  9 10:52:45 2018
main thread 
sign_time count 2
main thread 
Thread-1: Sat Jun  9 10:52:49 2018
main thread 
call timeout_handler counter: 1
main thread 
sign_time count 3
Thread-1: Sat Jun  9 10:52:51 2018
main thread 
sign_time count 4
main thread 
Thread-1: Sat Jun  9 10:52:55 2018
main thread 
call timeout_handler counter: 2
main thread 
sign_time count 5
Thread-1: Sat Jun  9 10:52:57 2018
main thread 
sign_time count 6
main thread 
Thread-1: Sat Jun  9 10:53:01 2018
main thread 
call timeout_handler counter: 3
('Have retry %s, exit process', 3)File "/home/odl/sereno/tests/singal.py", line 52, in <module>time.sleep(2)


这篇关于Linux alarm signal (SIGALRM) to detach process isAlive的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1053118

相关文章

Linux join命令的使用及说明

《Linuxjoin命令的使用及说明》`join`命令用于在Linux中按字段将两个文件进行连接,类似于SQL的JOIN,它需要两个文件按用于匹配的字段排序,并且第一个文件的换行符必须是LF,`jo... 目录一. 基本语法二. 数据准备三. 指定文件的连接key四.-a输出指定文件的所有行五.-o指定输出

Linux jq命令的使用解读

《Linuxjq命令的使用解读》jq是一个强大的命令行工具,用于处理JSON数据,它可以用来查看、过滤、修改、格式化JSON数据,通过使用各种选项和过滤器,可以实现复杂的JSON处理任务... 目录一. 简介二. 选项2.1.2.2-c2.3-r2.4-R三. 字段提取3.1 普通字段3.2 数组字段四.

Linux kill正在执行的后台任务 kill进程组使用详解

《Linuxkill正在执行的后台任务kill进程组使用详解》文章介绍了两个脚本的功能和区别,以及执行这些脚本时遇到的进程管理问题,通过查看进程树、使用`kill`命令和`lsof`命令,分析了子... 目录零. 用到的命令一. 待执行的脚本二. 执行含子进程的脚本,并kill2.1 进程查看2.2 遇到的

Linux云服务器手动配置DNS的方法步骤

《Linux云服务器手动配置DNS的方法步骤》在Linux云服务器上手动配置DNS(域名系统)是确保服务器能够正常解析域名的重要步骤,以下是详细的配置方法,包括系统文件的修改和常见问题的解决方案,需要... 目录1. 为什么需要手动配置 DNS?2. 手动配置 DNS 的方法方法 1:修改 /etc/res

Linux创建服务使用systemctl管理详解

《Linux创建服务使用systemctl管理详解》文章指导在Linux中创建systemd服务,设置文件权限为所有者读写、其他只读,重新加载配置,启动服务并检查状态,确保服务正常运行,关键步骤包括权... 目录创建服务 /usr/lib/systemd/system/设置服务文件权限:所有者读写js,其他

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

Linux挂载linux/Windows共享目录实现方式

《Linux挂载linux/Windows共享目录实现方式》:本文主要介绍Linux挂载linux/Windows共享目录实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录文件共享协议linux环境作为服务端(NFS)在服务器端安装 NFS创建要共享的目录修改 NFS 配

linux系统中java的cacerts的优先级详解

《linux系统中java的cacerts的优先级详解》文章讲解了Java信任库(cacerts)的优先级与管理方式,指出JDK自带的cacerts默认优先级更高,系统级cacerts需手动同步或显式... 目录Java 默认使用哪个?如何检查当前使用的信任库?简要了解Java的信任库总结了解 Java 信

Linux命令rm如何删除名字以“-”开头的文件

《Linux命令rm如何删除名字以“-”开头的文件》Linux中,命令的解析机制非常灵活,它会根据命令的开头字符来判断是否需要执行命令选项,对于文件操作命令(如rm、ls等),系统默认会将命令开头的某... 目录先搞懂:为啥“-”开头的文件删不掉?两种超简单的删除方法(小白也能学会)方法1:用“--”分隔命

Linux五种IO模型的使用解读

《Linux五种IO模型的使用解读》文章系统解析了Linux的五种IO模型(阻塞、非阻塞、IO复用、信号驱动、异步),重点区分同步与异步IO的本质差异,强调同步由用户发起,异步由内核触发,通过对比各模... 目录1.IO模型简介2.五种IO模型2.1 IO模型分析方法2.2 阻塞IO2.3 非阻塞IO2.4