Linux alarm signal (SIGALRM) to detach process isAlive

2024-06-12 03:48

本文主要是介绍Linux alarm signal (SIGALRM) to detach process isAlive,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

题记

最近做项目遇到的问题,程序跑了多个process,每个process都是相互独立的,为了解耦,类似于微服务的架构,我们要求系统可以detach 到 主线程跑飞,死循环等其他bug 问题,最初的设计方案是:每个process 都会给每一个monitor的process 去发送keep alive 消息,由monitor去收集每个module的keep alive消息,然后去判断是否process 跑飞等情况。但是这种方案,由于需要多一个monitor模块,在本来内存有限的嵌入式设备上,有点得不偿失,后来就想能否有linux 系统内部的 实现可以达到我们的要求,也就是 SIGALRM

1. Signal & Semaphore 区别

Signal: 是通过软中断信号通知进程发生了异步事件。进程之间可以通过系统调用kill 发送软中断信号,内核也可以因为内部事件而给进程发送信号,通知进程发生了某个事件。

Semaphore: 信号量是用来操作系统进程间同步访问共享资源。信号量在创建时需要设置一个初始值,表示同时可以有几个任务可以访问该信号量保护的共享资源,初始值为1就变成互斥锁(Mutex),即同时只能有一个任务可以访问信号量保护的共享资源。

2. SIGALRM 以及python code 实现
SIGALRM是在定时器终止时发送给进程的信号,在进行阻塞式系统调用时,为避免进程陷入无限的等待,可以为阻塞式系统调用设置定时器。
#include <unistd.h>
unsigned int alarm(unsigned int seconds);

在alarm成功调用后,开始计时,超过该事件将触发SIGALARM信号,然后会调到handler 执行。如下 是python的例子,

import signal,time,sys,thread,tracebackclass Example:def __init__(self):self.handler_counter = 0self.retry_counter = 3passdef timout_handler(self, signum, frame):'''timeout handler when failed to send signal alarmthere is a retry to make sure main thread hung'''self.handler_counter += 1print "call timeout_handler counter: " + str(self.handler_counter)if self.handler_counter == self.retry_counter:print("Have retry %s, exit process", self.retry_counter)traceback.print_stack(frame)  # print tracebacksys.exit()def monitor_alive(self, threadName, delay):'''monitor alive to send alarm message every (delay + 1) second, if after (delay + 1) doesn't receive response fromkernel, will interrupt timout_handler'''count = 0while True:time.sleep(delay)signal.alarm(delay + 1)print "sign_time count " + str(count)# below if logic to mock 3 time timeoutif count == 2:time.sleep(delay)if count == 4:time.sleep(delay)if count == 6:time.sleep(delay)count += 1print "%s: %s" % (threadName, time.ctime(time.time()))if __name__ == '__main__':example = Example()# register handler# only could set signal handler in main thread# https://stackoverflow.com/questions/44151888/why-only-main-thread-can-set-signal-handler-in-pythonsignal.signal(signal.SIGALRM, example.timout_handler)thread.start_new_thread(example.monitor_alive, ("Thread-1", 2,))while True:time.sleep(2)print('main thread ')

运行结果:

sign_time count 0
Thread-1: Sat Jun  9 10:52:43 2018
main thread 
sign_time count 1
Thread-1: Sat Jun  9 10:52:45 2018
main thread 
sign_time count 2
main thread 
Thread-1: Sat Jun  9 10:52:49 2018
main thread 
call timeout_handler counter: 1
main thread 
sign_time count 3
Thread-1: Sat Jun  9 10:52:51 2018
main thread 
sign_time count 4
main thread 
Thread-1: Sat Jun  9 10:52:55 2018
main thread 
call timeout_handler counter: 2
main thread 
sign_time count 5
Thread-1: Sat Jun  9 10:52:57 2018
main thread 
sign_time count 6
main thread 
Thread-1: Sat Jun  9 10:53:01 2018
main thread 
call timeout_handler counter: 3
('Have retry %s, exit process', 3)File "/home/odl/sereno/tests/singal.py", line 52, in <module>time.sleep(2)


这篇关于Linux alarm signal (SIGALRM) to detach process isAlive的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1053118

相关文章

Linux线程同步/互斥过程详解

《Linux线程同步/互斥过程详解》文章讲解多线程并发访问导致竞态条件,需通过互斥锁、原子操作和条件变量实现线程安全与同步,分析死锁条件及避免方法,并介绍RAII封装技术提升资源管理效率... 目录01. 资源共享问题1.1 多线程并发访问1.2 临界区与临界资源1.3 锁的引入02. 多线程案例2.1 为

Oracle数据库定时备份脚本方式(Linux)

《Oracle数据库定时备份脚本方式(Linux)》文章介绍Oracle数据库自动备份方案,包含主机备份传输与备机解压导入流程,强调需提前全量删除原库数据避免报错,并需配置无密传输、定时任务及验证脚本... 目录说明主机脚本备机上自动导库脚本整个自动备份oracle数据库的过程(建议全程用root用户)总结

Linux如何查看文件权限的命令

《Linux如何查看文件权限的命令》Linux中使用ls-R命令递归查看指定目录及子目录下所有文件和文件夹的权限信息,以列表形式展示权限位、所有者、组等详细内容... 目录linux China编程查看文件权限命令输出结果示例这里是查看tomcat文件夹总结Linux 查看文件权限命令ls -l 文件或文件夹

idea的终端(Terminal)cmd的命令换成linux的命令详解

《idea的终端(Terminal)cmd的命令换成linux的命令详解》本文介绍IDEA配置Git的步骤:安装Git、修改终端设置并重启IDEA,强调顺序,作为个人经验分享,希望提供参考并支持脚本之... 目录一编程、设置前二、前置条件三、android设置四、设置后总结一、php设置前二、前置条件

Linux系统中查询JDK安装目录的几种常用方法

《Linux系统中查询JDK安装目录的几种常用方法》:本文主要介绍Linux系统中查询JDK安装目录的几种常用方法,方法分别是通过update-alternatives、Java命令、环境变量及目... 目录方法 1:通过update-alternatives查询(推荐)方法 2:检查所有已安装的 JDK方

Linux系统之lvcreate命令使用解读

《Linux系统之lvcreate命令使用解读》lvcreate是LVM中创建逻辑卷的核心命令,支持线性、条带化、RAID、镜像、快照、瘦池和缓存池等多种类型,实现灵活存储资源管理,需注意空间分配、R... 目录lvcreate命令详解一、命令概述二、语法格式三、核心功能四、选项详解五、使用示例1. 创建逻

Linux下在线安装启动VNC教程

《Linux下在线安装启动VNC教程》本文指导在CentOS7上在线安装VNC,包含安装、配置密码、启动/停止、清理重启步骤及注意事项,强调需安装VNC桌面以避免黑屏,并解决端口冲突和目录权限问题... 目录描述安装VNC安装 VNC 桌面可能遇到的问题总结描js述linux中的VNC就类似于Window

linux下shell脚本启动jar包实现过程

《linux下shell脚本启动jar包实现过程》确保APP_NAME和LOG_FILE位于目录内,首次启动前需手动创建log文件夹,否则报错,此为个人经验,供参考,欢迎支持脚本之家... 目录linux下shell脚本启动jar包样例1样例2总结linux下shell脚本启动jar包样例1#!/bin

C++中detach的作用、使用场景及注意事项

《C++中detach的作用、使用场景及注意事项》关于C++中的detach,它主要涉及多线程编程中的线程管理,理解detach的作用、使用场景以及注意事项,对于写出高效、安全的多线程程序至关重要,下... 目录一、什么是join()?它的作用是什么?类比一下:二、join()的作用总结三、join()怎么

Linux之platform平台设备驱动详解

《Linux之platform平台设备驱动详解》Linux设备驱动模型中,Platform总线作为虚拟总线统一管理无物理总线依赖的嵌入式设备,通过platform_driver和platform_de... 目录platform驱动注册platform设备注册设备树Platform驱动和设备的关系总结在 l