死锁问题----打印此刻系统中所有的task

2024-03-05 01:38

本文主要是介绍死锁问题----打印此刻系统中所有的task,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、task_struct的遍历

进程,线程和内核线程的基本属性都是由struct task_struct结构体定义的。
设备上运行的所有task都是通过双链表连成一串,其中第一个task就是init_task,最终又指向会init_task。因此可以通过首个task(init_task)通过双向链表(tasks)遍历所有task,最终回到init_task方式遍历所有的task。      

首进程init_task在内核启动的时候静态赋值创建。(/init/init_task.c)

struct task_struct init_task
= {.state                	= 0,.stack                	= init_stack,.usage                	= REFCOUNT_INIT(2),.flags                	= PF_KTHREAD,.prio                	= MAX_PRIO - 20,.static_prio        		= MAX_PRIO - 20,.normal_prio        		= MAX_PRIO - 20,.policy                	= SCHED_NORMAL,.cpus_ptr        		= &init_task.cpus_mask,.cpus_mask        		= CPU_MASK_ALL,.nr_cpus_allowed			= NR_CPUS,.mm                		= NULL,.active_mm        		= &init_mm,.tasks					= LIST_HEAD_INIT(init_task.tasks),.......signal                	= &init_signals,.sighand        			= &init_sighand,.nsproxy        			= &init_nsproxy,.pending        			= {.list 	= LIST_HEAD_INIT(init_task.pending.list),.signal 	= {{0}}},.blocked        			= {{0}},.alloc_lock        		= __SPIN_LOCK_UNLOCKED(init_task.alloc_lock),.journal_info        	= NULL,INIT_CPU_TIMERS(init_task).pi_lock        			= __RAW_SPIN_LOCK_UNLOCKED(init_task.pi_lock),.timer_slack_ns 			= 50000, /* 50 usec default slack */.thread_pid        		= &init_struct_pid,.thread_group        	= LIST_HEAD_INIT(init_task.thread_group),.thread_node        		= LIST_HEAD_INIT(init_signals.thread_head),......
};
EXPORT_SYMBOL(init_task);

可以在编译生成的linux镜像中查找init_task符号表

nm vmlinux | grep init_task

然而一个进程中往往有很多线程,线程也与进程类似,通过双向链表串联,最终挂在进程task_struct下的thread_group
遍历系统中所有的进程和进程中所有的线程。

其中打印堆栈的方法:https://blog.csdn.net/sydyh43/article/details/119707079

二、遍历的实现

#define BKTRACE_DEPTH	30#define next_task(p)	list_entry_rcu((p)->tasks.next, struct task_struct, tasks)
#define next_thread(p)	list_entry_rcu((p)->thread_group.next, struct task_struct, thread_group)static void print_tasks_stack(void)
{struct task_struct *p = NULL, *tmp = NULL, *pt = NULL;unsigned long backtrace[BKTRACE_DEPTH];struct stack_trace trace;printk("dump stack....\n");rcu_read_lock();for (p = &init_task; (tmp = next_task(p)) != &init_task; ) {pt = p;do {if (pt->state == TASK_RUNNING) {printk("task name:%s\n", pt->comm);memset(backtrace, 0x00, sizeof(unsigned long) * BKTRACE_DEPTH);memset(&trace, 0x00, sizeof(struct stack_trace));trace.max_entries = BKTRACE_DEPTH;trace.entries = backtrace;save_stack_trace_tsk(pt, &trace);print_stack_trace(&trace, 0);			}if (pt->state & TASK_INTERRUPTIBLE) {printk("task name:%s\n", pt->comm);memset(backtrace, 0x00, sizeof(unsigned long) * BKTRACE_DEPTH);memset(&trace, 0x00, sizeof(struct stack_trace));trace.max_entries = BKTRACE_DEPTH;trace.entries = backtrace;save_stack_trace_tsk(pt, &trace);print_stack_trace(&trace, 0);}if (pt->state & TASK_UNINTERRUPTIBLE) {printk("task name:%s\n", pt->comm);memset(backtrace, 0x00, sizeof(unsigned long) * BKTRACE_DEPTH);memset(&trace, 0x00, sizeof(struct stack_trace));trace.max_entries = BKTRACE_DEPTH;trace.entries = backtrace;save_stack_trace_tsk(pt, &trace);print_stack_trace(&trace, 0);}}while((pt = next_thread(pt)) != p);p = tmp;}rcu_read_unlock();
}

遍历结果

发现个问题,创建线程时,printk("task name:%s\n", pt->comm);打印出来的线程名就是进程的名字,最终不好定位问题。

因此,在创建线程的时候最好指定线程名。创建线程名的方法。

#include <sys/prctl.h>static void *thread_fun0(void *arg)
{prctl(PR_SET_NAME, "thread_fun0");	while (1) {fun_b();sleep(5);}return NULL;
}

 三、应用

1、模拟死锁的代码

static void fun_a(void)
{pthread_mutex_lock(&mtx0);sleep(2);printf("1%s\n", __func__);pthread_mutex_lock(&mtx1);printf("2%s\n", __func__);return;
}static void fun_b(void)
{pthread_mutex_lock(&mtx1);sleep(1);printf("1%s\n", __func__);	pthread_mutex_lock(&mtx0);printf("1%s\n", __func__);	return;
}static void *thread_fun0(void *arg)
{prctl(PR_SET_NAME, "thread_fun0");	while (1) {fun_a();sleep(5);}return NULL;
}static void *thread_fun1(void *arg)
{prctl(PR_SET_NAME, "thread_fun1");	while (1) {fun_b();sleep(7);}return NULL;
}

2、打印堆栈

3、因此当设备出现狗咬死复位的前一刻,需要把堆栈都打印出来,方便后续的问题定位

这篇关于死锁问题----打印此刻系统中所有的task的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/774925

相关文章

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

解决RocketMQ的幂等性问题

《解决RocketMQ的幂等性问题》重复消费因调用链路长、消息发送超时或消费者故障导致,通过生产者消息查询、Redis缓存及消费者唯一主键可以确保幂等性,避免重复处理,本文主要介绍了解决RocketM... 目录造成重复消费的原因解决方法生产者端消费者端代码实现造成重复消费的原因当系统的调用链路比较长的时

深度解析Nginx日志分析与499状态码问题解决

《深度解析Nginx日志分析与499状态码问题解决》在Web服务器运维和性能优化过程中,Nginx日志是排查问题的重要依据,本文将围绕Nginx日志分析、499状态码的成因、排查方法及解决方案展开讨论... 目录前言1. Nginx日志基础1.1 Nginx日志存放位置1.2 Nginx日志格式2. 499

kkFileView启动报错:报错2003端口占用的问题及解决

《kkFileView启动报错:报错2003端口占用的问题及解决》kkFileView启动报错因office组件2003端口未关闭,解决:查杀占用端口的进程,终止Java进程,使用shutdown.s... 目录原因解决总结kkFileViewjavascript启动报错启动office组件失败,请检查of

Linux系统中查询JDK安装目录的几种常用方法

《Linux系统中查询JDK安装目录的几种常用方法》:本文主要介绍Linux系统中查询JDK安装目录的几种常用方法,方法分别是通过update-alternatives、Java命令、环境变量及目... 目录方法 1:通过update-alternatives查询(推荐)方法 2:检查所有已安装的 JDK方

Linux系统之lvcreate命令使用解读

《Linux系统之lvcreate命令使用解读》lvcreate是LVM中创建逻辑卷的核心命令,支持线性、条带化、RAID、镜像、快照、瘦池和缓存池等多种类型,实现灵活存储资源管理,需注意空间分配、R... 目录lvcreate命令详解一、命令概述二、语法格式三、核心功能四、选项详解五、使用示例1. 创建逻

SpringBoot 异常处理/自定义格式校验的问题实例详解

《SpringBoot异常处理/自定义格式校验的问题实例详解》文章探讨SpringBoot中自定义注解校验问题,区分参数级与类级约束触发的异常类型,建议通过@RestControllerAdvice... 目录1. 问题简要描述2. 异常触发1) 参数级别约束2) 类级别约束3. 异常处理1) 字段级别约束

Python错误AttributeError: 'NoneType' object has no attribute问题的彻底解决方法

《Python错误AttributeError:NoneTypeobjecthasnoattribute问题的彻底解决方法》在Python项目开发和调试过程中,经常会碰到这样一个异常信息... 目录问题背景与概述错误解读:AttributeError: 'NoneType' object has no at

Java实现预览与打印功能详解

《Java实现预览与打印功能详解》在Java中,打印功能主要依赖java.awt.print包,该包提供了与打印相关的一些关键类,比如PrinterJob和PageFormat,它们构成... 目录Java 打印系统概述打印预览与设置使用 PageFormat 和 PrinterJob 类设置页面格式与纸张

Spring的RedisTemplate的json反序列泛型丢失问题解决

《Spring的RedisTemplate的json反序列泛型丢失问题解决》本文主要介绍了SpringRedisTemplate中使用JSON序列化时泛型信息丢失的问题及其提出三种解决方案,可以根据性... 目录背景解决方案方案一方案二方案三总结背景在使用RedisTemplate操作redis时我们针对