SylixOS内核的cdump功能

2023-11-03 06:18
文章标签 功能 内核 sylixos cdump

本文主要是介绍SylixOS内核的cdump功能,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

概念

cdump即CrashDump(奔溃信息转储),就是在紧急情况下存储故障信息,待系统恢复时还能读取或存入文件系统。

来由

当系统奔溃时,一般会通过串口控制台将奔溃信息(如当前寄存器值,线程名称,出错原因等)输出,以供开发人员对故障进行定位和分析。但有时的奔溃情况非常严重,不能或不便于通过串口输出,其他通信方式或磁盘访问也不能正常调用,此时就可以先把奔溃信息记录到指定内存中,等系统恢复或复位后再从指定内存读出或记录。这也是系统尽最大可能去保存奔溃信息的方法了。

大部分情况下cdump还是能起效的,这在于即便是很严重的奔溃,一般不会完全断电,内存一般也还是能正常的可访问的,且访问内存的速度非常快。但也可能达不到效果,比如指定内存在DDR内存空间中,DDR控制器故障或者重启后重新初始化了DDR内存,或则系统完全掉电,都会使得奔溃信息丢失。再有就是奔溃后CPU极快就被复位或停止了,没有足够的时间去进行保存操作。所以配置cdump的存储地址时,最好是选用同在SOC中的紧耦合内存(TCM)来存储,速度快,无需初始化控制器,也不需要太大空间,默认是2KB。

用法

首先在系统编译时,要保证 LW_CFG_CDUMP_ENLW_CFG_DEVICE_EN 配置宏都使能才会启用cdump功能。这两个配置宏位于libsylixos\SylixOS\config\system\system_cfg.h文件中,启停cdump功能只修改 LW_CFG_CDUMP_EN 宏即可。

系统默认的cdump存储空间大小是2KB,位于内核堆的末尾。通过内置的cdump命令即可显示或存储奔溃信息,存储文件名为 /var/log/cdump/ + UTC时间
在这里插入图片描述
以上是系统默认的配置或操作接口,系统同时也提供了3个API接口函数,供开发者编程定制。

  1. 设置存储地址及大小。
/*********************************************************************************************************
** 函数名称: API_CrashDumpBuffer
** 功能描述: 重新定位系统/应用崩溃信息记录位置. (必须是内核能访问的地址)
** 输 入  : pvCdump           缓冲地址
**           stSize            缓冲大小
** 输 出  : ERROR_NONE or PX_ERROR
*********************************************************************************************************/
INT  API_CrashDumpBuffer (PVOID  pvCdump, size_t  stSize);
  1. 保存到指定文件。
/*********************************************************************************************************
** 函数名称: API_CrashDumpSave
** 功能描述: 最近一次系统/应用崩溃信息保存入文件.
** 输 入  : pcLogFile         日志文件名
**           iFlag             open 第二个参数
**           iMode             open 第三个参数
**           bClear            成功保存后是否清空缓冲区
** 输 出  : ERROR_NONE or PX_ERROR
*********************************************************************************************************/
INT  API_CrashDumpSave (CPCHAR  pcLogFile, INT  iFlag, INT  iMode, BOOL  bClear);
  1. 通过指定文件输出显示,一般是标准输出文件。
/*********************************************************************************************************
** 函数名称: API_CrashDumpShow
** 功能描述: 显示最近一次系统/应用崩溃信息.
** 输 入  : iFd               打印文件描述符
**           bClear            是否清空缓冲区
** 输 出  : ERROR_NONE or PX_ERROR
*********************************************************************************************************/ 
INT  API_CrashDumpShow (INT  iFd, BOOL  bClear);

实现

cdump功能的实现代码主要位于 libsylixos\SylixOS\kernel\cdump 文件夹中。

基本配置

#define LW_CFG_CDUMP_EN                         1       /*  是否允许系统/应用崩溃信息暂存               */
#define LW_CFG_CDUMP_BUF_SIZE                   2048    /*  缓存大小                                    */
#define LW_CFG_CDUMP_CALL_STACK_DEPTH           20      /*  调用栈深度                                  */

默认位置及大小
这里决定了cdump的默认存储空间位于内核堆的末尾2KB空间。

/*********************************************************************************************************崩溃信息暂存配置
*********************************************************************************************************/
#if LW_CFG_CDUMP_EN > 0
#define LW_KERNEL_HEAP_START(a)     ((PVOID)a)
#define LW_KERNEL_HEAP_SIZE(s)      ((size_t)s - LW_CFG_CDUMP_BUF_SIZE)
#define LW_KERNEL_CDUMP_START(a, s) ((PVOID)((addr_t)a + LW_KERNEL_HEAP_SIZE(s)))
#define LW_KERNEL_CDUMP_SIZE(s)     LW_CFG_CDUMP_BUF_SIZE
#else
#define LW_KERNEL_HEAP_START(a)     ((PVOID)a)
#define LW_KERNEL_HEAP_SIZE(s)      ((size_t)s)
#endif

魔数头定义
奔溃信息在存储时前4字节是一个特征魔数,用于表征是否已存储及存储收正常。后面这是根据不同奔溃状态的信息字符串。

/*********************************************************************************************************宏定义
*********************************************************************************************************/
#define LW_CDUMP_MAGIC_0    0xab
#define LW_CDUMP_MAGIC_1    0x56
#define LW_CDUMP_MAGIC_2    0xef
#define LW_CDUMP_MAGIC_3    0x33
#define LW_CDUMP_MAGIC_LEN  4

存储区地址及长度全局变量定义及相关基本操作

static PVOID  _K_pvCrashDumpBuffer = (PVOID)PX_ERROR;
static size_t _K_stCrashDumpSize   = LW_CFG_CDUMP_BUF_SIZE;#define LW_CDUMP_BUF_SIZE   (_K_stCrashDumpSize)
#define LW_CDUMP_MAX_LEN    (LW_CDUMP_BUF_SIZE - 1)VOID  _CrashDumpSet (PVOID  pvCdump, size_t  stSize)
{_K_pvCrashDumpBuffer = pvCdump;_K_stCrashDumpSize   = stSize;
}PVOID  _CrashDumpGet (size_t  *pstSize)
{*pstSize = _K_stCrashDumpSize;return  (_K_pvCrashDumpBuffer);
}

奔溃时不同类型的存储信息调用接口,这些接口只会被内核调用。

/*********************************************************************************************************
** 函数名称: _CrashDumpAbortStkOf
** 功能描述: 堆栈溢出崩溃信息记录.
** 输 入  : ulRetAddr     异常返回 PC 地址
**           ulAbortAddr   异常地址
**           pcInfo        异常信息
**           ptcb          异常任务
** 输 出  : NONE
*********************************************************************************************************/
VOID  _CrashDumpAbortStkOf (addr_t  ulRetAddr, addr_t  ulAbortAddr, CPCHAR  pcInfo, PLW_CLASS_TCB  ptcb)
{PCHAR   pcCdump = (PCHAR)_K_pvCrashDumpBuffer;size_t  stOft   = 4;if (!pcCdump || (pcCdump == (PCHAR)PX_ERROR)) {return;}pcCdump[0] = LW_CDUMP_MAGIC_0;pcCdump[1] = LW_CDUMP_MAGIC_1;pcCdump[2] = LW_CDUMP_MAGIC_2;pcCdump[3] = LW_CDUMP_MAGIC_3;stOft = bnprintf(pcCdump, LW_CDUMP_MAX_LEN, stOft, "FATAL ERROR: thread %lx[%s] stack overflow. ""ret_addr: 0x%08lx abt_addr: 0x%08lx abt_type: %s\n""rebooting...\n",ptcb->TCB_ulId, ptcb->TCB_cThreadName,ulRetAddr, ulAbortAddr, pcInfo);pcCdump[stOft] = PX_EOS;
}
/*********************************************************************************************************
** 函数名称: _CrashDumpAbortFatal
** 功能描述: 崩溃信息记录.
** 输 入  : ulRetAddr     异常返回 PC 地址
**           ulAbortAddr   异常地址
**           pcInfo        异常信息
** 输 出  : NONE
*********************************************************************************************************/
VOID  _CrashDumpAbortFatal (addr_t  ulRetAddr, addr_t  ulAbortAddr, CPCHAR  pcInfo)
{PCHAR   pcCdump = (PCHAR)_K_pvCrashDumpBuffer;size_t  stOft   = 4;if (!pcCdump || (pcCdump == (PCHAR)PX_ERROR)) {return;}pcCdump[0] = LW_CDUMP_MAGIC_0;pcCdump[1] = LW_CDUMP_MAGIC_1;pcCdump[2] = LW_CDUMP_MAGIC_2;pcCdump[3] = LW_CDUMP_MAGIC_3;stOft = bnprintf(pcCdump, LW_CDUMP_MAX_LEN, stOft, "FATAL ERROR: abort occur in exception mode. ""ret_addr: 0x%08lx abt_addr: 0x%08lx abt_type: %s\n""rebooting...\n",ulRetAddr, ulAbortAddr, pcInfo);pcCdump[stOft] = PX_EOS;
}
/*********************************************************************************************************
** 函数名称: _CrashDumpAbortKernel
** 功能描述: 内核崩溃信息记录.
** 输 入  : ulOwner       占用内核的任务
**           pcKernelFunc  进入内核的函数
**           pvCtx         异常信息结构
**           pcInfo        异常信息
**           pcTail        附加信息
** 输 出  : NONE 
*********************************************************************************************************/
VOID  _CrashDumpAbortKernel (LW_OBJECT_HANDLE   ulOwner, CPCHAR             pcKernelFunc, PVOID              pvCtx,CPCHAR             pcInfo, CPCHAR             pcTail)
{PLW_VMM_ABORT_CTX  pabtctx = (PLW_VMM_ABORT_CTX)pvCtx;PCHAR              pcCdump = (PCHAR)_K_pvCrashDumpBuffer;size_t             stOft;if (!pcCdump || (pcCdump == (PCHAR)PX_ERROR)) {return;}lib_bzero(pcCdump, LW_CDUMP_BUF_SIZE);pcCdump[0] = LW_CDUMP_MAGIC_0;pcCdump[1] = LW_CDUMP_MAGIC_1;pcCdump[2] = LW_CDUMP_MAGIC_2;pcCdump[3] = LW_CDUMP_MAGIC_3;archTaskCtxPrint(&pcCdump[4], (LW_CDUMP_MAX_LEN - LW_CDUMP_MAGIC_LEN), &pabtctx->ABTCTX_archRegCtx);stOft = lib_strlen(pcCdump);stOft = bnprintf(pcCdump, LW_CDUMP_MAX_LEN, stOft, "FATAL ERROR: abort in kernel status. ""kowner: 0x%08lx, kfunc: %s, ""ret_addr: 0x%08lx abt_addr: 0x%08lx, abt_type: %s, %s.\n",ulOwner, pcKernelFunc, pabtctx->ABTCTX_ulRetAddr,pabtctx->ABTCTX_ulAbortAddr, pcInfo, pcTail);
}
/*********************************************************************************************************
** 函数名称: _CrashDumpAbortAccess
** 功能描述: 崩溃信息记录.
** 输 入  : pvCtx            异常信息结构
**           pcInfo           异常信息
** 输 出  : NONE
*********************************************************************************************************/
VOID  _CrashDumpAbortAccess (PVOID  pvCtx, CPCHAR  pcInfo)
{PLW_VMM_ABORT_CTX  pabtctx = (PLW_VMM_ABORT_CTX)pvCtx;PCHAR              pcCdump = (PCHAR)_K_pvCrashDumpBuffer;size_t             stOft;if (!pcCdump || (pcCdump == (PCHAR)PX_ERROR)) {return;}lib_bzero(pcCdump, LW_CDUMP_BUF_SIZE);pcCdump[0] = LW_CDUMP_MAGIC_0;pcCdump[1] = LW_CDUMP_MAGIC_1;pcCdump[2] = LW_CDUMP_MAGIC_2;pcCdump[3] = LW_CDUMP_MAGIC_3;archTaskCtxPrint(&pcCdump[4], (LW_CDUMP_MAX_LEN - LW_CDUMP_MAGIC_LEN), &pabtctx->ABTCTX_archRegCtx);stOft = lib_strlen(pcCdump);switch (__ABTCTX_ABORT_TYPE(pabtctx)) {case LW_VMM_ABORT_TYPE_UNDEF:stOft = bnprintf(pcCdump, LW_CDUMP_MAX_LEN, stOft, "UNDEF ERROR: abort in thread %lx[%s]. ""ret_addr: 0x%08lx abt_addr: 0x%08lx, abt_type: %s.\n",pabtctx->ABTCTX_ptcb->TCB_ulId,pabtctx->ABTCTX_ptcb->TCB_cThreadName,pabtctx->ABTCTX_ulRetAddr,pabtctx->ABTCTX_ulAbortAddr, pcInfo);break;case LW_VMM_ABORT_TYPE_FPE:stOft = bnprintf(pcCdump, LW_CDUMP_MAX_LEN, stOft, "FPU ERROR: abort in thread %lx[%s]. ""ret_addr: 0x%08lx abt_addr: 0x%08lx, abt_type: %s.\n",pabtctx->ABTCTX_ptcb->TCB_ulId,pabtctx->ABTCTX_ptcb->TCB_cThreadName,pabtctx->ABTCTX_ulRetAddr,pabtctx->ABTCTX_ulAbortAddr, pcInfo);break;default:stOft = bnprintf(pcCdump, LW_CDUMP_MAX_LEN, stOft, "ACCESS ERROR: abort in thread %lx[%s]. ""ret_addr: 0x%08lx abt_addr: 0x%08lx, abt_type: %s.\n",pabtctx->ABTCTX_ptcb->TCB_ulId,pabtctx->ABTCTX_ptcb->TCB_cThreadName,pabtctx->ABTCTX_ulRetAddr,pabtctx->ABTCTX_ulAbortAddr, pcInfo);break;}API_BacktracePrint(&pcCdump[stOft], (LW_CDUMP_MAX_LEN - stOft), LW_CFG_CDUMP_CALL_STACK_DEPTH);
}

API接口的实现

/*********************************************************************************************************
** 函数名称: API_CrashDumpBuffer
** 功能描述: 重新定位系统/应用崩溃信息记录位置. (必须是内核能访问的地址)
** 输 入  : pvCdump           缓冲地址
**           stSize            缓冲大小
** 输 出  : ERROR_NONE or PX_ERROR
*********************************************************************************************************/
LW_API  
INT  API_CrashDumpBuffer (PVOID  pvCdump, size_t  stSize)
{if (!pvCdump || (pvCdump == (PVOID)PX_ERROR) || (stSize < 512)) {_ErrorHandle(EINVAL);return  (PX_ERROR);}_CrashDumpSet(pvCdump, stSize);return  (ERROR_NONE);
}
/*********************************************************************************************************
** 函数名称: API_CrashDumpSave
** 功能描述: 最近一次系统/应用崩溃信息保存入文件.
** 输 入  : pcLogFile         日志文件名
**           iFlag             open 第二个参数
**           iMode             open 第三个参数
**           bClear            成功保存后是否清空缓冲区
** 输 出  : ERROR_NONE or PX_ERROR
*********************************************************************************************************/
LW_API  
INT  API_CrashDumpSave (CPCHAR  pcLogFile, INT  iFlag, INT  iMode, BOOL  bClear)
{PCHAR   pcCdump, pcBuffer;size_t  stSize, stLen;INT     iFd;pcCdump = (PCHAR)_CrashDumpGet(&stSize);if (!pcCdump || (pcCdump == (PCHAR)PX_ERROR) || (stSize < 512)) {_ErrorHandle(EINVAL);return  (PX_ERROR);}if (((UINT8)pcCdump[0] != LW_CDUMP_MAGIC_0) ||((UINT8)pcCdump[1] != LW_CDUMP_MAGIC_1) ||((UINT8)pcCdump[2] != LW_CDUMP_MAGIC_2) ||((UINT8)pcCdump[3] != LW_CDUMP_MAGIC_3)) {_ErrorHandle(EMSGSIZE);return  (PX_ERROR);}pcCdump[stSize - 1] = PX_EOS;iFd = open(pcLogFile, iFlag, iMode);if (iFd < 0) {return  (PX_ERROR);}pcBuffer = &pcCdump[4];stLen    = lib_strlen(pcBuffer);if (write(iFd, pcBuffer, stLen) != stLen) {close(iFd);return  (PX_ERROR);}close(iFd);if (bClear) {pcCdump[0] = 0;pcCdump[1] = 0;pcCdump[2] = 0;pcCdump[3] = 0;}return  (ERROR_NONE);
}
/*********************************************************************************************************
** 函数名称: API_CrashDumpShow
** 功能描述: 显示最近一次系统/应用崩溃信息.
** 输 入  : iFd               打印文件描述符
**           bClear            是否清空缓冲区
** 输 出  : ERROR_NONE or PX_ERROR
*********************************************************************************************************/
LW_API  
INT  API_CrashDumpShow (INT  iFd, BOOL  bClear)
{PCHAR   pcCdump, pcBuffer;size_t  stSize;pcCdump = (PCHAR)_CrashDumpGet(&stSize);if (!pcCdump || (pcCdump == (PCHAR)PX_ERROR) || (stSize < 512)) {_ErrorHandle(EINVAL);return  (PX_ERROR);}if (((UINT8)pcCdump[0] != LW_CDUMP_MAGIC_0) ||((UINT8)pcCdump[1] != LW_CDUMP_MAGIC_1) ||((UINT8)pcCdump[2] != LW_CDUMP_MAGIC_2) ||((UINT8)pcCdump[3] != LW_CDUMP_MAGIC_3)) {_ErrorHandle(EMSGSIZE);return  (PX_ERROR);}pcCdump[stSize - 1] = PX_EOS;pcBuffer            = &pcCdump[4];fdprintf(iFd, "%s", pcBuffer);if (bClear) {pcCdump[0] = 0;pcCdump[1] = 0;pcCdump[2] = 0;pcCdump[3] = 0;}return  (ERROR_NONE);
}

cdump命令的实现

/*********************************************************************************************************
** 函数名称: __tshellSysCmdCdump
** 功能描述: 系统命令 "cdump"
** 输 入  : iArgC         参数个数
**           ppcArgV       参数表
** 输 出  : 0
*********************************************************************************************************/
static INT  __tshellSysCmdCdump (INT  iArgC, PCHAR  ppcArgV[])
{INT         iC;BOOL        bSave  = LW_FALSE;BOOL        bClear = LW_FALSE;CHAR        cFile[MAX_FILENAME_LENGTH] = "/var/log/cdump/";time_t      tm;while ((iC = getopt(iArgC, ppcArgV, "sc")) != EOF) {switch (iC) {case 's':bSave = LW_TRUE;break;case 'c':bClear = LW_TRUE;break;}}getopt_free();if (bSave) {lib_time(&tm);snprintf(cFile, MAX_FILENAME_LENGTH, "%s/%lld","/var/log/cdump", tm);if (API_CrashDumpSave(cFile, O_CREAT | O_WRONLY | O_TRUNC, DEFAULT_FILE_PERM, bClear) < ERROR_NONE) {if (errno == EMSGSIZE) {fprintf(stderr, "no message in crash dump buffer.\n");} else {fprintf(stderr, "crash dump save (%s) fail: %s.\n", cFile, lib_strerror(errno));}return  (PX_ERROR);} else {printf("crash dump save (%s) ok.\n", cFile);}} else {if (API_CrashDumpShow(STD_OUT, bClear) < ERROR_NONE) {if (errno == EMSGSIZE) {fprintf(stderr, "no message in crash dump buffer.\n");}return  (PX_ERROR);}}return  (ERROR_NONE);
}

这篇关于SylixOS内核的cdump功能的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/336174

相关文章

Debian 13升级后网络转发等功能异常怎么办? 并非错误而是管理机制变更

《Debian13升级后网络转发等功能异常怎么办?并非错误而是管理机制变更》很多朋友反馈,更新到Debian13后网络转发等功能异常,这并非BUG而是Debian13Trixie调整... 日前 Debian 13 Trixie 发布后已经有众多网友升级到新版本,只不过升级后发现某些功能存在异常,例如网络转

基于Java和FFmpeg实现视频压缩和剪辑功能

《基于Java和FFmpeg实现视频压缩和剪辑功能》在视频处理开发中,压缩和剪辑是常见的需求,本文将介绍如何使用Java结合FFmpeg实现视频压缩和剪辑功能,同时去除数据库操作,仅专注于视频处理,需... 目录引言1. 环境准备1.1 项目依赖1.2 安装 FFmpeg2. 视频压缩功能实现2.1 主要功

使用Python实现无损放大图片功能

《使用Python实现无损放大图片功能》本文介绍了如何使用Python的Pillow库进行无损图片放大,区分了JPEG和PNG格式在放大过程中的特点,并给出了示例代码,JPEG格式可能受压缩影响,需先... 目录一、什么是无损放大?二、实现方法步骤1:读取图片步骤2:无损放大图片步骤3:保存图片三、示php

深度解析Python yfinance的核心功能和高级用法

《深度解析Pythonyfinance的核心功能和高级用法》yfinance是一个功能强大且易于使用的Python库,用于从YahooFinance获取金融数据,本教程将深入探讨yfinance的核... 目录yfinance 深度解析教程 (python)1. 简介与安装1.1 什么是 yfinance?

Python脚本轻松实现检测麦克风功能

《Python脚本轻松实现检测麦克风功能》在进行音频处理或开发需要使用麦克风的应用程序时,确保麦克风功能正常是非常重要的,本文将介绍一个简单的Python脚本,能够帮助我们检测本地麦克风的功能,需要的... 目录轻松检测麦克风功能脚本介绍一、python环境准备二、代码解析三、使用方法四、知识扩展轻松检测麦

Java实现TXT文件导入功能的详细步骤

《Java实现TXT文件导入功能的详细步骤》在实际开发中,很多应用场景需要将用户上传的TXT文件进行解析,并将文件中的数据导入到数据库或其他存储系统中,本文将演示如何用Java实现一个基本的TXT文件... 目录前言1. 项目需求分析2. 示例文件格式3. 实现步骤3.1. 准备数据库(假设使用 mysql

Springboot项目登录校验功能实现

《Springboot项目登录校验功能实现》本文介绍了Web登录校验的重要性,对比了Cookie、Session和JWT三种会话技术,分析其优缺点,并讲解了过滤器与拦截器的统一拦截方案,推荐使用JWT... 目录引言一、登录校验的基本概念二、HTTP协议的无状态性三、会话跟android踪技术1. Cook

基于Spring Boot 的小区人脸识别与出入记录管理系统功能

《基于SpringBoot的小区人脸识别与出入记录管理系统功能》文章介绍基于SpringBoot框架与百度AI人脸识别API的小区出入管理系统,实现自动识别、记录及查询功能,涵盖技术选型、数据模型... 目录系统功能概述技术栈选择核心依赖配置数据模型设计出入记录实体类出入记录查询表单出入记录 VO 类(用于

Qt中实现多线程导出数据功能的四种方式小结

《Qt中实现多线程导出数据功能的四种方式小结》在以往的项目开发中,在很多地方用到了多线程,本文将记录下在Qt开发中用到的多线程技术实现方法,以导出指定范围的数字到txt文件为例,展示多线程不同的实现方... 目录前言导出文件的示例工具类QThreadQObject的moveToThread方法实现多线程QC

Java使用Thumbnailator库实现图片处理与压缩功能

《Java使用Thumbnailator库实现图片处理与压缩功能》Thumbnailator是高性能Java图像处理库,支持缩放、旋转、水印添加、裁剪及格式转换,提供易用API和性能优化,适合Web应... 目录1. 图片处理库Thumbnailator介绍2. 基本和指定大小图片缩放功能2.1 图片缩放的