中移(苏州)软件技术有限公司面试问题与解答(8)—— coredump与vmcore(1)

本文主要是介绍中移(苏州)软件技术有限公司面试问题与解答(8)—— coredump与vmcore(1),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

接前一篇文章:中移(苏州)软件技术有限公司面试问题与解答(0)—— 面试感悟与问题记录

本文参考以下文章:

详解coredump

内核vmcore文件分析方法

特此致谢!

本文对于中移(苏州)软件技术有限公司面试问题中的“(13)实际工作中有没有使用core dump进行调试以及问题定位?core dump的具体机制是什么?”进行解答与解析。

实际上不只是中移(苏州)闻到了这个问题,笔者在前天参加蔚来汽车一面时,再次被问到了coredump和vmcore;并且当年在裕兴软件,只要年轻的技术员们(声明:不包括本人)一出疑难问题搞不定,向技术女副总求助、求教,她的的一句话永远都是:把coredump给我;前几年在小狗机器人的时候,在给系统“添装备”时,也稍微研究过coredump和vmcore,当时还转载过博文(ulimit -c unlimited 详解)。只是一来当时研究的时间不长,二来时间过去几年了,印象早已不深了。正好借着最近这个“热乎劲”,把coredump和vmcore再次全方位研究一下,一把研究透了,今后就不能忘了。

1. 什么是coredump

经常听到大家说到程序core掉了(笔者其实经常听到的是程序崩了、系统荡掉了),需要定位解决。这里说的大部分是指对应程序由于各种异常或者bug导致在运行过程中异常退出或者中止,并且在满足一定条件下会产生一个叫做core的文件。
通常情况下,core文件包含程序运行时的内存寄存器状态堆栈指针内存管理信息还有各种函数调用堆栈信息等。我们可以理解为是程序工作当前状态存储生成的一个文件,许多的程序出错的时候都会产生一个core文件通过工具分析这个文件,我们可以定位到程序异常退出的时候对应的堆栈调用等信息,找出问题所在并进行及时解决。

2. 开启或关闭core文件的生成

(1)查看core文件是否打开

ulimit -c 可以查看是否打开此选项,若为0则为关闭。

ulimit -c  # 如果为 0 表示coredump开关处于关闭状态

(2)打开core文件生成

ulimit -c 1024         # 1024个blocks,一般1block=512bytes
ulimit -c unlimited    # 取消大小限制

(3)检查core文件的选项是否打开

ulimit -a  # 显示当前所有limit信息

(4)永久配置core

以上配置只对当前会话起作用,下次重新登陆后,还是得重新配置。要想配置永久生效,得在/etc/profile或者/etc/security/limits.conf文件中进行配置。有两种方法:

  • 方法1 通过/etc/profile(或bashrc、bash_profile)设置

首先打开/etc/profile文件,一般都可以在文件中找到这句语句:ulimit -S -c 0 > /dev/null 2>&1,根据上面的例子,只要把那个0改为unlimited就ok了,然后保存退出。之后通过source /etc/profile使当期设置生效。

如果想配置只针对某一用户有效,则修改此用户的~/.bashrc或者~/.bash_profile文件,加入一句或者修改既有的,还是改为

ulimit -c unlimited

  • 方法2 通过/etc/security/limits.conf文件来设置

首先以root权限登陆,然后打开/etc/security/limits.conf文件,进行配置:

#vim /etc/security/limits.conf
<domain>    <type>    <item>        <value>
 
*          soft       core         unlimited
 

3. core文件的存储位置和文件名

除了可以设置core文件的大小之外,还可以对core文件的名称进行一些规定。这种设置是对/proc/sys/kernel/core_pattern和/proc/sys/kernel/core_uses_pid这两个文件进行修改。

(1)存储位置

core文件默认的存储位置与对应的可执行程序在同一目录下,文件名是core。可以通过下面的命令看到core文件的存在位置:

cat  /proc/sys/kernel/core_pattern  # 缺省值是|/usr/share/apport/apport %p %s %c %P

注意:这里是指在进程当前工作目录的下创建。通常与程序在相同的路径下。但如果程序中调用了chdir函数,则有可能改变了当前工作目录。这时core文件创建在chdir指定的路径下。有好多程序崩溃了,我们却找不到core文件放在什么位置。和chdir函数就有关系。当然程序崩溃了不一定都产生core文件。 

更改coredump文件的存储位置:

echo “/data/coredump/core”> /proc/sys/kernel/core_pattern  # 把core文件生成到/data/coredump/core目录下

(2)core文件的命名

缺省情况下,内核在coredump时所产生的core文件放在与该程序相同的目录中,并且文件名固定为“core”。很显然,如果有多个程序产生core文件,或者同一个程序多次崩溃,就会重复覆盖同一个core文件,因此我们有必要对不同程序生成的core文件进行分别命名。有两种方法:

  • 方法1 通过/proc/sys/kernel/core_uses_pid设置

/proc/sys/kernel/core_uses_pid文件可以控制core文件的文件名中是否添加pid作为扩展。文件内容为1,表示添加pid作为扩展名,生成的core文件格式为core.xxxx;为0则表示生成的core文件同一命名为core。可通过以下命令修改此文件:

echo "1" > /proc/sys/kernel/core_uses_pid
  • 方法2 通过proc/sys/kernel/core_pattern设置

/proc/sys/kernel/core_pattern文件可以控制core文件保存位置和文件名格式,可通过以下命令修改此文件:

echo "/corefile/core-%e-%p-%t" > core_pattern # 可以将core文件统一生成到/corefile目录下,产生的文件名为core-命令名-pid-时间戳

core_pattern接受的是core文件名称的pattern,它包含任何字符串,并且用%作为转移符号生成一些标示符,为core文件名称加入特殊含义。已定义的标示符有如下这些:

%%:单个%字符,相当于%

%p:添加pid,相当于<pid>

%u:添加当前uid,相当于<uid>

%g:添加当前gid,相当于<gid>

%s:添加导致产生core的信号,相当于导致dump的信号的数字

%t:添加core文件生成时的unix时间,相当于dump的时间

%e:添加主机名,相当于执行文件的名称

%h:添加程序文件名,相当于hostname

除以上这些标志位外,还规定:

1. 末尾的单个%可以直接去除;

2. %加上除上述以外的任何字符,%和该字符都会被去除;

3. 所有其它字符都作为一般字符加入名称中;

4. core文件的名称最大值为64个字节(包括'\0');

5. core_pattern中默认的pattern为core;

6. 为了保持兼容性,通过设置core_uses_pid,可以在core文件的末尾加上%p;

7. pattern中可以包含路径信息。

至此,coredump就基本弄清楚了。按照笔者的理解,所谓coredump,其实应该是“core dump”,也就是说把core文件dump出来。

下回借着coredump,也把vmcore相关内容讲一下。

这篇关于中移(苏州)软件技术有限公司面试问题与解答(8)—— coredump与vmcore(1)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/667156

相关文章

Vue3绑定props默认值问题

《Vue3绑定props默认值问题》使用Vue3的defineProps配合TypeScript的interface定义props类型,并通过withDefaults设置默认值,使组件能安全访问传入的... 目录前言步骤步骤1:使用 defineProps 定义 Props步骤2:设置默认值总结前言使用T

Web服务器-Nginx-高并发问题

《Web服务器-Nginx-高并发问题》Nginx通过事件驱动、I/O多路复用和异步非阻塞技术高效处理高并发,结合动静分离和限流策略,提升性能与稳定性... 目录前言一、架构1. 原生多进程架构2. 事件驱动模型3. IO多路复用4. 异步非阻塞 I/O5. Nginx高并发配置实战二、动静分离1. 职责2

解决升级JDK报错:module java.base does not“opens java.lang.reflect“to unnamed module问题

《解决升级JDK报错:modulejava.basedoesnot“opensjava.lang.reflect“tounnamedmodule问题》SpringBoot启动错误源于Jav... 目录问题描述原因分析解决方案总结问题描述启动sprintboot时报以下错误原因分析编程异js常是由Ja

MySQL 表空却 ibd 文件过大的问题及解决方法

《MySQL表空却ibd文件过大的问题及解决方法》本文给大家介绍MySQL表空却ibd文件过大的问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考... 目录一、问题背景:表空却 “吃满” 磁盘的怪事二、问题复现:一步步编程还原异常场景1. 准备测试源表与数据

解决Nginx启动报错Job for nginx.service failed because the control process exited with error code问题

《解决Nginx启动报错Jobfornginx.servicefailedbecausethecontrolprocessexitedwitherrorcode问题》Nginx启... 目录一、报错如下二、解决原因三、解决方式总结一、报错如下Job for nginx.service failed bec

SysMain服务可以关吗? 解决SysMain服务导致的高CPU使用率问题

《SysMain服务可以关吗?解决SysMain服务导致的高CPU使用率问题》SysMain服务是超级预读取,该服务会记录您打开应用程序的模式,并预先将它们加载到内存中以节省时间,但它可能占用大量... 在使用电脑的过程中,CPU使用率居高不下是许多用户都遇到过的问题,其中名为SysMain的服务往往是罪魁

MySQ中出现幻读问题的解决过程

《MySQ中出现幻读问题的解决过程》文章解析MySQLInnoDB通过MVCC与间隙锁机制在可重复读隔离级别下解决幻读,确保事务一致性,同时指出性能影响及乐观锁等替代方案,帮助开发者优化数据库应用... 目录一、幻读的准确定义与核心特征幻读 vs 不可重复读二、mysql隔离级别深度解析各隔离级别的实现差异

C++ vector越界问题的完整解决方案

《C++vector越界问题的完整解决方案》在C++开发中,std::vector作为最常用的动态数组容器,其便捷性与性能优势使其成为处理可变长度数据的首选,然而,数组越界访问始终是威胁程序稳定性的... 目录引言一、vector越界的底层原理与危害1.1 越界访问的本质原因1.2 越界访问的实际危害二、基

Python多线程应用中的卡死问题优化方案指南

《Python多线程应用中的卡死问题优化方案指南》在利用Python语言开发某查询软件时,遇到了点击搜索按钮后软件卡死的问题,本文将简单分析一下出现的原因以及对应的优化方案,希望对大家有所帮助... 目录问题描述优化方案1. 网络请求优化2. 多线程架构优化3. 全局异常处理4. 配置管理优化优化效果1.

Linux部署中的文件大小写问题的解决方案

《Linux部署中的文件大小写问题的解决方案》在本地开发环境(Windows/macOS)一切正常,但部署到Linux服务器后出现模块加载错误,核心原因是Linux文件系统严格区分大小写,所以本文给大... 目录问题背景解决方案配置要求问题背景在本地开发环境(Windows/MACOS)一切正常,但部署到