[Linux 进程(六)] 写时拷贝 - 进程终止

2024-02-03 08:04

本文主要是介绍[Linux 进程(六)] 写时拷贝 - 进程终止,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

文章目录

  • 1、写时拷贝
  • 2、进程终止
    • 2.1 进程退出场景
      • 2.1.1 退出码
      • 2.1.2 错误码
      • 错误码 vs 退出码
      • 2.1.3 代码异常终止引入
    • 2.2 进程常见退出方法
      • 2.2.1 exit函数
      • 2.2.2 _exit函数

本片我们主要来讲进程控制,讲之前我们先把写时拷贝理清,然后再开始讲进程控制。

1、写时拷贝

我们第一篇进程文章中,讲到了系统接口fork()创建子进程,最后我们提了五个问题,第五个问题:如何理解同一个id变量,怎么会有不同的值? 写时拷贝将为你解答该问题。记不清的伙伴点这里回顾那篇文章
通常,父子代码共享,父子在不写入时,数据也是共享的,当任意一方试图写入,便以写时拷贝的方式各自一份副本。具体见下图:
在这里插入图片描述
当父进程创建子进程之后,子进程的页表是拷贝父进程的,但子进程要在数据段进行写入(代码段不支持修改),就需要重新申请空间,将原数据拷贝后再做写入我们并不是将整块数据进行改写的,可能只是修改部分数据),并修改页表,这部分工作是由操作系统做的。 但是该工作是需要时机的,操作系统并不知道你什么时候是要做写入的。
我们先说一个**结论**:父进程创建子进程的时候,首先将自己的读写权限改为只读,然后再创建子进程。

用户是不知道的!用户将来可能会对数据(权限为读写,代码段是只读) 进行写入!此时,页表的转换会因为权限问题出错,这时操作系统就接入了。但是出错也分真假:

  • 真出错。代码段是不可以写入的,但是我们修改的区域在code_start~code_end(代码区起始结束区域),这时就是越界/真出错。
  • 假出错。对数据区的写入,数据区是可以读写的,只是我们页表中改成了只读。这样的不是出错,是触发进行重新申请内存,拷贝内容的策略机制。

我们终于明白了,子进程拷贝下父进程的页表后,将数据对应的页表条目权限改为只读,通过让操作系统触发异常的方式,让操作系统帮我们进行写时拷贝的,完成后再把对应的页表条目改为读写,没有写入的依旧是只读。

2、进程终止

我们先来提出一个 问题:我们C语言代码main函数最后都有一个return 0,返回0时给谁返回呢?
main函数也是被调用的,所以注定谁调用就给谁返回。我们写一段代码来看看:

#include <stdio.h>int main()
{return 10;
}

我们main函数中什么都不写,直接返回值为10。
当编译运行后,它的父进程是bash,会将返回值交给父进程,用指令echo $?获取刚刚的结果。
在这里插入图片描述

打印出来这是现象。
?是环境变量,保存的是最近一个子进程执行完毕的退出码。
在这里插入图片描述

第二次查看退出码为0,是因为上一个echo执行是成功的,0代表了成功。
由此我们展开下面的话题:

2.1 进程退出场景

  • 代码运行完毕,结果正确
  • 代码运行完毕,结果不正确
  • 代码异常终止

2.1.1 退出码

在多进程环境中,我们创建子进程就是为了帮我们去做事,这里“我们”是父进程,子进程事做的怎么样,父进程是需要知道的。在main函数中,返回值0代表正确,非0代表错误,父进程就是依靠返回值来判断是否正确的做完了任务。
当返回0,正确大家不会关心这个过程;但是返回非0,意味着错误,我们最想知道的是错误的原因是什么。所以我们可以用不同的数字表示不同的原因!但是不便于人阅读,所以我们需要一些能够将数字转化成错误码的字符串描述方案。C语言给我们有提供一批接口,我们也可以自定义一批我们自己的错误码与错误信息,把不同数字转化成不同出错原因的接口:

在这里插入图片描述

我们写一段代码来打印一下所有的退出码与对应的信息:

#include <stdio.h>
#include <string.h>int main()
{for(int i = 0; i < 200; i++){printf("%d: %s\n", i, strerror(i));}return 0;
}

在这里插入图片描述

这就是退出码,不同的退出码代表不同的出错原因。
我们来举例子看一下:
在这里插入图片描述

退出码是2,错误信息描述是没有这样的文件或目录。跟我们上面查看的退出码以及对应信息是匹配的。
结论main函数的退出码是可以被父进程获取的,用来判断子进程的运行结果。

2.1.2 错误码

C语言还有一个错误码,errno,我们下面来学一下看看有什么不同:
我们先写一个代码测试一下:

#include <stdio.h>
#include <string.h>
#include <errno.h>int main()
{printf("before: %d\n", errno);FILE* fp = fopen("./log.txt", "r");printf("after: %d, error string: %s\n", errno, strerror(errno));return 0;
}

我们当前路径下是不存在log.txt文件的,以读的方式打开肯定是错误的,我们打开前输出一次,打开后输出一次。
在这里插入图片描述
这说明,错误码会在调用接口的时候被设置。

错误码 vs 退出码

  • 错误码通常是衡量一个库函数或者是一个系统调用(Linux内核也是用C语言写的,所以它也可以访问errno)函数的调用情况。
  • 退出码通常是一个进程退出的时候,他的退出结果。
  • 相同点:当失败时,用来衡量 函数/进程 出错时的出错详细原因。

当我们写的代码有多个系统接口和库函数,我们可以把退出码和错误码设置成一致:

#include <stdio.h>
#include <string.h>
#include <errno.h>int main()
{int ret = 0;printf("before: %d\n", errno);FILE* fp = fopen("./log.txt", "r");if(NULL == fp){printf("after: %d, error string: %s\n", errno, strerror(errno));ret = errno;}return ret;
}

strerror()函数可以将错误码转化成错误信息。
在这里插入图片描述
错误信息一输出用户就知道是哪出错了,echo $? 输出的退出码父进程bash也就知道了。

2.1.3 代码异常终止引入

代码异常终止,一般代码都没跑完,退出码也就没意义了。
我们举两个异常的例子:

#include <stdio.h>
#include <string.h>
#include <errno.h>int main()
{printf("before: %d\n", errno);FILE* fp = fopen("./log.txt", "r");if(NULL == fp){printf("after: %d, error string: %s\n", errno, strerror(errno));}int a = 10;a /= 0; // 除0错误return 0;
}

在这里插入图片描述

#include <stdio.h>
#include <string.h>
#include <errno.h>int main()
{printf("before: %d\n", errno);FILE* fp = fopen("./log.txt", "r");if(NULL == fp){printf("after: %d, error string: %s\n", errno, strerror(errno));}int* ptr = NULL;*ptr = 10; // 野指针return 0;
}

在这里插入图片描述

野指针一般是段错误。
代码跑起来之后就是进程,出问题是进程异常了,异常后它就不跑了,操作系统管理的进程,其实是操作系统把进程杀掉了(通过发送信号的方式杀掉的)。
我们查看一下信号:

在这里插入图片描述

可以看到SIG前缀是统一的,我们刚才的两个错误分别可以转换为8号与11号信号,FPE代表Floating point exception,SEGV代表Segmentation fault。
我们再来测试一下,看看其他的信号可不可以杀掉不是对应问题的进程:

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>int main()
{while(1){printf("I am a normal process: %d\n", getpid());}return 0;
}

在这里插入图片描述

我们发现,其实代码并没有错误,但是用户用的8号信号杀掉的进程,所以显示的就是8号所对应的异常信息。
结论进程出异常,异常信息会被操作系统检测出来,进而转换为信号然后杀掉进程。
最后,子进程把父进程交给的任务完成的怎么样,只要守好退出码信号编号为0就是正确,因为错误码从1开始的两个数字就可以很好的监督任务的完成程度。

2.2 进程常见退出方法

2.2.1 exit函数

我们先来查看一下exit怎么使用!
在这里插入图片描述

结论参数是进程的退出码,类似于main函数的return n。
了解了使用方法,我们来写一段代码试试:

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>int main()
{printf("I am a process, pid: %d, ppid:%d\n", getpid(), getppid());exit(12); // 参数是进程的退出码,类似于main函数的return n//return 0;
}

在这里插入图片描述
我们再来看一个场景:

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>int func()
{printf("call func function done!\n");// 任意地点调用exit,表示进程退出,不进行后续执行exit(21);
}int main()
{func();printf("I am a process, pid: %d, ppid:%d\n", getpid(), getppid());// 参数是进程的退出码,类似于main函数的return nexit(12);//return 0;
}

在这里插入图片描述

结论任意地点调用exit,表示进程退出,不进行后续执行。
我们可以在验证一下:

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>int func()
{printf("call func function done!\n");// 任意地点调用exit,表示进程退出,不进行后续执行exit(21);
}int main()
{exit(31);func();printf("I am a process, pid: %d, ppid:%d\n", getpid(), getppid());// 参数是进程的退出码,类似于main函数的return nexit(12);//return 0;
}

在这里插入图片描述

经过这次的验证说明我们得出的结论是正确的。

2.2.2 _exit函数

依旧先查看怎么使用!
在这里插入图片描述

我们来使用一下试试:

#include <stdio.h>
#include <stdlib.h>int func()
{printf("call func function done!\n");return 11;
}int main()
{func();printf("I am a process, pid: %d, ppid:%d\n", getpid(), getppid());// 参数是进程的退出码,类似于main函数的return nexit(12);//return 0;
}

在这里插入图片描述

我们发现和exit的现象是一样的。
我们再来看看:

#include <stdio.h>
#include <unistd.h>int func()
{printf("call func function done!\n");//return 11;// 任意地点调用exit,表示进程退出,不进行后续执行_exit(21);
}int main()
{func();printf("I am a process, pid: %d, ppid:%d\n", getpid(), getppid());// 参数是进程的退出码,类似于main函数的return n//_exit(12);//return 0;
}

在这里插入图片描述

我们看到,_exit和exit 它两表现出的结果是一致的,但是这并不能说明它两没有区别!
为了让大家看到不一致性,我们继续写代码来观察:

#include <stdio.h>
#include <stdlib.h>int main()
{printf("you can see me!");sleep(3);exit(1);
}

在这里插入图片描述
在这里插入图片描述

我们打印的字符串没有\n,因为缓冲区的原因,字符串不会立即刷新出来,在进程退出后,exit对缓冲区强制刷新,才将字符串打印在屏幕上!
我们这次改为_exit来试试:

#include <stdio.h>
#include <unistd.h>int main()
{printf("you can see me!\n");sleep(3);_exit(1);
}

在这里插入图片描述
在这里插入图片描述
我们发现,_exit函数并不会在进程退出时对缓冲区做强制刷新!
结论:

  • exit是库函数(3号手册),_exit是系统调用(2号手册);
  • exit终止进程的时候,会自动刷新缓冲区。_exit终止进程的时候,不会自动刷新缓冲区(直接将数据扔掉了)。
  • 我们目前知道的缓冲区,绝对不在操作系统内部!(具体的后面再详谈)
    在这里插入图片描述

这篇关于[Linux 进程(六)] 写时拷贝 - 进程终止的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/673474

相关文章

C++中零拷贝的多种实现方式

《C++中零拷贝的多种实现方式》本文主要介绍了C++中零拷贝的实现示例,旨在在减少数据在内存中的不必要复制,从而提高程序性能、降低内存使用并减少CPU消耗,零拷贝技术通过多种方式实现,下面就来了解一下... 目录一、C++中零拷贝技术的核心概念二、std::string_view 简介三、std::stri

Linux脚本(shell)的使用方式

《Linux脚本(shell)的使用方式》:本文主要介绍Linux脚本(shell)的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录概述语法详解数学运算表达式Shell变量变量分类环境变量Shell内部变量自定义变量:定义、赋值自定义变量:引用、修改、删

Windows的CMD窗口如何查看并杀死nginx进程

《Windows的CMD窗口如何查看并杀死nginx进程》:本文主要介绍Windows的CMD窗口如何查看并杀死nginx进程问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录Windows的CMD窗口查看并杀死nginx进程开启nginx查看nginx进程停止nginx服务

Linux链表操作方式

《Linux链表操作方式》:本文主要介绍Linux链表操作方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、链表基础概念与内核链表优势二、内核链表结构与宏解析三、内核链表的优点四、用户态链表示例五、双向循环链表在内核中的实现优势六、典型应用场景七、调试技巧与

详解Linux中常见环境变量的特点与设置

《详解Linux中常见环境变量的特点与设置》环境变量是操作系统和用户设置的一些动态键值对,为运行的程序提供配置信息,理解环境变量对于系统管理、软件开发都很重要,下面小编就为大家详细介绍一下吧... 目录前言一、环境变量的概念二、常见的环境变量三、环境变量特点及其相关指令3.1 环境变量的全局性3.2、环境变

Linux系统中的firewall-offline-cmd详解(收藏版)

《Linux系统中的firewall-offline-cmd详解(收藏版)》firewall-offline-cmd是firewalld的一个命令行工具,专门设计用于在没有运行firewalld服务的... 目录主要用途基本语法选项1. 状态管理2. 区域管理3. 服务管理4. 端口管理5. ICMP 阻断

Linux实现线程同步的多种方式汇总

《Linux实现线程同步的多种方式汇总》本文详细介绍了Linux下线程同步的多种方法,包括互斥锁、自旋锁、信号量以及它们的使用示例,通过这些同步机制,可以解决线程安全问题,防止资源竞争导致的错误,示例... 目录什么是线程同步?一、互斥锁(单人洗手间规则)适用场景:特点:二、条件变量(咖啡厅取餐系统)工作流

Linux中修改Apache HTTP Server(httpd)默认端口的完整指南

《Linux中修改ApacheHTTPServer(httpd)默认端口的完整指南》ApacheHTTPServer(简称httpd)是Linux系统中最常用的Web服务器之一,本文将详细介绍如何... 目录一、修改 httpd 默认端口的步骤1. 查找 httpd 配置文件路径2. 编辑配置文件3. 保存

Linux使用scp进行远程目录文件复制的详细步骤和示例

《Linux使用scp进行远程目录文件复制的详细步骤和示例》在Linux系统中,scp(安全复制协议)是一个使用SSH(安全外壳协议)进行文件和目录安全传输的命令,它允许在远程主机之间复制文件和目录,... 目录1. 什么是scp?2. 语法3. 示例示例 1: 复制本地目录到远程主机示例 2: 复制远程主

Java进程CPU使用率过高排查步骤详细讲解

《Java进程CPU使用率过高排查步骤详细讲解》:本文主要介绍Java进程CPU使用率过高排查的相关资料,针对Java进程CPU使用率高的问题,我们可以遵循以下步骤进行排查和优化,文中通过代码介绍... 目录前言一、初步定位问题1.1 确认进程状态1.2 确定Java进程ID1.3 快速生成线程堆栈二、分析