Linux基础I/O之文件缓冲区

2024-08-23 01:12
文章标签 基础 linux 缓冲区

本文主要是介绍Linux基础I/O之文件缓冲区,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、缓冲区的基本概念

       缓冲区这个概念,我相信大家或多或少的有听到过,那么其到底是个什么东西呢? 简单地理解一下,其可以被看做一部分的内存(可以认为是malloc来的)。

        那为什么要有缓冲区这个东西呢?其有什么作用呢?先说结论,缓冲区的主要作用就是来提高我们的效率(提高使用者的效率,提高发送效率)。那其是如何做到提高效率的呢?这里我给大家举个例子:
        比如说发快递,通常我们寄快递都会送到菜鸟驿站,但是其不会立刻将我们的快递发送出去而是会积累一部分快递,等到一定程度再进行发送。由此我们可知,因为由(驿站)缓冲区的存在,我们可以积累一部分的数据在统一进行发送。而根据我们的冯诺依曼体系结构可知,我们的内存跟硬件设备的交互是很慢的,为了避免过多的交互操作,于是就有了缓冲区的概念,先将内容写入到缓冲区中,等到一定规模之后,再统一的写入到硬件资源中,这就可以提高我们OS的效率。

        缓冲区因为能够暂存数据,必定要有一定的刷新方式,因为其到时需要向硬件写入资源:

  1. 无缓冲(立即刷新):每次写入数据都会立即被写入目标,无任何缓冲。适用于对实时性要求高的场景,例如标准错误输出。

  2. 行缓冲(行刷新):每当遇到换行符时,缓冲区中的数据会被刷新到目标。这种模式适用于文本文件或控制台输出,使输出操作更高效,但每行的结束会触发刷新。

  3. 全缓冲(缓冲区满了再刷新):数据在缓冲区中积累到一定量后才会写入目标。这种模式适用于文件写入等操作,可以减少写入次数,提高性能,但在缓冲区未满时数据不会立即显示。这些模式可以根据具体需求来调整,以平衡性能和实时性。

  4. 也可以自定义刷新策略

以上是一般策略,存在特殊情况:1.强制刷新  2.进程退出的时候,一般都会进行刷新缓冲区

二、样例展示

        说了这么多我们写一段代码来看看吧,虽然不能直接看到缓冲区,但是可以帮助我们加深对其的理解。

首先我们来对这一段代码解析一下,printf我们很熟悉了,就是向显示器进行打印,fprintf向stdout进行打印,也就是显示器,fputs也是如此,write在上篇文章已经给大家说过了,这里就不过多赘述了,接下来我们看看结果。


这里输出没什么特别的,接下来我们来改改代码。

这里对我们的输出做一个重定向的工作,同时在代码的最后我们fork()一下。可能有人会说了,欸这有什么区别吗,无非就是刚刚的输出被冲定向到了文件中而已,那么接下来让我们看看结果吧。

先说现象,原先的输出都有内容也没变,但是呢,次数变多了,且还有一件奇怪的事情,唯独write写入的那份没变多,这是为什么呢?且看下文。

三、样例分析

在上文我有说过缓冲区的刷新方式,这里补充一点小细节,同时对案例进行分析。

  1. 当我们直接向显示器打印的时候,显示器文件的刷新方式是行刷新!而且你的代码输出的所有字符串,在\n,fork()之前,数据全部已经被刷新,包括systemcall。
  2. 而当重定向到test.txt,本质是向磁盘文件中写入(不是显示了哦),我们系统对于数据的刷新方式已经由行刷新变成了全缓冲。 
  3. 全缓冲意味着缓冲区变大,实际写入的简单数据,不足以把缓冲区写满,fork执行的时候,数据依旧在缓冲区中!
  4. 在这里我们所谈的"缓冲区",和操作系统是没有关系的 ,只能和C语言有关。也就是说,这里我们所谈的主要是语言级别的缓冲区(用户级缓冲区)。
  5. C/C++提供的缓冲区,里面一定保存的是用户的数据,属于当前进程在运行时自己的数据。 如果我们把数据交给了OS,这个数据就属于OS,不属于当前进程了。
  6. 当进程退出的时候,一般要进行刷新缓冲区,即便你的数据没有满足刷新条件 --- 这个行为属于清空或者"写入操作" --- 我们知道任意一个进程在退出的时候,要刷新缓冲区,就要发生写时拷贝,所以fork()虽然并没有调用前面我们所说的函数,但其和父进程指向统一块缓冲区,退出发生写时拷贝,所以就有两份结果。
  7. 而我们的write是系统调用,也就是说write没有使用C的缓冲区,其数据会直接写入到到操作系统中!不属于进程了,就不会发生写时拷贝。
  8. 其实我们的文件也是需要有缓冲区的,这是内核级别的缓冲区,我们的write系统调用可以理解为直接向文件缓冲区进行写入。这里我们重新再理解一下刷新,从C缓冲区写入OS(文件缓冲区)这个工作叫做刷新。

       谈了这么久的缓冲区,我们要怎么去看看这个缓冲区到底在哪呢?任何情况下,我们输入输出的时候,都要由一个FILE,FILE是一个结构体,FILE里面包含了fd,同时包含一个缓冲区。这里大家可以去看看源码,加深加深自己的理解。最后用一张图总结一下这些知识。

       

这篇关于Linux基础I/O之文件缓冲区的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1097927

相关文章

Linux镜像文件制作方式

《Linux镜像文件制作方式》本文介绍了Linux镜像文件制作的过程,包括确定磁盘空间布局、制作空白镜像文件、分区与格式化、复制引导分区和其他分区... 目录1.确定磁盘空间布局2.制作空白镜像文件3.分区与格式化1) 分区2) 格式化4.复制引导分区5.复制其它分区1) 挂载2) 复制bootfs分区3)

Java利用Spire.Doc for Java实现在模板的基础上创建Word文档

《Java利用Spire.DocforJava实现在模板的基础上创建Word文档》在日常开发中,我们经常需要根据特定数据动态生成Word文档,本文将深入探讨如何利用强大的Java库Spire.Do... 目录1. Spire.Doc for Java 库介绍与安装特点与优势Maven 依赖配置2. 通过替换

Linux服务器数据盘移除并重新挂载的全过程

《Linux服务器数据盘移除并重新挂载的全过程》:本文主要介绍在Linux服务器上移除并重新挂载数据盘的整个过程,分为三大步:卸载文件系统、分离磁盘和重新挂载,每一步都有详细的步骤和注意事项,确保... 目录引言第一步:卸载文件系统第二步:分离磁盘第三步:重新挂载引言在 linux 服务器上移除并重新挂p

Linux下屏幕亮度的调节方式

《Linux下屏幕亮度的调节方式》文章介绍了Linux下屏幕亮度调节的几种方法,包括图形界面、手动调节(使用ACPI内核模块)和外接显示屏调节,以及自动调节软件(CaliseRedshift和Reds... 目录1 概述2 手动调节http://www.chinasem.cn2.1 手动屏幕调节2.2 外接显

Linux(centos7)虚拟机没有IP问题及解决方案

《Linux(centos7)虚拟机没有IP问题及解决方案》文章介绍了在CentOS7中配置虚拟机网络并使用Xshell连接虚拟机的步骤,首先,检查并配置网卡ens33的ONBOOT属性为yes,然后... 目录输入查看ZFhrxIP命令:ip addr查看,没有虚拟机IP修改ens33配置文件重启网络Xh

JavaScript装饰器从基础到实战教程

《JavaScript装饰器从基础到实战教程》装饰器是js中一种声明式语法特性,用于在不修改原始代码的情况下,动态扩展类、方法、属性或参数的行为,本文将从基础概念入手,逐步讲解装饰器的类型、用法、进阶... 目录一、装饰器基础概念1.1 什么是装饰器?1.2 装饰器的语法1.3 装饰器的执行时机二、装饰器的

Java JAR 启动内存参数配置指南(从基础设置到性能优化)

《JavaJAR启动内存参数配置指南(从基础设置到性能优化)》在启动Java可执行JAR文件时,合理配置JVM内存参数是保障应用稳定性和性能的关键,本文将系统讲解如何通过命令行参数、环境变量等方式... 目录一、核心内存参数详解1.1 堆内存配置1.2 元空间配置(MetASPace)1.3 线程栈配置1.

linux实现对.jar文件的配置文件进行修改

《linux实现对.jar文件的配置文件进行修改》文章讲述了如何使用Linux系统修改.jar文件的配置文件,包括进入文件夹、编辑文件、保存并退出编辑器,以及重新启动项目... 目录linux对.jar文件的配置文件进行修改第一步第二步 第三步第四步总结linux对.jar文件的配置文件进行修改第一步进

linux ssh如何实现增加访问端口

《linuxssh如何实现增加访问端口》Linux中SSH默认使用22端口,为了增强安全性或满足特定需求,可以通过修改SSH配置来增加或更改SSH访问端口,具体步骤包括修改SSH配置文件、增加或修改... 目录1. 修改 SSH 配置文件2. 增加或修改端口3. 保存并退出编辑器4. 更新防火墙规则使用uf

Linux join命令的使用及说明

《Linuxjoin命令的使用及说明》`join`命令用于在Linux中按字段将两个文件进行连接,类似于SQL的JOIN,它需要两个文件按用于匹配的字段排序,并且第一个文件的换行符必须是LF,`jo... 目录一. 基本语法二. 数据准备三. 指定文件的连接key四.-a输出指定文件的所有行五.-o指定输出