Linux——缓冲区与实现C库的fopen,fwrite,fclose

2023-12-10 18:30

本文主要是介绍Linux——缓冲区与实现C库的fopen,fwrite,fclose,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

一.缓冲区

1缓冲区的概念

2.缓冲区存在的意义

3.缓冲区刷新策略   

4.什么是刷新?

C语言的缓冲区在哪里?

​编辑

仿写C库里的fopen,fclose,fwrite。

mystdio.h

mystdio.c

main.c(向文件中写入20次msg)


一.缓冲区

1缓冲区的概念

缓冲区的本质就是一段内存

2.缓冲区存在的意义

提高使用者的效率

同时因为缓冲区的存在也提高了操作系统的效率

举例一个例子:
 

假如你在云南要给你北京的朋友寄东西。方法一:你可以亲自己去北京把东西交给他,方法二:把东西给快递站,让它帮你送给他。

这里虽然整个事件持续的事件基本一样,但是对于你来说方法二比方法一效率要高的多,因为你只需要把东西交给快递站,对于你来说就结束了,接下来就可以做其他事情了。而快递站,也会根据你的需求以及自身制定发送快递的策略,不会收到一个快递就发送。

这里:你就是正在执行的进程,快递站是缓冲区。朋友就是文件,快递发送策略:缓冲区刷新策略


3.缓冲区刷新策略   

     1,无缓冲(立即刷新)--fflush()

   2,行缓存(行刷新)--遇到换行就刷新

一般对于显示器文件,采用行刷新

   3,全缓冲(缓冲区满了,再刷新)

磁盘文件采用全缓冲

特殊情况:

1.强制刷新

2.进程退出时,一般要进行刷新缓冲区(属于强制刷新的一种特殊情况)

一个例子:(同一份代码不同结果)

#include <stdio.h>
#include <string.h>
#include <unistd.h>int main()
{fprintf(stdout, "C: hello fprintf\n");printf("C: hello printf\n");fputs("C: hello fputs\n", stdout);const char *str = "system call: hello write\n";write(1, str, strlen(str));fork(); // 注意fork的位置!return 0;
}

可以看出,当重定向到log.txt文件时,除了系统函数write之外,都重复了两次。且write打印的内容在最前面

解释:

1.当我们直接向显示器打印时,显示器文件的刷新方式是行刷新!而且你的代码输出所有字符串都有‘\n’,fork之前,数据就全部被刷新,包括systemcall

2.重定向到log.txt,本质是向磁盘文件中写入(不是显示器!),我们系统对于数据的刷新方式有行刷新,变成了全缓冲!

3.全缓冲意味着缓冲区变大,实际写入的简单数据,不足以把缓冲区写满,fork执行的时候,数据依旧在缓冲区中。

4.我们目前的“缓冲区”,和操作系统是没有关系的 ,只能是语言本身有关,(用户缓冲区)

5.C/C++ 所提供的缓冲区,里面一定保存的是用户数据,属于当前进程在运行自己的数据

如果我们把数据交给操作系统,这个数据就属于操作系统,不属于自己(进程)。

6.当进程退出的时候一般要刷新缓冲区(修改了进程的数据),即使你的数据没有满足刷新条件。

总结:

因此在重定向后,由于变为全缓冲,C语言函数里要打印的东西就成为数据保存在C语言的缓冲区里,接着调用了fork函数创建了子进程,这时无论那个进程在退出前,都会刷新缓冲区(修改数据据,)向文件写入数据,接着就会发生写时拷贝,未退出的进程的数据中让然有之前缓冲区的数据,当这个进程退出是,还会刷新缓冲区,向文件写入数据。因此C语言函数的内容会打印两次。

write是系统调用函数,不使用C语言的缓冲区,直接写入操作系统,不属于进程,不发生写时拷贝!同时,这也是为什么write里的内容第一个打印到log.txt文件里。

4.什么是刷新?

这里我们用printf()函数举例。

在使用printf时,我们会把数据先弄到C语言的缓冲区,当出发刷新的条件时,就调用系统函数write,将缓冲区里的数据全部刷新到文件缓冲区里。而将C语言缓冲区里的数据弄到文件缓冲区里的的过程就是刷新。

为什么要采用刷新,而不是直接通过C语言函数,向文件缓冲区直接写入?

原因:采用刷新策略的效率比直接写入效率高。

文件缓冲区的数据如何刷新到文件上?

这个操作与我们无关,取决于操作系统,但是我们可以确定一点,文件缓冲区的刷新策略一定与语言缓冲区的刷新策略不同

C语言的缓冲区在哪里?

在任何情况下,我们输入输出的时候,都要有一个FILE,FILE是一个结构体,FILE里面除了包含fd(文件标识符)外,还有一段缓冲区。同时也是因此每打开一个文件,对应文件就会有个文件缓冲区,在我们对多个文件进行操作是,因为操作的缓冲区不同,是文件之间不会相互影响。

这里如果你想查看FILE结构体里有关缓冲区的内容,可以输入指令:

vim /usr/include/libio.h +246

结构体名是_IO_FILE与是C库对FILE使用typedef重命名了。

具体可通过指令:

vim /usr/include/stdio.h

打开文件后到第48行查看

仿写C库里的fopen,fclose,fwrite。

mystdio.h

#pragma once#define SIZE 4096        //缓冲区的大小//缓冲区刷新策略#define FLUSH_NONE 1         //直接刷新
#define FLUSH_LINE (1<<1)    //行刷新
#define FLUSH_ALL  (1<<2)    //全缓冲typedef struct _myFILE     //FILE结构体
{int fileno;         //文件标识符int flag;           //刷新策略char buffer[SIZE];  //语言缓冲区int end;            //缓冲区存储数据的大小
}myFILE;extern myFILE *my_fopen(const char *path, const char *mode);   //仿写fopenextern int my_fwrite(const char *s, int num, myFILE *stream);  //仿写fwriteextern int my_fflush(myFILE *stream);                          //仿写fflushextern int my_fclose(myFILE*stream);                           //仿写fclose



mystdio.c

#include "mystdio.h"
#include <string.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <errno.h>
#include <stdlib.h>
#include <unistd.h>#define DFL_MODE 0666   //设置默认权限myFILE *my_fopen(const char *path, const char *mode)
{int fd   = 0;   int flag = 0;//设置文件打开方式if(strcmp(mode, "r") == 0){flag |= O_RDONLY;}else if(strcmp(mode, "w") == 0){flag |= (O_CREAT | O_TRUNC | O_WRONLY);}else if(strcmp(mode, "a") == 0){flag |= (O_CREAT | O_WRONLY | O_APPEND);}else{// Do Nothing}//文件不存在,创建文件并打开,并获取文件标识符与设置默认权限if(flag & O_CREAT){fd = open(path, flag, DFL_MODE);}//文件存在,打开文件,获取文件标识符else{fd = open(path, flag);}//判断文件是否打开成功if(fd < 0){errno = 2;return NULL;}//为FILE指针开辟空间myFILE *fp = (myFILE*)malloc(sizeof(myFILE));if(!fp) {errno = 3;return NULL;}//对FILE内容初始化fp->flag = FLUSH_LINE;fp->end = 0;fp->fileno = fd;return fp;
}int my_fwrite(const char *s, int num, myFILE *stream)  //仿写fwrite
{// 将数据写入C语言缓冲区memcpy(stream->buffer+stream->end, s, num);stream->end += num;// 判断是满足刷新条件, 这里我默认'\n'只会出现在结尾,在"abcd\nefgh"这种情况下会有bugif((stream->flag & FLUSH_LINE) && stream->end > 0 && stream->buffer[stream->end-1] == '\n'){my_fflush(stream);}return num;
}int my_fflush(myFILE *stream)//仿写fflush
{//当缓冲区不为空时,刷新缓冲区if(stream->end > 0){write(stream->fileno, stream->buffer, stream->end);//fsync(stream->fileno);stream->end = 0;}return 0;
}int my_fclose(myFILE*stream)   //仿写fclose
{my_fflush(stream);        //强制刷新return close(stream->fileno);
}

main.c(向文件中写入20次msg)

#include "mystdio.h"
#include <stdio.h>
#include <string.h>
#include <unistd.h>int main()
{myFILE *fp = my_fopen("./log.txt", "w");if(fp == NULL){perror("my_fopen");return 1;}int cnt = 20;const char *msg = "haha, this is my stdio lib";while(cnt--){my_fwrite(msg, strlen(msg), fp);sleep(1);}my_fclose(fp);return 0;
}

这篇关于Linux——缓冲区与实现C库的fopen,fwrite,fclose的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/477951

相关文章

Redis实现分布式锁全过程

《Redis实现分布式锁全过程》文章介绍Redis实现分布式锁的方法,包括使用SETNX和EXPIRE命令确保互斥性与防死锁,Redisson客户端提供的便捷接口,以及Redlock算法通过多节点共识... 目录Redis实现分布式锁1. 分布式锁的基本原理2. 使用 Redis 实现分布式锁2.1 获取锁

Linux实现查看某一端口是否开放

《Linux实现查看某一端口是否开放》文章介绍了三种检查端口6379是否开放的方法:通过lsof查看进程占用,用netstat区分TCP/UDP监听状态,以及用telnet测试远程连接可达性... 目录1、使用lsof 命令来查看端口是否开放2、使用netstat 命令来查看端口是否开放3、使用telnet

Linux系统管理与进程任务管理方式

《Linux系统管理与进程任务管理方式》本文系统讲解Linux管理核心技能,涵盖引导流程、服务控制(Systemd与GRUB2)、进程管理(前台/后台运行、工具使用)、计划任务(at/cron)及常用... 目录引言一、linux系统引导过程与服务控制1.1 系统引导的五个关键阶段1.2 GRUB2的进化优

使用SpringBoot+InfluxDB实现高效数据存储与查询

《使用SpringBoot+InfluxDB实现高效数据存储与查询》InfluxDB是一个开源的时间序列数据库,特别适合处理带有时间戳的监控数据、指标数据等,下面详细介绍如何在SpringBoot项目... 目录1、项目介绍2、 InfluxDB 介绍3、Spring Boot 配置 InfluxDB4、I

基于Java和FFmpeg实现视频压缩和剪辑功能

《基于Java和FFmpeg实现视频压缩和剪辑功能》在视频处理开发中,压缩和剪辑是常见的需求,本文将介绍如何使用Java结合FFmpeg实现视频压缩和剪辑功能,同时去除数据库操作,仅专注于视频处理,需... 目录引言1. 环境准备1.1 项目依赖1.2 安装 FFmpeg2. 视频压缩功能实现2.1 主要功

使用Python实现无损放大图片功能

《使用Python实现无损放大图片功能》本文介绍了如何使用Python的Pillow库进行无损图片放大,区分了JPEG和PNG格式在放大过程中的特点,并给出了示例代码,JPEG格式可能受压缩影响,需先... 目录一、什么是无损放大?二、实现方法步骤1:读取图片步骤2:无损放大图片步骤3:保存图片三、示php

使用Python实现一个简易计算器的新手指南

《使用Python实现一个简易计算器的新手指南》计算器是编程入门的经典项目,它涵盖了变量、输入输出、条件判断等核心编程概念,通过这个小项目,可以快速掌握Python的基础语法,并为后续更复杂的项目打下... 目录准备工作基础概念解析分步实现计算器第一步:获取用户输入第二步:实现基本运算第三步:显示计算结果进

Python多线程实现大文件快速下载的代码实现

《Python多线程实现大文件快速下载的代码实现》在互联网时代,文件下载是日常操作之一,尤其是大文件,然而,网络条件不稳定或带宽有限时,下载速度会变得很慢,本文将介绍如何使用Python实现多线程下载... 目录引言一、多线程下载原理二、python实现多线程下载代码说明:三、实战案例四、注意事项五、总结引

Python利用PySpark和Kafka实现流处理引擎构建指南

《Python利用PySpark和Kafka实现流处理引擎构建指南》本文将深入解剖基于Python的实时处理黄金组合:Kafka(分布式消息队列)与PySpark(分布式计算引擎)的化学反应,并构建一... 目录引言:数据洪流时代的生存法则第一章 Kafka:数据世界的中央神经系统消息引擎核心设计哲学高吞吐

C++ STL-string类底层实现过程

《C++STL-string类底层实现过程》本文实现了一个简易的string类,涵盖动态数组存储、深拷贝机制、迭代器支持、容量调整、字符串修改、运算符重载等功能,模拟标准string核心特性,重点强... 目录实现框架一、默认成员函数1.默认构造函数2.构造函数3.拷贝构造函数(重点)4.赋值运算符重载函数