glibc fread函数源码剖析

2024-08-22 04:38
文章标签 源码 函数 剖析 glibc fread

本文主要是介绍glibc fread函数源码剖析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

最近看APUE,看到了fread函数,就把之前想分析的一个函数借这个机会研究一下。

先写个程序,调用一下fread函数。

#include <stdio.h>int main()
{char strbuf[12];FILE* fp;fp = fopen("./temp","r");fread(strbuf,sizeof(char),11,fp);return 0;
}

好了,还是咱们的老套路,通过gdb可以直接定位到fread的源码,源码如下,位于./libio/iofread.c。

_IO_size_t
_IO_fread (void *buf, _IO_size_t size, _IO_size_t count, _IO_FILE *fp)
{_IO_size_t bytes_requested = size * count;_IO_size_t bytes_read;CHECK_FILE (fp, 0);if (bytes_requested == 0)return 0;_IO_acquire_lock (fp);bytes_read = _IO_sgetn (fp, (char *) buf, bytes_requested);_IO_release_lock (fp);return bytes_requested == bytes_read ? count : bytes_read / size;
}
libc_hidden_def (_IO_fread)#ifdef weak_alias
weak_alias (_IO_fread, fread)# ifndef _IO_MTSAFE_IO
strong_alias (_IO_fread, __fread_unlocked)
libc_hidden_def (__fread_unlocked)
weak_alias (_IO_fread, fread_unlocked)
# endif
#endif

还是一样的套路,弱符号机制,不管该函数最后的导出名是什么,我们的注意力都聚焦到了_IO_fread,这个函数就是fread的函数体。一行一行的分析。

先看头两个变量:

  _IO_size_t bytes_requested = size * count;_IO_size_t bytes_read;

通过变量名基本可以确定,“bytes_requested”应该就是要读入的字节数,而“bytes_read”我估计是已经读出的字节数,这一点可通过我们接下来的源码分析进行验证。

CHECK_FILE (fp, 0);

这个看起来像函数调用的语句,我估计又是通过宏实现的,先在头文件里找一下。

果然没错:

# define CHECK_FILE(FILE, RET) COERCE_FILE (FILE)
# define COERCE_FILE(FILE) \
(((FILE)->_IO_file_flags & _IO_MAGIC_MASK) == _OLD_MAGIC_MASK \
&& (FILE) = *(FILE**)&((int*)fp)[1])

在分析这么一个简单的宏函数过程中,我就遇到了非常多的问题,首先是第一点:

(FILE)->_IO_file_flags

我刚刚又看了一下struct _IO_FILE的定义,其中根本就没有_IO_file_flags成员,与之相关的定义倒是有一个:

#define _IO_file_flags _flags

不过这也不对头,这个define的作用也是把“_IO_file_flags”换成“_flags”。

关于这个问题暂且先存下吧,也许是咱们之前的某些分析不对,导致这一步理解的有问题。

((FILE)->_IO_file_flags & _IO_MAGIC_MASK)

这一句倒是没什么问题了,就是当前的文件标志与_IO_MAGIC_MASK做与运算。_IO_MAGIC_MASK的定义位于./libio/libio.h,值为0xFFFF0000,这一步的作用就是把所有文件标志位关闭,然后保留IO的魔数,这个IO魔数的值为0xFBAD0000,定义同样位于./libio/libio.h。但_OLD_MAGIC_MASK的值我就没有找到了。不过这一步的结果也比较明确不是0就是1。

第二句的功能我根本就没有分析出来。

&((int*)fp)[1])

首先将fp转化为int指针(此处的fp应该是某个全局变量),然后再取fp指针所在地址的第一项的地址。此时fp指针是一个int**类型的指针。

*(FILE**)&((int*)fp)[1])

再转化为FILE**类型,再取其第一个元素,对于这一系列操作的功能,我实在不能理解其深意,不过FILE指针结果还是两个不是指向一个地址,就是为NULL,与上一步的结果进行与运算,得到的结果不是1就是0,但我们的程序中并没有利用这一结果。

所以这一语句的功能我就不得而知了。

if (bytes_requested == 0)return 0;

没什么说的,如果需要读入的字节为0,则直接返回。

_IO_acquire_lock (fp);bytes_read = _IO_sgetn (fp, (char *) buf, bytes_requested);_IO_release_lock (fp);

这才是fread函数的主要功能,获取与释放所就不说了,直奔主题:_IO_sgetn函数。

_IO_size_t
_IO_sgetn (_IO_FILE *fp, void *data, _IO_size_t n)
{/* FIXME handle putback buffer here! */return _IO_XSGETN (fp, data, n);
}
libc_hidden_def (_IO_sgetn) //定义位于./libio/genops.c
#define _IO_XSGETN(FP, DATA, N) JUMP2 (__xsgetn, FP, DATA, N) //定义位于./libio/libioP.h
#define JUMP2(FUNC, THIS, X1, X2) (_IO_JUMPS_FUNC(THIS)->FUNC) (THIS, X1, X2) //定义位于./libio/libioP.h

相关的定义查找至此已经可以进行分析了,关于“_IO_JUMPS_FUNC”,定义太复杂了,就不展开来看了,通过这一宏定义的基本形式可以推断FUNC就是实际执行功能的函数。

所以又回到了“__xsgetn”这个函数上,在libioP.h有一个结构体的定义如下:

struct _IO_jump_t
{JUMP_FIELD(size_t, __dummy);JUMP_FIELD(size_t, __dummy2);JUMP_FIELD(_IO_finish_t, __finish);JUMP_FIELD(_IO_overflow_t, __overflow);JUMP_FIELD(_IO_underflow_t, __underflow);JUMP_FIELD(_IO_underflow_t, __uflow);JUMP_FIELD(_IO_pbackfail_t, __pbackfail);/* showmany */JUMP_FIELD(_IO_xsputn_t, __xsputn);JUMP_FIELD(_IO_xsgetn_t, __xsgetn);JUMP_FIELD(_IO_seekoff_t, __seekoff);JUMP_FIELD(_IO_seekpos_t, __seekpos);JUMP_FIELD(_IO_setbuf_t, __setbuf);JUMP_FIELD(_IO_sync_t, __sync);JUMP_FIELD(_IO_doallocate_t, __doallocate);JUMP_FIELD(_IO_read_t, __read);JUMP_FIELD(_IO_write_t, __write);JUMP_FIELD(_IO_seek_t, __seek);JUMP_FIELD(_IO_close_t, __close);JUMP_FIELD(_IO_stat_t, __stat);JUMP_FIELD(_IO_showmanyc_t, __showmanyc);JUMP_FIELD(_IO_imbue_t, __imbue);
#if 0get_column;set_column;
#endif
};

其中有关于I/O操作的定义,JUMP_FIELD的功能比较简单:

#define JUMP_FIELD(TYPE, NAME) TYPE NAME

现在就需要看看_IO_xsgetn_t的类型了。定义如下:

typedef _IO_size_t (*_IO_xsgetn_t) (_IO_FILE *FP, void *DATA, _IO_size_t N);

原来是一个函数指针,至此我们的线索已经全部用完了,直接搜索“_IO_xsgetn_t”与“__xsgetn”已无法得到什么有效结果了。

不过可通过“_IO_xsgetn_t”的注释略知一二。

/* The 'xsgetn' hook reads upto N characters into buffer DATA.Returns the number of character actually read.It matches the streambuf::xsgetn virtual function. */

xsgetn函数的功能就是读n个字节到DATA中,并返回实际读的字节数。

到此就算是我们的fread函数的功能分析完了吧,其实肯定没有分析完,fread在底层上一定是通过read实现功能的,而read是通过文件描述符对文件进行标记,因此这之间肯定还涉及参数的转换问题,这一功能我们已知可以通过fileno实现。

好了fread功能的实现就先分析到这里。


这篇关于glibc fread函数源码剖析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1095268

相关文章

Python函数作用域与闭包举例深度解析

《Python函数作用域与闭包举例深度解析》Python函数的作用域规则和闭包是编程中的关键概念,它们决定了变量的访问和生命周期,:本文主要介绍Python函数作用域与闭包的相关资料,文中通过代码... 目录1. 基础作用域访问示例1:访问全局变量示例2:访问外层函数变量2. 闭包基础示例3:简单闭包示例4

Python中isinstance()函数原理解释及详细用法示例

《Python中isinstance()函数原理解释及详细用法示例》isinstance()是Python内置的一个非常有用的函数,用于检查一个对象是否属于指定的类型或类型元组中的某一个类型,它是Py... 目录python中isinstance()函数原理解释及详细用法指南一、isinstance()函数

python中的高阶函数示例详解

《python中的高阶函数示例详解》在Python中,高阶函数是指接受函数作为参数或返回函数作为结果的函数,下面:本文主要介绍python中高阶函数的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录1.定义2.map函数3.filter函数4.reduce函数5.sorted函数6.自定义高阶函数

Python中的sort方法、sorted函数与lambda表达式及用法详解

《Python中的sort方法、sorted函数与lambda表达式及用法详解》文章对比了Python中list.sort()与sorted()函数的区别,指出sort()原地排序返回None,sor... 目录1. sort()方法1.1 sort()方法1.2 基本语法和参数A. reverse参数B.

Python函数的基本用法、返回值特性、全局变量修改及异常处理技巧

《Python函数的基本用法、返回值特性、全局变量修改及异常处理技巧》本文将通过实际代码示例,深入讲解Python函数的基本用法、返回值特性、全局变量修改以及异常处理技巧,感兴趣的朋友跟随小编一起看看... 目录一、python函数定义与调用1.1 基本函数定义1.2 函数调用二、函数返回值详解2.1 有返

Python Excel 通用筛选函数的实现

《PythonExcel通用筛选函数的实现》本文主要介绍了PythonExcel通用筛选函数的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 目录案例目的示例数据假定数据来源是字典优化:通用CSV数据处理函数使用说明使用示例注意事项案例目的第一

java 恺撒加密/解密实现原理(附带源码)

《java恺撒加密/解密实现原理(附带源码)》本文介绍Java实现恺撒加密与解密,通过固定位移量对字母进行循环替换,保留大小写及非字母字符,由于其实现简单、易于理解,恺撒加密常被用作学习加密算法的入... 目录Java 恺撒加密/解密实现1. 项目背景与介绍2. 相关知识2.1 恺撒加密算法原理2.2 Ja

Nginx屏蔽服务器名称与版本信息方式(源码级修改)

《Nginx屏蔽服务器名称与版本信息方式(源码级修改)》本文详解如何通过源码修改Nginx1.25.4,移除Server响应头中的服务类型和版本信息,以增强安全性,需重新配置、编译、安装,升级时需重复... 目录一、背景与目的二、适用版本三、操作步骤修改源码文件四、后续操作提示五、注意事项六、总结一、背景与

Android实现图片浏览功能的示例详解(附带源码)

《Android实现图片浏览功能的示例详解(附带源码)》在许多应用中,都需要展示图片并支持用户进行浏览,本文主要为大家介绍了如何通过Android实现图片浏览功能,感兴趣的小伙伴可以跟随小编一起学习一... 目录一、项目背景详细介绍二、项目需求详细介绍三、相关技术详细介绍四、实现思路详细介绍五、完整实现代码

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法