glibc fread函数源码剖析

2024-08-22 04:38
文章标签 源码 函数 剖析 glibc fread

本文主要是介绍glibc fread函数源码剖析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

最近看APUE,看到了fread函数,就把之前想分析的一个函数借这个机会研究一下。

先写个程序,调用一下fread函数。

#include <stdio.h>int main()
{char strbuf[12];FILE* fp;fp = fopen("./temp","r");fread(strbuf,sizeof(char),11,fp);return 0;
}

好了,还是咱们的老套路,通过gdb可以直接定位到fread的源码,源码如下,位于./libio/iofread.c。

_IO_size_t
_IO_fread (void *buf, _IO_size_t size, _IO_size_t count, _IO_FILE *fp)
{_IO_size_t bytes_requested = size * count;_IO_size_t bytes_read;CHECK_FILE (fp, 0);if (bytes_requested == 0)return 0;_IO_acquire_lock (fp);bytes_read = _IO_sgetn (fp, (char *) buf, bytes_requested);_IO_release_lock (fp);return bytes_requested == bytes_read ? count : bytes_read / size;
}
libc_hidden_def (_IO_fread)#ifdef weak_alias
weak_alias (_IO_fread, fread)# ifndef _IO_MTSAFE_IO
strong_alias (_IO_fread, __fread_unlocked)
libc_hidden_def (__fread_unlocked)
weak_alias (_IO_fread, fread_unlocked)
# endif
#endif

还是一样的套路,弱符号机制,不管该函数最后的导出名是什么,我们的注意力都聚焦到了_IO_fread,这个函数就是fread的函数体。一行一行的分析。

先看头两个变量:

  _IO_size_t bytes_requested = size * count;_IO_size_t bytes_read;

通过变量名基本可以确定,“bytes_requested”应该就是要读入的字节数,而“bytes_read”我估计是已经读出的字节数,这一点可通过我们接下来的源码分析进行验证。

CHECK_FILE (fp, 0);

这个看起来像函数调用的语句,我估计又是通过宏实现的,先在头文件里找一下。

果然没错:

# define CHECK_FILE(FILE, RET) COERCE_FILE (FILE)
# define COERCE_FILE(FILE) \
(((FILE)->_IO_file_flags & _IO_MAGIC_MASK) == _OLD_MAGIC_MASK \
&& (FILE) = *(FILE**)&((int*)fp)[1])

在分析这么一个简单的宏函数过程中,我就遇到了非常多的问题,首先是第一点:

(FILE)->_IO_file_flags

我刚刚又看了一下struct _IO_FILE的定义,其中根本就没有_IO_file_flags成员,与之相关的定义倒是有一个:

#define _IO_file_flags _flags

不过这也不对头,这个define的作用也是把“_IO_file_flags”换成“_flags”。

关于这个问题暂且先存下吧,也许是咱们之前的某些分析不对,导致这一步理解的有问题。

((FILE)->_IO_file_flags & _IO_MAGIC_MASK)

这一句倒是没什么问题了,就是当前的文件标志与_IO_MAGIC_MASK做与运算。_IO_MAGIC_MASK的定义位于./libio/libio.h,值为0xFFFF0000,这一步的作用就是把所有文件标志位关闭,然后保留IO的魔数,这个IO魔数的值为0xFBAD0000,定义同样位于./libio/libio.h。但_OLD_MAGIC_MASK的值我就没有找到了。不过这一步的结果也比较明确不是0就是1。

第二句的功能我根本就没有分析出来。

&((int*)fp)[1])

首先将fp转化为int指针(此处的fp应该是某个全局变量),然后再取fp指针所在地址的第一项的地址。此时fp指针是一个int**类型的指针。

*(FILE**)&((int*)fp)[1])

再转化为FILE**类型,再取其第一个元素,对于这一系列操作的功能,我实在不能理解其深意,不过FILE指针结果还是两个不是指向一个地址,就是为NULL,与上一步的结果进行与运算,得到的结果不是1就是0,但我们的程序中并没有利用这一结果。

所以这一语句的功能我就不得而知了。

if (bytes_requested == 0)return 0;

没什么说的,如果需要读入的字节为0,则直接返回。

_IO_acquire_lock (fp);bytes_read = _IO_sgetn (fp, (char *) buf, bytes_requested);_IO_release_lock (fp);

这才是fread函数的主要功能,获取与释放所就不说了,直奔主题:_IO_sgetn函数。

_IO_size_t
_IO_sgetn (_IO_FILE *fp, void *data, _IO_size_t n)
{/* FIXME handle putback buffer here! */return _IO_XSGETN (fp, data, n);
}
libc_hidden_def (_IO_sgetn) //定义位于./libio/genops.c
#define _IO_XSGETN(FP, DATA, N) JUMP2 (__xsgetn, FP, DATA, N) //定义位于./libio/libioP.h
#define JUMP2(FUNC, THIS, X1, X2) (_IO_JUMPS_FUNC(THIS)->FUNC) (THIS, X1, X2) //定义位于./libio/libioP.h

相关的定义查找至此已经可以进行分析了,关于“_IO_JUMPS_FUNC”,定义太复杂了,就不展开来看了,通过这一宏定义的基本形式可以推断FUNC就是实际执行功能的函数。

所以又回到了“__xsgetn”这个函数上,在libioP.h有一个结构体的定义如下:

struct _IO_jump_t
{JUMP_FIELD(size_t, __dummy);JUMP_FIELD(size_t, __dummy2);JUMP_FIELD(_IO_finish_t, __finish);JUMP_FIELD(_IO_overflow_t, __overflow);JUMP_FIELD(_IO_underflow_t, __underflow);JUMP_FIELD(_IO_underflow_t, __uflow);JUMP_FIELD(_IO_pbackfail_t, __pbackfail);/* showmany */JUMP_FIELD(_IO_xsputn_t, __xsputn);JUMP_FIELD(_IO_xsgetn_t, __xsgetn);JUMP_FIELD(_IO_seekoff_t, __seekoff);JUMP_FIELD(_IO_seekpos_t, __seekpos);JUMP_FIELD(_IO_setbuf_t, __setbuf);JUMP_FIELD(_IO_sync_t, __sync);JUMP_FIELD(_IO_doallocate_t, __doallocate);JUMP_FIELD(_IO_read_t, __read);JUMP_FIELD(_IO_write_t, __write);JUMP_FIELD(_IO_seek_t, __seek);JUMP_FIELD(_IO_close_t, __close);JUMP_FIELD(_IO_stat_t, __stat);JUMP_FIELD(_IO_showmanyc_t, __showmanyc);JUMP_FIELD(_IO_imbue_t, __imbue);
#if 0get_column;set_column;
#endif
};

其中有关于I/O操作的定义,JUMP_FIELD的功能比较简单:

#define JUMP_FIELD(TYPE, NAME) TYPE NAME

现在就需要看看_IO_xsgetn_t的类型了。定义如下:

typedef _IO_size_t (*_IO_xsgetn_t) (_IO_FILE *FP, void *DATA, _IO_size_t N);

原来是一个函数指针,至此我们的线索已经全部用完了,直接搜索“_IO_xsgetn_t”与“__xsgetn”已无法得到什么有效结果了。

不过可通过“_IO_xsgetn_t”的注释略知一二。

/* The 'xsgetn' hook reads upto N characters into buffer DATA.Returns the number of character actually read.It matches the streambuf::xsgetn virtual function. */

xsgetn函数的功能就是读n个字节到DATA中,并返回实际读的字节数。

到此就算是我们的fread函数的功能分析完了吧,其实肯定没有分析完,fread在底层上一定是通过read实现功能的,而read是通过文件描述符对文件进行标记,因此这之间肯定还涉及参数的转换问题,这一功能我们已知可以通过fileno实现。

好了fread功能的实现就先分析到这里。


这篇关于glibc fread函数源码剖析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1095268

相关文章

Python的time模块一些常用功能(各种与时间相关的函数)

《Python的time模块一些常用功能(各种与时间相关的函数)》Python的time模块提供了各种与时间相关的函数,包括获取当前时间、处理时间间隔、执行时间测量等,:本文主要介绍Python的... 目录1. 获取当前时间2. 时间格式化3. 延时执行4. 时间戳运算5. 计算代码执行时间6. 转换为指

Python正则表达式语法及re模块中的常用函数详解

《Python正则表达式语法及re模块中的常用函数详解》这篇文章主要给大家介绍了关于Python正则表达式语法及re模块中常用函数的相关资料,正则表达式是一种强大的字符串处理工具,可以用于匹配、切分、... 目录概念、作用和步骤语法re模块中的常用函数总结 概念、作用和步骤概念: 本身也是一个字符串,其中

Java 正则表达式URL 匹配与源码全解析

《Java正则表达式URL匹配与源码全解析》在Web应用开发中,我们经常需要对URL进行格式验证,今天我们结合Java的Pattern和Matcher类,深入理解正则表达式在实际应用中... 目录1.正则表达式分解:2. 添加域名匹配 (2)3. 添加路径和查询参数匹配 (3) 4. 最终优化版本5.设计思

shell编程之函数与数组的使用详解

《shell编程之函数与数组的使用详解》:本文主要介绍shell编程之函数与数组的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录shell函数函数的用法俩个数求和系统资源监控并报警函数函数变量的作用范围函数的参数递归函数shell数组获取数组的长度读取某下的

MySQL高级查询之JOIN、子查询、窗口函数实际案例

《MySQL高级查询之JOIN、子查询、窗口函数实际案例》:本文主要介绍MySQL高级查询之JOIN、子查询、窗口函数实际案例的相关资料,JOIN用于多表关联查询,子查询用于数据筛选和过滤,窗口函... 目录前言1. JOIN(连接查询)1.1 内连接(INNER JOIN)1.2 左连接(LEFT JOI

MySQL中FIND_IN_SET函数与INSTR函数用法解析

《MySQL中FIND_IN_SET函数与INSTR函数用法解析》:本文主要介绍MySQL中FIND_IN_SET函数与INSTR函数用法解析,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友一... 目录一、功能定义与语法1、FIND_IN_SET函数2、INSTR函数二、本质区别对比三、实际场景案例分

C++ Sort函数使用场景分析

《C++Sort函数使用场景分析》sort函数是algorithm库下的一个函数,sort函数是不稳定的,即大小相同的元素在排序后相对顺序可能发生改变,如果某些场景需要保持相同元素间的相对顺序,可使... 目录C++ Sort函数详解一、sort函数调用的两种方式二、sort函数使用场景三、sort函数排序

C语言函数递归实际应用举例详解

《C语言函数递归实际应用举例详解》程序调用自身的编程技巧称为递归,递归做为一种算法在程序设计语言中广泛应用,:本文主要介绍C语言函数递归实际应用举例的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录前言一、递归的概念与思想二、递归的限制条件 三、递归的实际应用举例(一)求 n 的阶乘(二)顺序打印

Java调用C++动态库超详细步骤讲解(附源码)

《Java调用C++动态库超详细步骤讲解(附源码)》C语言因其高效和接近硬件的特性,时常会被用在性能要求较高或者需要直接操作硬件的场合,:本文主要介绍Java调用C++动态库的相关资料,文中通过代... 目录一、直接调用C++库第一步:动态库生成(vs2017+qt5.12.10)第二步:Java调用C++

C/C++错误信息处理的常见方法及函数

《C/C++错误信息处理的常见方法及函数》C/C++是两种广泛使用的编程语言,特别是在系统编程、嵌入式开发以及高性能计算领域,:本文主要介绍C/C++错误信息处理的常见方法及函数,文中通过代码介绍... 目录前言1. errno 和 perror()示例:2. strerror()示例:3. perror(