反汇编分析C++的返回值

2024-01-23 08:38
文章标签 分析 c++ 返回值 反汇编

本文主要是介绍反汇编分析C++的返回值,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这几天一直在给同学讲数据结构和算法的题,讲题的过程中突然想到这函数的返回值究竟是存放在哪的,为什么可以通过函数的调用来直接给变量赋值。仔细想想这么多年居然没有深究过这个问题,太不应该,于是今天花了些时间来好好研究了一下这个问题。也跟了一些thread,某些前辈的观点是“不应该动不动就提到寄存器,栈,堆这些较底层的概念。完全可以这样理解:返回值保存在一段临时区域,到下一条语句时,返回值被销毁,所以,如果要继续使用返回值,必须将返回值赋予其他变量。”这确实不假,但是我觉得这位前辈应该是在透彻理解了内在的机理之后才这么说的,我觉得作为学习过程还是应该深究一下。

另有一位前辈说“不大于32位的(返回值)在eax中,64位的在edx + eax中。再大就传指针了。”

那么就拿反汇编代码开刀,验证一下。

(一)  基础知识

在看反汇编代码之前,应该有几点要明确一下:

1.每个进程对应一个Call Stack(调用栈),而CallStack 又由许多Stack Frame(栈帧)组成,对应每个未完成的函数调用,由系统分配。(VC调试中默认是会显示调用栈窗口的,越往栈顶的就是越最近调用的函数,黑色显示的就是还未返回的函数调用)

2.eax, ebx, ecx, edx, esi, edi, ebp, esp等都是X86 汇编语言中CPU上的32位通用寄存器的名称,他们各自的作用如下:

EAX 是累加器(accumulator), 它是很多加法乘法指令的缺省寄存器。

EBX 是基地址(base)寄存器,在内存寻址时存放基地址。

ECX 是计数器(counter),是重复(REP)前缀指令和LOOP指令的内定计数器。

EDX 则一般被用来放整数除法产生的余数。

ESI/EDI分别是源/目标索引寄存器(source/destinationindex),在很多字符串操作指令中,DS:ESI指向源串,而ES:EDI指向目标串。

EBP是基址指针(BASE POINTER),按照习惯,通常用于界定StackFrame(栈帧)。

ESP 是堆栈指针,被形象地称为栈顶指针,堆栈的顶部是地址小的区域,压入堆栈的数据越多,ESP也就越来越小。在32位平台上,每压入一个数据,ESP就减少4字节。

3.windows平台下的Call Stack,从上(高地址)往下(低地址)生长。

(二)代码分析

首先我实验的平台是32位版vs2010,程序为Debug版本。

先试试32位整型的int,C++的实验代码如下:

#include "stdafx.h"
int minus(int a ,int b)
{
int j=2;
return a-b;
}
int _tmain(int argc, _TCHAR* argv[])
{
int i=1;
int c=minus(3,1);
return 0;
}

在return 0处设置断点,或者直接用system(“pause”)也行。

调试运行,可以看到反汇编代码如下:

int minus(int a ,int b)
{
/*step8 再次将EPB压栈,并将ESP的值放入EPB中,此时ESP指向位置5,EPB也指向位置5,这个位置也正是minus()栈帧的底部,同时又是Main()栈帧的顶部*/
01091380 push        ebp 
01091381 mov         ebp,esp 
/*step9 作用同step2。此时EPB位置不变,ESP指向位置6*/
01091383 sub         esp,0CCh 
/*step10 作用同step3。此时EPB位置不变,ESP指向位置7*/
01091389 push        ebx 
0109138A push        esi 
0109138B push        edi 
/*step11 作用同step4。ESP和EPB位置不变*/
0109138C lea         edi,[ebp-0CCh] 
01091392 mov         ecx,33h 
01091397 mov         eax,0CCCCCCCCh 
0109139C rep stos    dword ptres:[edi] 
int j=2;
/*step12 作用同step5。ESP和EPB位置不变*/
0109139E mov         dword ptr [j],2 
return a-b;
/*step13 将参数a的值放入EAX。然后将参数b的值也传入,在EAX中进行减法,结果存放在EXA中。ESP和EPB位置不变*/
010913A5 mov         eax,dword ptr [a] 
010913A8 sub         eax,dword ptr [b] 
}
/*step14 返回过程。将三个寄存器的值弹出,恢复到调用前的状态。并将EBP的值赋给ESP,此时EBP与ESP都指向位置5,也就是释放了从位置6到位置5的预留空间。最后弹出EBP的值,使其恢复到调用minus()前的状态,ret语句进行返回,返回到先前压入栈中的返回地址所指向的地址处。此时EPB指向位置0,ESP指向位置3*/
010913AB pop         edi 
010913AC pop         esi 
010913AD pop         ebx 
010913AE mov         esp,ebp 
010913B0 pop         ebp 
010913B1 ret
int _tmain(int argc, _TCHAR* argv[])
{
/*step1 运行时库的启动函数mainCRTStartup()调用Main(),正式进入主函数,将EPB压栈,再将ESP的值放入EPB中,此时ESP指向位置0,EPB也指向位置0,这个位置也正是的Main()栈帧的底部,同时又是mainCRTStartup()栈帧的顶部*/
010913C0 push        ebp 
010913C1 mov         ebp,esp 
/*step2 将ESP下移0CCh个字节,也就是位置0到位置1之间的空间,这段空间将预留用来存储局部变量,此时ESP指向位置1,EPB指向位置0*/
010913C3 sub         esp,0D8h 
/*step3 将三个寄存器的值压栈,此时ESP指向位置2,EPB指向位置0*/
010913C9 push        ebx 
010913CA push        esi 
010913CB push        edi 
/*step4 首先将位置1的地址放入目标索引寄存器EDI中,stos dwordptr es:[edi]的意思是从累加器EAX传送4个字节(双字),到由EDI作为指针的目的串中,同时修改EDI以指向串中的下一个单元,前面加上rep代表重复执行,执行次数就是ECX寄存器中的值,而36h*4正好等于0D8h,所以以下4句的作用就是将刚刚预留的位置0到位置1之间的空间全部赋值为0CCCCCCCCh ,这其实就是int 3断点,以防止意外访问。ESP和EPB位置不变*/
010913CC lea         edi,[ebp-0D8h] 
010913D2 mov         ecx,36h 
010913D7 mov         eax,0CCCCCCCCh 
010913DC rep stos    dword ptres:[edi] 
int i=1;
/*step5 将1传到局部变量i所在地址中,也就是刚刚预留的那块空间中,i应当是EBP-偏移量的形式。ESP和EPB位置不变*/
010913DE mov         dword ptr [i],1 
int c=minus(3,1);
/*step6 在调用minus()前,按从右到左的顺序将实参压栈。EPB位置不变,ESP指向位置3*/
010913E5 push        1 
010913E7 push        3 
/*step7 调用minus(),并将下一条语句的地址010913EE压栈,作为返回地址。EPB位置不变,ESP指向位置4*/
010913E9 call        minus (10911C7h) 
/*step15 从minus返回。将ESP+8,代表释放前面压入栈中的两个市场(2个4字节),并将EAX中的值(也就是返回值)赋给局部变量c,这里也就证明了当返回值是32位int类型的时候,返回值确实是暂存在EAX中的。EPB指向位置0,ESP指向位置2*/
010913EE add         esp,8 
010913F1 mov         dword ptr [c],eax 
return 0;
/*step16 准备返回0给main函数。先对EAX自身做异或运算,EAX变成0,此时返回值才是真正的不存在了。然后将三个寄存器的值弹出,恢复到mainCRTStartup()调用main()前的状态,接着释放位置1到位置0之间的预留空间。EPB和ESP都指向位置0。再接着通过比较EBP与ESP的值,检查ESP是否正常。不相等则调用ILT+305指向的异常处理函数,使ESP等于EBP。正常的话就直接弹出EBP,结束main()函数,返回mainCRTStartup()函数中继续剩下的操作。*/
010913F4 xor         eax,eax 
}
010913F6 pop         edi 
010913F7 pop         esi 
010913F8 pop         ebx 
010913F9 add         esp,0D8h 
010913FF cmp         ebp,esp 
01091401 call       @ILT+305(__RTC_CheckEsp) (1091136h) 
01091406 mov         esp,ebp 
01091408 pop         ebp 
01091409 ret  

示意图如图:

再试试64位整型的long long,C++的实验代码如下(VC6编译器可能不支持long long):

#include "stdafx.h"
long long minus(long long a , long long b)
{
int j=2;
return a-b;
}
int _tmain(int argc, _TCHAR* argv[])
{
int i=1;
long long c=minus(3,1);
return 0;
}

反汇编代码如下:

long long minus(long long a ,long long b)
{
01351380 push        ebp 
01351381 mov         ebp,esp 
01351383 sub         esp,0CCh 
01351389 push        ebx 
0135138A push        esi 
0135138B push        edi 
0135138C lea         edi,[ebp-0CCh] 
01351392 mov         ecx,33h 
01351397 mov         eax,0CCCCCCCCh 
0135139C rep stos    dword ptres:[edi] 
int j=2;
0135139E mov         dword ptr [j],2 
return a-b;
<SPAN style="COLOR: #ff0000">013513A5 mov         eax,dword ptr [a] 
013513A8 sub         eax,dword ptr [b] 
013513AB mov         edx,dword ptr[ebp+0Ch] 
013513AE sbb         edx,dword ptr[ebp+14h] </SPAN>
}
013513B1 pop         edi 
013513B2 pop         esi 
013513B3 pop         ebx 
013513B4 mov         esp,ebp 
013513B6 pop         ebp 
013513B7 ret 
int _tmain(int argc, _TCHAR* argv[])
{
013513C0 push        ebp 
013513C1 mov         ebp,esp 
013513C3 sub         esp,0DCh 
013513C9 push        ebx 
013513CA push        esi 
013513CB push        edi 
013513CC lea         edi,[ebp-0DCh] 
013513D2 mov         ecx,37h 
013513D7 mov         eax,0CCCCCCCCh 
013513DC rep stos    dword ptres:[edi] 
int i=1;
013513DE mov         dword ptr [i],1 
long long c=minus(3,1);
013513E5 push        0 
013513E7 push        1 
013513E9 push        0 
013513EB push        3 
013513ED call        minus (13511C2h) 
013513F2 add         esp,10h 
<SPAN style="COLOR: #ff0000">013513F5 mov         dword ptr [c],eax 
013513F8 mov        dword ptr [ebp-14h],edx </SPAN>
return 0;
013513FB xor         eax,eax 
}
013513FD pop         edi 
013513FE pop         esi 
013513FF pop         ebx 
01351400 add         esp,0DCh 
01351406 cmp         ebp,esp 
01351408 call       @ILT+305(__RTC_CheckEsp) (1351136h) 
0135140D mov         esp,ebp 
0135140F pop         ebp 
01351410 ret  

可以发现在进行减法运算和传递返回值时确实发生了变化,说明返回值为64位整型时,会使用EAX和EDX来分别传递返回值的低32位和高32位。

浮点数的情况就不重复贴代码了,直接看反汇编代码:

float c=minus(3,1);
010E13F5 push        ecx 
//压入实参1到浮点寄存器st(0),注意这个操作不会影响ESP的值
010E13F6 fld1 
//将1送入到ESP指向的空间中,也就是ECX中?并且1从st(0)出栈
010E13F8 fstp        dword ptr [esp] 
010E13FB push        ecx 
//另一个实参3
010E13FC fld         dword ptr[__real@40400000 (10E573Ch)] 
010E1402 fstp        dword ptr [esp] 
010E1405 call        minus (10E117Ch) 
010E140A add         esp,8 
//返回值赋给c,然后出栈
010E140D fstp        dword ptr [c]  

可以看出浮点类型的返回值是暂存在浮点寄存器st(0)中的。

 

这篇关于反汇编分析C++的返回值的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/635835

相关文章

C++中unordered_set哈希集合的实现

《C++中unordered_set哈希集合的实现》std::unordered_set是C++标准库中的无序关联容器,基于哈希表实现,具有元素唯一性和无序性特点,本文就来详细的介绍一下unorder... 目录一、概述二、头文件与命名空间三、常用方法与示例1. 构造与析构2. 迭代器与遍历3. 容量相关4

C++中悬垂引用(Dangling Reference) 的实现

《C++中悬垂引用(DanglingReference)的实现》C++中的悬垂引用指引用绑定的对象被销毁后引用仍存在的情况,会导致访问无效内存,下面就来详细的介绍一下产生的原因以及如何避免,感兴趣... 目录悬垂引用的产生原因1. 引用绑定到局部变量,变量超出作用域后销毁2. 引用绑定到动态分配的对象,对象

Nginx分布式部署流程分析

《Nginx分布式部署流程分析》文章介绍Nginx在分布式部署中的反向代理和负载均衡作用,用于分发请求、减轻服务器压力及解决session共享问题,涵盖配置方法、策略及Java项目应用,并提及分布式事... 目录分布式部署NginxJava中的代理代理分为正向代理和反向代理正向代理反向代理Nginx应用场景

Redis中的有序集合zset从使用到原理分析

《Redis中的有序集合zset从使用到原理分析》Redis有序集合(zset)是字符串与分值的有序映射,通过跳跃表和哈希表结合实现高效有序性管理,适用于排行榜、延迟队列等场景,其时间复杂度低,内存占... 目录开篇:排行榜背后的秘密一、zset的基本使用1.1 常用命令1.2 Java客户端示例二、zse

Redis中的AOF原理及分析

《Redis中的AOF原理及分析》Redis的AOF通过记录所有写操作命令实现持久化,支持always/everysec/no三种同步策略,重写机制优化文件体积,与RDB结合可平衡数据安全与恢复效率... 目录开篇:从日记本到AOF一、AOF的基本执行流程1. 命令执行与记录2. AOF重写机制二、AOF的

MyBatis Plus大数据量查询慢原因分析及解决

《MyBatisPlus大数据量查询慢原因分析及解决》大数据量查询慢常因全表扫描、分页不当、索引缺失、内存占用高及ORM开销,优化措施包括分页查询、流式读取、SQL优化、批处理、多数据源、结果集二次... 目录大数据量查询慢的常见原因优化方案高级方案配置调优监控与诊断总结大数据量查询慢的常见原因MyBAT

分析 Java Stream 的 peek使用实践与副作用处理方案

《分析JavaStream的peek使用实践与副作用处理方案》StreamAPI的peek操作是中间操作,用于观察元素但不终止流,其副作用风险包括线程安全、顺序混乱及性能问题,合理使用场景有限... 目录一、peek 操作的本质:有状态的中间操作二、副作用的定义与风险场景1. 并行流下的线程安全问题2. 顺

C++读写word文档(.docx)DuckX库的使用详解

《C++读写word文档(.docx)DuckX库的使用详解》DuckX是C++库,用于创建/编辑.docx文件,支持读取文档、添加段落/片段、编辑表格,解决中文乱码需更改编码方案,进阶功能含文本替换... 目录一、基本用法1. 读取文档3. 添加段落4. 添加片段3. 编辑表格二、进阶用法1. 文本替换2

MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决

《MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决》MyBatis默认开启一级缓存,同一事务中循环调用查询方法时会重复使用缓存数据,导致获取的序列主键值均为1,... 目录问题原因解决办法如果是存储过程总结问题myBATis有如下代码获取序列作为主键IdMappe

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别