【程序语言】元编程带来的代码展开技巧

2024-03-29 00:18

本文主要是介绍【程序语言】元编程带来的代码展开技巧,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

我们讨论过对int arr[20]所有元素求和的最高执行效率代码,那就是:

     int sum = arr[0]  +arr[1]  +arr[2]  +arr[3]
+arr[4]  +arr[5]  +arr[6]  +arr[7]
+arr[8]  +arr[9]  +arr[10] +arr[11]
+arr[12] +arr[13] +arr[14] +arr[15]
+arr[16] +arr[17] +arr[18] +arr[19];

但是这样写代码实在是太累了,为了效率,也不能这样写代码不是,要是我的数组是int arr[100]岂不是要写到无比长去!那么这次我们就通过元编程完成一次代码自动生成!

 
template <int Dim,typename T>  
struct Sum{  
static T sum(T *arr){  
return (*arr) + Sum<Dim-1,T>::sum(arr+1);  
};  
};  
template<typename T>  
struct Sum<1,T>{  
static T sum(T *arr){  
return *arr;  
};  
};  
/*调用代码*/ 
int sum = Sum<20,int>::sum(arr);  

解释一下上面的代码: 

 step1:当读取到 Sum<20,int>::sum(arr) 时,编译器展开到 *arr + Sum<19,int>::sum(arr+1); 

step2:当读取到 Sum<19,int>::sum(arr) 时,编译器展开到 *arr + *(arr+1) + Sum<18,int>::sum(arr+1+1); 

 ...

 编译器递归地展开上式...

 编译器展开到 *arr           +*(arr+1)     +*(arr+2)      +*(arr+3)     +*(arr+4)    + 

                         *(arr+5)     +*(arr+6)     +*(arr+7)     +*(arr+8)      +*(arr+9)    + 

                         *(arr+10)   +*(arr+11)   +*(arr+12)   +*(arr+13)   +*(arr+14) + 

                         *(arr+15)   +*(arr+16)   +*(arr+17)   +*(arr+18)   +Sum<1,int>::sum(arr+19);

最后按照struct Sum<1,T>的定义展开,即Sum<1,int>::sum(arr+19)会被展开成 *(arr+19);

同理,利用上面的代码,对int arr[100]进行求和的时候,只需调用Sum<int,100>::sum(arr)即可。

这样做的好处是什么呢?最直观的好处是代码效率的提高,循环是程序效率的关键,提高循环处得效率往往是最有效的。那么为什么这样做的效率会提高呢?

1.for(int i=0; i<100; ++i)这段代码,隐含了100处的判断,100处得自加。如果本身循环内只是做简单的加法,那么for循环的附加运算比本身的求和运算还多了。毕竟本身只做一百次求和而已!

2.for循环中的代码难以并行化,循环中的代码通常是串行执行的。但如果是简单的直接加,则编译器能优化出有效的并行指令!

如果将上面的例子继续通用化,我们就得到一种基本的技巧——"unroll the loop",即解循环,将循环用普通代码表示。如果程序中循环满足

1.循环位置是常数,例如20,100等

2.循环中语句是可按照常量分解的,如a[2]+a[4]+a[6]+a[8]+...

3.常量数列你能找到递推方式,如2中可能是2*i那么循环是可解开的。

解开的方式是

template <int Dim,typename T>  
struct name{      
static T function(T 参数){   
return 参数操作语句 + Sum<Dim-1,T>::function(递推参数);   
};    
};  
template<typename T>  
struct name<1,T>{     
static T function(T 参数){       
return 参数操作语句;      
};    
};  


有闲心的朋友可以测试一下,这种方式和普通循环求和的效率差距,我自己做过测试,差距比想象中还大,但我自己一个人的机子不具有普遍说明意义,所有有空的朋友都可以考代码测试一下,欢迎贴结果在评论中!


这篇关于【程序语言】元编程带来的代码展开技巧的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/857097

相关文章

qt5cored.dll报错怎么解决? 电脑qt5cored.dll文件丢失修复技巧

《qt5cored.dll报错怎么解决?电脑qt5cored.dll文件丢失修复技巧》在进行软件安装或运行程序时,有时会遇到由于找不到qt5core.dll,无法继续执行代码,这个问题可能是由于该文... 遇到qt5cored.dll文件错误时,可能会导致基于 Qt 开发的应用程序无法正常运行或启动。这种错

mtu设置多少网速最快? 路由器MTU设置最佳网速的技巧

《mtu设置多少网速最快?路由器MTU设置最佳网速的技巧》mtu设置多少网速最快?想要通过设置路由器mtu获得最佳网速,该怎么设置呢?下面我们就来看看路由器MTU设置最佳网速的技巧... 答:1500 MTU值指的是在网络传输中数据包的最大值,合理的设置MTU 值可以让网络更快!mtu设置可以优化不同的网

Python实例题之pygame开发打飞机游戏实例代码

《Python实例题之pygame开发打飞机游戏实例代码》对于python的学习者,能够写出一个飞机大战的程序代码,是不是感觉到非常的开心,:本文主要介绍Python实例题之pygame开发打飞机... 目录题目pygame-aircraft-game使用 Pygame 开发的打飞机游戏脚本代码解释初始化部

Java中Map.Entry()含义及方法使用代码

《Java中Map.Entry()含义及方法使用代码》:本文主要介绍Java中Map.Entry()含义及方法使用的相关资料,Map.Entry是Java中Map的静态内部接口,用于表示键值对,其... 目录前言 Map.Entry作用核心方法常见使用场景1. 遍历 Map 的所有键值对2. 直接修改 Ma

MySQL JSON 查询中的对象与数组技巧及查询示例

《MySQLJSON查询中的对象与数组技巧及查询示例》MySQL中JSON对象和JSON数组查询的详细介绍及带有WHERE条件的查询示例,本文给大家介绍的非常详细,mysqljson查询示例相关知... 目录jsON 对象查询1. JSON_CONTAINS2. JSON_EXTRACT3. JSON_TA

深入解析 Java Future 类及代码示例

《深入解析JavaFuture类及代码示例》JavaFuture是java.util.concurrent包中用于表示异步计算结果的核心接口,下面给大家介绍JavaFuture类及实例代码,感兴... 目录一、Future 类概述二、核心工作机制代码示例执行流程2. 状态机模型3. 核心方法解析行为总结:三

Spring @RequestMapping 注解及使用技巧详解

《Spring@RequestMapping注解及使用技巧详解》@RequestMapping是SpringMVC中定义请求映射规则的核心注解,用于将HTTP请求映射到Controller处理方法... 目录一、核心作用二、关键参数说明三、快捷组合注解四、动态路径参数(@PathVariable)五、匹配请

python获取cmd环境变量值的实现代码

《python获取cmd环境变量值的实现代码》:本文主要介绍在Python中获取命令行(cmd)环境变量的值,可以使用标准库中的os模块,需要的朋友可以参考下... 前言全局说明在执行py过程中,总要使用到系统环境变量一、说明1.1 环境:Windows 11 家庭版 24H2 26100.4061

pandas实现数据concat拼接的示例代码

《pandas实现数据concat拼接的示例代码》pandas.concat用于合并DataFrame或Series,本文主要介绍了pandas实现数据concat拼接的示例代码,具有一定的参考价值,... 目录语法示例:使用pandas.concat合并数据默认的concat:参数axis=0,join=

C#代码实现解析WTGPS和BD数据

《C#代码实现解析WTGPS和BD数据》在现代的导航与定位应用中,准确解析GPS和北斗(BD)等卫星定位数据至关重要,本文将使用C#语言实现解析WTGPS和BD数据,需要的可以了解下... 目录一、代码结构概览1. 核心解析方法2. 位置信息解析3. 经纬度转换方法4. 日期和时间戳解析5. 辅助方法二、L