用linux perf命令来分析程序的cpu cache miss现象

2024-02-06 10:58

本文主要是介绍用linux perf命令来分析程序的cpu cache miss现象,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

     先来看一段简单的程序:

#include <stdio.h>
#include <unistd.h>int main(int argc, char **argv)
{int a[1000][1000];if(1 == argc){for(int i = 0; i < 1000; ++i){for(int j = 0; j < 1000; ++j){a[i][j] = 0;}}}else{for(int i = 0; i < 1000; ++i){for(int j = 0; j < 1000; ++j){a[j][i] = 0;}}}return 0;
}

       上面有两个小程序片段, 哪段效率高? 显然, 第一段效率高, 为什么呢? 因为在C/C++中,数组是按行存储的,程序的按行访问可以充分利用程序的局部性原理(空间局部性), 用time命令来看看结果:

taoge$ time ./a.out real    0m0.006s
user    0m0.004s
sys     0m0.000s
taoge$ time ./a.out real    0m0.006s
user    0m0.004s
sys     0m0.000s
taoge$ time ./a.out real    0m0.006s
user    0m0.004s
sys     0m0.000s
taoge$ time ./a.out 1real    0m0.009s
user    0m0.004s
sys     0m0.008s
taoge$ time ./a.out 1real    0m0.010s
user    0m0.004s
sys     0m0.004s
taoge$ time ./a.out 1real    0m0.010s
user    0m0.004s
sys     0m0.004s

        显然, 第二段程序的real time要大, 用perf分析下原因:

taoge$ perf stat -e L1-dcache-load-misses ./a.outPerformance counter stats for './a.out':101,870 L1-dcache-load-misses                                       0.005415735 seconds time elapsedtaoge$ 
taoge$ 
taoge$ perf stat -e L1-dcache-load-misses ./a.outPerformance counter stats for './a.out':100,231 L1-dcache-load-misses                                       0.005486385 seconds time elapsedtaoge$ 
taoge$ 
taoge$ perf stat -e L1-dcache-load-misses ./a.outPerformance counter stats for './a.out':103,496 L1-dcache-load-misses                                       0.005329914 seconds time elapsedtaoge$ 
taoge$ 
taoge$ perf stat -e L1-dcache-load-misses ./a.out 1Performance counter stats for './a.out 1':1,122,333 L1-dcache-load-misses                                       0.012910445 seconds time elapsedtaoge$ 
taoge$ 
taoge$ perf stat -e L1-dcache-load-misses ./a.out 1Performance counter stats for './a.out 1':1,093,971 L1-dcache-load-misses                                       0.009197791 seconds time elapsedtaoge$ 
taoge$ 
taoge$ perf stat -e L1-dcache-load-misses ./a.out 1Performance counter stats for './a.out 1':1,099,561 L1-dcache-load-misses                                       0.009234823 seconds time elapsedtaoge$ 

       显而易见了,  cache miss太多了。

       理论联系实际地理解一下, 有好处。

 

 

 

 

这篇关于用linux perf命令来分析程序的cpu cache miss现象的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/684090

相关文章

Linux之systemV共享内存方式

《Linux之systemV共享内存方式》:本文主要介绍Linux之systemV共享内存方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、工作原理二、系统调用接口1、申请共享内存(一)key的获取(二)共享内存的申请2、将共享内存段连接到进程地址空间3、将

判断PyTorch是GPU版还是CPU版的方法小结

《判断PyTorch是GPU版还是CPU版的方法小结》PyTorch作为当前最流行的深度学习框架之一,支持在CPU和GPU(NVIDIACUDA)上运行,所以对于深度学习开发者来说,正确识别PyTor... 目录前言为什么需要区分GPU和CPU版本?性能差异硬件要求如何检查PyTorch版本?方法1:使用命

快速修复一个Panic的Linux内核的技巧

《快速修复一个Panic的Linux内核的技巧》Linux系统中运行了不当的mkinitcpio操作导致内核文件不能正常工作,重启的时候,内核启动中止于Panic状态,该怎么解决这个问题呢?下面我们就... 感谢China编程(www.chinasem.cn)网友 鸢一雨音 的投稿写这篇文章是有原因的。为了配置完

Linux命令之firewalld的用法

《Linux命令之firewalld的用法》:本文主要介绍Linux命令之firewalld的用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux命令之firewalld1、程序包2、启动firewalld3、配置文件4、firewalld规则定义的九大

Linux之计划任务和调度命令at/cron详解

《Linux之计划任务和调度命令at/cron详解》:本文主要介绍Linux之计划任务和调度命令at/cron的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux计划任务和调度命令at/cron一、计划任务二、命令{at}介绍三、命令语法及功能 :at

Linux下如何使用C++获取硬件信息

《Linux下如何使用C++获取硬件信息》这篇文章主要为大家详细介绍了如何使用C++实现获取CPU,主板,磁盘,BIOS信息等硬件信息,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录方法获取CPU信息:读取"/proc/cpuinfo"文件获取磁盘信息:读取"/proc/diskstats"文

Linux内核参数配置与验证详细指南

《Linux内核参数配置与验证详细指南》在Linux系统运维和性能优化中,内核参数(sysctl)的配置至关重要,本文主要来聊聊如何配置与验证这些Linux内核参数,希望对大家有一定的帮助... 目录1. 引言2. 内核参数的作用3. 如何设置内核参数3.1 临时设置(重启失效)3.2 永久设置(重启仍生效

kali linux 无法登录root的问题及解决方法

《kalilinux无法登录root的问题及解决方法》:本文主要介绍kalilinux无法登录root的问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,... 目录kali linux 无法登录root1、问题描述1.1、本地登录root1.2、ssh远程登录root2、

Linux ls命令操作详解

《Linuxls命令操作详解》通过ls命令,我们可以查看指定目录下的文件和子目录,并结合不同的选项获取详细的文件信息,如权限、大小、修改时间等,:本文主要介绍Linuxls命令详解,需要的朋友可... 目录1. 命令简介2. 命令的基本语法和用法2.1 语法格式2.2 使用示例2.2.1 列出当前目录下的文

Spring Boot项目部署命令java -jar的各种参数及作用详解

《SpringBoot项目部署命令java-jar的各种参数及作用详解》:本文主要介绍SpringBoot项目部署命令java-jar的各种参数及作用的相关资料,包括设置内存大小、垃圾回收... 目录前言一、基础命令结构二、常见的 Java 命令参数1. 设置内存大小2. 配置垃圾回收器3. 配置线程栈大小