bzero memset置零的性能比较

2024-03-17 11:08
文章标签 比较 性能 memset bzero

本文主要是介绍bzero memset置零的性能比较,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 关于字符数组的初始化,在项目的压力测试中,发现性能明显下降,变怀疑在程序中的若干临时字符数组的初始化(使用bzero)身上。于是修改为首个字符置 零的方式而非全部置零的方式初始化,响应得到明显的提升。原来在mp3检索的每一条结果都要进行bzero对临时数组初始化,每一个请求需要30次的 bzero对临时数组的置零。于是想到了,在非必要的情况下,只对临时数组的第一个(或前几个)字符置零的初始化方式对比与使用bzero的话,能够明显 提高性能。

在此之外,又想起另外两种对数组所有字节都置零的方式,顺便比较一下他们之间的性能,写个简单的程序如下:

#include <stdio.h>
#include <sys/time.h>
#include <string.h>

#define TIMEDIFF(s, e) (((e.tv_sec)-(s.tv_sec))*1000000 + (e.tv_usec) - (s.tv_usec))

int main()
{
    struct timeval s, e;
    char a[1024], b[1024*1024], c[1024*1024*4];

    gettimeofday(&s, NULL);
    bzero(a, sizeof(a));
    gettimeofday(&e, NULL);
    printf("bzero 1k: %d/n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    bzero(b, sizeof(b));
    gettimeofday(&e, NULL);
    printf("bzero 1m: %d/n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    bzero(c, sizeof(c));
    gettimeofday(&e, NULL);
    printf("bzero 4M: %d/n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    memset(a, 0, sizeof(a));
    gettimeofday(&e, NULL);
    printf("memset 1k: %d/n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    memset(b, 0, sizeof(b));
    gettimeofday(&e, NULL);
    printf("memset 1M: %d/n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    memset(c, 0, sizeof(c));
    gettimeofday(&e, NULL);
    printf("memset 4M: %d/n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    for(int i=0; i<sizeof(a); ++i)
        a[i]=0;
    gettimeofday(&e, NULL);
    printf("for 1k: %d/n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    for(int i=0; i<sizeof(b); ++i)
        b[i]=0;
    gettimeofday(&e, NULL);
    printf("for 1M: %d/n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    memset(c, 0, sizeof(c));
    gettimeofday(&e, NULL);
    printf("memset 4M: %d/n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    for(int i=0; i<sizeof(a); ++i)
        a[i]=0;
    gettimeofday(&e, NULL);
    printf("for 1k: %d/n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    for(int i=0; i<sizeof(b); ++i)
        b[i]=0;
    gettimeofday(&e, NULL);
    printf("for 1M: %d/n", TIMEDIFF(s, e));

    gettimeofday(&s, NULL);
    for(int i=0; i<sizeof(c); ++i)
        c[i]=0;
    gettimeofday(&e, NULL);
    printf("for 4M: %d/n", TIMEDIFF(s, e));
}

运行的结果基本上是,在数组较小的情况下,bzero的效率比memset高;当数组超过一定大小之后,bzero的效率开始比memset低;数组越 大,memset的性能优势越明显。而在数组较小的情况下,memset的性能甚至不如直接for循环对数组中的每一个字节置零的方法。

以下的运行结果的数值单位是微秒(gettimeofday的默认单位)。

第一次运行:
bzero 1k: 6
bzero 1m: 2168
bzero 4M: 9136
memset 1k: 11
memset 1M: 1303
memset 4M: 5483
for 1k: 12
for 1M: 4934
for 4M: 21313

再一次运行:
bzero 1k: 6
bzero 1m: 2160
bzero 4M: 9067
memset 1k: 17
memset 1M: 1257
memset 4M: 5115
for 1k: 11
for 1M: 4866
for 4M: 19201

此后,又写了个小程序,测试在堆上的数组中,bzero和memset的效率,发现两者差不多。可能由于,里面原来的数据就比较有规则,不管是否先对数组置一随机值。(malloc开辟字符数组空间时,会清零的。)

#include <stdio.h>
#include <string.h>
#include <sys/time.h>
#include <stdlib.h>
#include <time.h>

#define TIMEDIFF(s, e) (((e.tv_sec)-(s.tv_sec))*1000000 + (e.tv_usec) - (s.tv_usec))

int main()
{
    srand(time(NULL));
    char *array;
    struct timeval s, e;
    int tb, tm;
    for(int i=1; i<1024*1024*1024; i*=2)
    {
        array=(char*)malloc(i);
        memset(array, rand()%256, i);
        gettimeofday(&s, NULL);
        bzero(array, i);
        gettimeofday(&e, NULL);
        tb=TIMEDIFF(s, e);
        free(array);

        array=(char*)malloc(i);
        memset(array, rand()%256, i);
        gettimeofday(&s, NULL);
        memset(array, 0, i);
        gettimeofday(&e, NULL);
        tm=TIMEDIFF(s, e);
        free(array);

        printf("array size: %d /tbzero time: %d /tmemset time: %d /tbzero>memset?: %d/n", i, tb, tm, (tb>tm));

    }
}


运行结果:
array size: 1   bzero time: 28 memset time: 1 bzero>memset?: 1
array size: 2   bzero time: 1   memset time: 1 bzero>memset?: 0
array size: 4   bzero time: 1   memset time: 1 bzero>memset?: 0
array size: 8   bzero time: 1   memset time: 1 bzero>memset?: 0
array size: 16 bzero time: 1   memset time: 1 bzero>memset?: 0
array size: 32 bzero time: 1   memset time: 1 bzero>memset?: 0
array size: 64 bzero time: 1   memset time: 0 bzero>memset?: 1
array size: 128         bzero time: 1   memset time: 1 bzero>memset?: 0
array size: 256         bzero time: 1   memset time: 1 bzero>memset?: 0
array size: 512         bzero time: 1   memset time: 1 bzero>memset?: 0
array size: 1024        bzero time: 1   memset time: 1 bzero>memset?: 0
array size: 2048        bzero time: 1   memset time: 1 bzero>memset?: 0
array size: 4096        bzero time: 2   memset time: 2 bzero>memset?: 0
array size: 8192        bzero time: 2   memset time: 2 bzero>memset?: 0
array size: 16384       bzero time: 5   memset time: 6 bzero>memset?: 0
array size: 32768       bzero time: 9   memset time: 8 bzero>memset?: 1
array size: 65536       bzero time: 27 memset time: 24         bzero>memset?: 1
array size: 131072      bzero time: 81 memset time: 68         bzero>memset?: 1
array size: 262144      bzero time: 190         memset time: 169        bzero>memset?: 1
array size: 524288      bzero time: 447         memset time: 393        bzero>memset?: 1
array size: 1048576     bzero time: 996         memset time: 973        bzero>memset?: 1
array size: 2097152     bzero time: 2258        memset time: 2272       bzero>memset?: 0
array size: 4194304     bzero time: 4821        memset time: 4799       bzero>memset?: 1
array size: 8388608     bzero time: 9797        memset time: 9799       bzero>memset?: 0
array size: 16777216    bzero time: 19764       memset time: 19737      bzero>memset?: 1
array size: 33554432    bzero time: 39687       memset time: 39675      bzero>memset?: 1
array size: 67108864    bzero time: 79907       memset time: 79324      bzero>memset?: 1
array size: 134217728   bzero time: 158956      memset time: 158775     bzero>memset?: 1
array size: 268435456   bzero time: 318247      memset time: 318632     bzero>memset?: 0
array size: 536870912   bzero time: 638536      memset time: 638883     bzero>memset?: 0

这篇关于bzero memset置零的性能比较的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/818768

相关文章

Python中4大日志记录库比较的终极PK

《Python中4大日志记录库比较的终极PK》日志记录框架是一种工具,可帮助您标准化应用程序中的日志记录过程,:本文主要介绍Python中4大日志记录库比较的相关资料,文中通过代码介绍的非常详细,... 目录一、logging库1、优点2、缺点二、LogAid库三、Loguru库四、Structlogphp

C++,C#,Rust,Go,Java,Python,JavaScript的性能对比全面讲解

《C++,C#,Rust,Go,Java,Python,JavaScript的性能对比全面讲解》:本文主要介绍C++,C#,Rust,Go,Java,Python,JavaScript性能对比全面... 目录编程语言性能对比、核心优势与最佳使用场景性能对比表格C++C#RustGoJavapythonjav

CPython与PyPy解释器架构的性能测试结果对比

《CPython与PyPy解释器架构的性能测试结果对比》Python解释器的选择对应用程序性能有着决定性影响,CPython以其稳定性和丰富的生态系统著称;而PyPy作为基于JIT(即时编译)技术的替... 目录引言python解释器架构概述CPython架构解析PyPy架构解析架构对比可视化性能基准测试测

Java JAR 启动内存参数配置指南(从基础设置到性能优化)

《JavaJAR启动内存参数配置指南(从基础设置到性能优化)》在启动Java可执行JAR文件时,合理配置JVM内存参数是保障应用稳定性和性能的关键,本文将系统讲解如何通过命令行参数、环境变量等方式... 目录一、核心内存参数详解1.1 堆内存配置1.2 元空间配置(MetASPace)1.3 线程栈配置1.

Docker多阶段镜像构建与缓存利用性能优化实践指南

《Docker多阶段镜像构建与缓存利用性能优化实践指南》这篇文章将从原理层面深入解析Docker多阶段构建与缓存机制,结合实际项目示例,说明如何有效利用构建缓存,组织镜像层次,最大化提升构建速度并减少... 目录一、技术背景与应用场景二、核心原理深入分析三、关键 dockerfile 解读3.1 Docke

JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法

《JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法》:本文主要介绍JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法,每种方法结合实例代码给大家介绍的非常... 目录引言:为什么"相等"判断如此重要?方法1:使用some()+includes()(适合小数组)方法2

从原理到实战解析Java Stream 的并行流性能优化

《从原理到实战解析JavaStream的并行流性能优化》本文给大家介绍JavaStream的并行流性能优化:从原理到实战的全攻略,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的... 目录一、并行流的核心原理与适用场景二、性能优化的核心策略1. 合理设置并行度:打破默认阈值2. 避免装箱

深度剖析SpringBoot日志性能提升的原因与解决

《深度剖析SpringBoot日志性能提升的原因与解决》日志记录本该是辅助工具,却为何成了性能瓶颈,SpringBoot如何用代码彻底破解日志导致的高延迟问题,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言第一章:日志性能陷阱的底层原理1.1 日志级别的“双刃剑”效应1.2 同步日志的“吞吐量杀手”

Python如何实现高效的文件/目录比较

《Python如何实现高效的文件/目录比较》在系统维护、数据同步或版本控制场景中,我们经常需要比较两个目录的差异,本文将分享一下如何用Python实现高效的文件/目录比较,并灵活处理排除规则,希望对大... 目录案例一:基础目录比较与排除实现案例二:高性能大文件比较案例三:跨平台路径处理案例四:可视化差异报

Java慢查询排查与性能调优完整实战指南

《Java慢查询排查与性能调优完整实战指南》Java调优是一个广泛的话题,它涵盖了代码优化、内存管理、并发处理等多个方面,:本文主要介绍Java慢查询排查与性能调优的相关资料,文中通过代码介绍的非... 目录1. 事故全景:从告警到定位1.1 事故时间线1.2 关键指标异常1.3 排查工具链2. 深度剖析: