探讨互斥锁锁定非临界区带来多少性能消耗

2024-04-12 02:32

本文主要是介绍探讨互斥锁锁定非临界区带来多少性能消耗,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

概述

本次主要是测试使用互斥锁,锁定非临界区带来的性能消耗。

在我们写代码时,有时候通过逻辑的设计,可以使代码中临界区在80%以上不会同时访问。但是从理论上来说,在极端或者概率很低的情况下它是可能成为临界区的。处于程序的稳定性考虑,同样是需要加锁的。

但是最近在看disruptor文档[1]时,文献提到:

即使不是临界资源,只要调用了锁就会大幅度的降低性能。
而我之前在项目中的代码,总是会考虑逻辑上减少多线程去竞争同一个锁,这难道是在做无用功?

文中采用的是简单的做5亿次++操作,考虑到其是用Java实现的,因此此处采用C来实现,实践来检验一下结果

 

如果有资源竞争,肯定会导致性能下降。因此我们主要对比进入“假临界区"的场景。

 

测试代码:

 

点击(此处)折叠或打开

  1. #include<stdio.h>
  2. #include<time.h>
  3. #include<sys/time.h>
  4. #include<unistd.h>
  5. #include<string.h>
  6.  
  7. #include<pthread.h>
  8.  
  9.  
  10. unsigned long gtimes = 2 * 1000 * 1000 * 1000;
  11. unsigned long i;
  12.  
  13. struct timeval startTime, endTime;
  14.  
  15. pthread_mutex_t gmutex; //ensure not a stack varible;
  16.  
  17. void start_time()
  18. {
  19.     gettimeofday(&startTime, NULL);
  20. }
  21.  
  22. void end_time()
  23. {
  24.     gettimeofday(&endTime, NULL);
  25. }
  26.  
  27. double spend_time()
  28. {
  29.     return 1000 * (endTime.tv_sec - startTime.tv_sec) +
  30.         (endTime.tv_usec - startTime.tv_usec) / 1000.0f;
  31. }
  32.  
  33. void* test_thread(void* argv)
  34. {
  35.     i = gtimes;
  36.  
  37.     start_time();
  38.     while(i--);
  39.     end_time();
  40.  
  41.     printf(" a thread cost time: %.2f ms\n", spend_time());
  42.  
  43.     return NULL;
  44. }
  45.  
  46. void* test_lockthread(void* argv)
  47. {
  48.     i = gtimes;
  49.     pthread_mutex_init(&gmutex,NULL);
  50.  
  51.     start_time();
  52.  
  53.     pthread_mutex_lock(&gmutex);
  54.     while(i--);
  55.     pthread_mutex_unlock(&gmutex);
  56.  
  57.     end_time();
  58.  
  59.     pthread_mutex_destroy(&gmutex);
  60.     printf(" a thread with a pthread_mutex, cost time: %.2f ms\n", spend_time());
  61.  
  62.     return NULL;
  63. }
  64. int main(int argc, char *argv[])
  65. {
  66.     pthread_t pid;
  67.  
  68.     //pthread_create(&pid, NULL, test_thread, NULL);
  69.     pthread_create(&pid, NULL, test_lockthread, NULL);
  70.  
  71.     pthread_join(pid, NULL);
  72.  
  73.     test_thread(NULL);
  74.     test_lockthread(NULL);
  75.  
  76.     return 0;
  77. }


测试结果:

 不加锁加锁效率对比绝对值加锁在不同线程
1990.861007.291.66%16.43987.79
2996.13997.040.09%0.911001.21
3988.47989.190.07%0.72982.72
4993.6992.02-0.16%-1.58986.94
5984.85984.57-0.03%-0.28989.66
6991.59986.75-0.49%-4.84992.94
7986.68986.720.00%0.04983.4
8989.16991.170.20%2.01987.69
9987.221001.311.43%14.09985.03
10986.27984.09-0.22%-2.18987.14

 

从上表可以看出:
如果两个场景在不同的线程中,没有可比性:两者差值不同。
再考虑到进程调度。理论上偏差也比较大

如果是同一个线程中,除了第1和第9组数据,差距都不是很大:
最大偏差<2ms,偏差率<0.5%.
多数偏差<1ms,偏差率<0.1%.

那么另外两组误差在哪里呢?同样是时间片。Linux中时间片是10ms。
在程序中,两个函数是挨着执行的,如果第一个函数执行完成之后,在执行第二个函数的start_time后时间片到期,此时就会多消耗一个时间片。
那么我们将后一个函数减去时间片,则基本上可以在接收的范围内——实际上还会有至少两次线程切换

1990.86997.290.65%6.43987.79
9987.22991.310.41%4.09985.03

 

结论:

C 中的锁即使进入临界区,实际没有发生资源争用,基本上等同于进入非临界区。

但是性能消耗肯定是有的,应该是锁底层实现的首先自旋的时候会识别出来资源可用!

 

[1] disruptor原文地址:https://mechanitis.blogspot.jp/2011/07/dissecting-disruptor-why-its-so-fast.html

http://blog.chinaunix.net/uid-28993794-id-5779757.html

这篇关于探讨互斥锁锁定非临界区带来多少性能消耗的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/895857

相关文章

C++,C#,Rust,Go,Java,Python,JavaScript的性能对比全面讲解

《C++,C#,Rust,Go,Java,Python,JavaScript的性能对比全面讲解》:本文主要介绍C++,C#,Rust,Go,Java,Python,JavaScript性能对比全面... 目录编程语言性能对比、核心优势与最佳使用场景性能对比表格C++C#RustGoJavapythonjav

CPython与PyPy解释器架构的性能测试结果对比

《CPython与PyPy解释器架构的性能测试结果对比》Python解释器的选择对应用程序性能有着决定性影响,CPython以其稳定性和丰富的生态系统著称;而PyPy作为基于JIT(即时编译)技术的替... 目录引言python解释器架构概述CPython架构解析PyPy架构解析架构对比可视化性能基准测试测

Java JAR 启动内存参数配置指南(从基础设置到性能优化)

《JavaJAR启动内存参数配置指南(从基础设置到性能优化)》在启动Java可执行JAR文件时,合理配置JVM内存参数是保障应用稳定性和性能的关键,本文将系统讲解如何通过命令行参数、环境变量等方式... 目录一、核心内存参数详解1.1 堆内存配置1.2 元空间配置(MetASPace)1.3 线程栈配置1.

Docker多阶段镜像构建与缓存利用性能优化实践指南

《Docker多阶段镜像构建与缓存利用性能优化实践指南》这篇文章将从原理层面深入解析Docker多阶段构建与缓存机制,结合实际项目示例,说明如何有效利用构建缓存,组织镜像层次,最大化提升构建速度并减少... 目录一、技术背景与应用场景二、核心原理深入分析三、关键 dockerfile 解读3.1 Docke

从原理到实战解析Java Stream 的并行流性能优化

《从原理到实战解析JavaStream的并行流性能优化》本文给大家介绍JavaStream的并行流性能优化:从原理到实战的全攻略,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的... 目录一、并行流的核心原理与适用场景二、性能优化的核心策略1. 合理设置并行度:打破默认阈值2. 避免装箱

深度剖析SpringBoot日志性能提升的原因与解决

《深度剖析SpringBoot日志性能提升的原因与解决》日志记录本该是辅助工具,却为何成了性能瓶颈,SpringBoot如何用代码彻底破解日志导致的高延迟问题,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言第一章:日志性能陷阱的底层原理1.1 日志级别的“双刃剑”效应1.2 同步日志的“吞吐量杀手”

99%的人都选错了! 路由器WiFi双频合一还是分开好的专业解析与适用场景探讨

《99%的人都选错了!路由器WiFi双频合一还是分开好的专业解析与适用场景探讨》关于双频路由器的“双频合一”与“分开使用”两种模式,用户往往存在诸多疑问,本文将从多个维度深入探讨这两种模式的优缺点,... 在如今“没有WiFi就等于与世隔绝”的时代,越来越多家庭、办公室都开始配置双频无线路由器。但你有没有注

Java慢查询排查与性能调优完整实战指南

《Java慢查询排查与性能调优完整实战指南》Java调优是一个广泛的话题,它涵盖了代码优化、内存管理、并发处理等多个方面,:本文主要介绍Java慢查询排查与性能调优的相关资料,文中通过代码介绍的非... 目录1. 事故全景:从告警到定位1.1 事故时间线1.2 关键指标异常1.3 排查工具链2. 深度剖析:

深入解析Java NIO在高并发场景下的性能优化实践指南

《深入解析JavaNIO在高并发场景下的性能优化实践指南》随着互联网业务不断演进,对高并发、低延时网络服务的需求日益增长,本文将深入解析JavaNIO在高并发场景下的性能优化方法,希望对大家有所帮助... 目录简介一、技术背景与应用场景二、核心原理深入分析2.1 Selector多路复用2.2 Buffer

基于Python Playwright进行前端性能测试的脚本实现

《基于PythonPlaywright进行前端性能测试的脚本实现》在当今Web应用开发中,性能优化是提升用户体验的关键因素之一,本文将介绍如何使用Playwright构建一个自动化性能测试工具,希望... 目录引言工具概述整体架构核心实现解析1. 浏览器初始化2. 性能数据收集3. 资源分析4. 关键性能指