跟我学C++中级篇——内存屏障内存栅栏和编译器屏障以及相关

2024-05-26 10:12

本文主要是介绍跟我学C++中级篇——内存屏障内存栅栏和编译器屏障以及相关,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、低级同步常见的技术术语

在一些操作系统或者计算机接口等比较原理化的书籍中,经常提到一些低级的同步术语,或者说一些同步的抽象的说法。最典型的就是内存内存屏障。不同的平台和语言有不同的叫法,有的叫内存栅栏或者屏障指令。它的主要作用就是多线程环境下内存访问的顺序性和可见性即实现在某点的中行化操作。
内存屏障有两大类,一般是内存屏障(或者叫CPU屏障)和编译器屏障。
1、CPU内存屏障
这种屏障一般是在CPU运行时防止指令乱序执行的,还记得前面讲过的happen-before吧,不同层次的处理机制而已。CPU内存屏障的另外一个功能是保证数据的可见性。它的意思就是每一次值的改动,都可以保证被所有相关者看到。这种指令一般都涉及到了机器指令,对上层开发者来说,就是汇编指令,常见的有:
mb() 和 smp_mb():用来保证读写有序
wmb() 和 smp_wmb():写有序
rmb() 和 smp_rmb():读有序

2、编译器屏障
编译器屏障就好理解了,就是对编译器的一种约束,让编译器按要求编译。比如在gcc中有一个定义:

#define barrier() __asm__ __volatile__("": : :"memory")

既然按顺序,就涉及到了前面分析的memory_order,可以结合一起学习。

二、不同平台的应用

内存屏障的应用其实主要和硬件的设计有关系。在CPU的设计中,为了提高读写速度,设计了一大把的缓存机制和指令流水,而缓存机制的出现,特别是多级缓存机制的出现,导致了读写操作的复杂性以及数据一致性和完整性的难度。为了解决这些问题,CPU使用写传播和MESI协议(前面的DPDK中也提到过),目的当然是为了实现数据的安全。其实简单的理解就是在某个阶段实现串行化,而串行化,就保障了数据的安全性。
同样,指令流水也会引起一些优化导致指令重排,大家可以看看相关的书籍和资料。
而在开发过程,代码的编写和编译器对指令的翻译以及内存加载后对指令的处理,并非完全一致。这涉及到编译器和CPU对指令优化执行的一个复杂的过程。或者可以这样理解,房屋的设计图纸,在真正实现时,会在各种规章制度下允许的相关优化的再处理,如原设计的布线不安全不免节省材料,水暖走线交叉等等。但这也带来一个问题,在绝大多数情况下,这是一种好的事情。但在某些情况下,可能会导致一些异常的事情发生,比如CAS的ABA问题。
那么解决问题的一种重要方式就是使用内存屏障,告诉编译器,此处代码不需要优化,照方抓药即可。CAS由于不释放CPU一直在循环等待,所以有的老的版本的资料也把它叫做自旋锁。所以说,它叫无锁编程只是一种叫法,在这方面不要纠结。
在不同的语言中根据这种要求,设计出来了各种锁的机制,原理基本都是一致的,可能细节实现上略有不同,只需要看一下,一般都会明白。

三、例程

c++11中提供了一种内存栅栏的同步机制:

// 全局
std::string computation(int);
void print(std::string);std::atomic<int> arr[3] = {-1, -1, -1};
std::string data[1000] // 非原子数据// 线程 A,计算 3 个值
void ThreadA( int v0, int v1, int v2 )
{
//  assert(0 <= v0, v1, v2 < 1000);data[v0] = computation(v0);data[v1] = computation(v1);data[v2] = computation(v2);std::atomic_thread_fence(std::memory_order_release);std::atomic_store_explicit(&arr[0], v0, std::memory_order_relaxed);std::atomic_store_explicit(&arr[1], v1, std::memory_order_relaxed);std::atomic_store_explicit(&arr[2], v2, std::memory_order_relaxed);
}// 线程 B,打印已经计算的 0 与 3 之间的值。
void ThreadB()
{int v0 = std::atomic_load_explicit(&arr[0], std::memory_order_relaxed);int v1 = std::atomic_load_explicit(&arr[1], std::memory_order_relaxed);int v2 = std::atomic_load_explicit(&arr[2], std::memory_order_relaxed);std::atomic_thread_fence(std::memory_order_acquire);
//  v0、v1、v2 可能全部或部分结果为 -1。
//  其他情况下读取非原子数据是安全的,因为栅栏:if (v0 != -1)print(data[v0]);if (v1 != -1)print(data[v1]);if (v2 != -1)print(data[v2]);
}

内存栅栏std::atomic_thread_fence与各种锁及同步机制可以达到相同的目的。但二者的不同在于,前者一般用于在无锁编程中,而后者一般用在有锁编程中。

四、总结

有锁和无锁就如武学上的有剑和无剑,重要的不是剑,是一种对内存原理的根本性的理解。不要对一些技术奉为圭臬,因为每一种技术一定有它的长处和短处。也就是常说的应用场景,只有会灵活运用,才是自由的编程。

这篇关于跟我学C++中级篇——内存屏障内存栅栏和编译器屏障以及相关的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1004174

相关文章

Windows下C++使用SQLitede的操作过程

《Windows下C++使用SQLitede的操作过程》本文介绍了Windows下C++使用SQLite的安装配置、CppSQLite库封装优势、核心功能(如数据库连接、事务管理)、跨平台支持及性能优... 目录Windows下C++使用SQLite1、安装2、代码示例CppSQLite:C++轻松操作SQ

C++中RAII资源获取即初始化

《C++中RAII资源获取即初始化》RAII通过构造/析构自动管理资源生命周期,确保安全释放,本文就来介绍一下C++中的RAII技术及其应用,具有一定的参考价值,感兴趣的可以了解一下... 目录一、核心原理与机制二、标准库中的RAII实现三、自定义RAII类设计原则四、常见应用场景1. 内存管理2. 文件操

C++中零拷贝的多种实现方式

《C++中零拷贝的多种实现方式》本文主要介绍了C++中零拷贝的实现示例,旨在在减少数据在内存中的不必要复制,从而提高程序性能、降低内存使用并减少CPU消耗,零拷贝技术通过多种方式实现,下面就来了解一下... 目录一、C++中零拷贝技术的核心概念二、std::string_view 简介三、std::stri

C++高效内存池实现减少动态分配开销的解决方案

《C++高效内存池实现减少动态分配开销的解决方案》C++动态内存分配存在系统调用开销、碎片化和锁竞争等性能问题,内存池通过预分配、分块管理和缓存复用解决这些问题,下面就来了解一下... 目录一、C++内存分配的性能挑战二、内存池技术的核心原理三、主流内存池实现:TCMalloc与Jemalloc1. TCM

C++ 函数 strftime 和时间格式示例详解

《C++函数strftime和时间格式示例详解》strftime是C/C++标准库中用于格式化日期和时间的函数,定义在ctime头文件中,它将tm结构体中的时间信息转换为指定格式的字符串,是处理... 目录C++ 函数 strftipythonme 详解一、函数原型二、功能描述三、格式字符串说明四、返回值五

CSS3中的字体及相关属性详解

《CSS3中的字体及相关属性详解》:本文主要介绍了CSS3中的字体及相关属性,详细内容请阅读本文,希望能对你有所帮助... 字体网页字体的三个来源:用户机器上安装的字体,放心使用。保存在第三方网站上的字体,例如Typekit和Google,可以link标签链接到你的页面上。保存在你自己Web服务器上的字

C++作用域和标识符查找规则详解

《C++作用域和标识符查找规则详解》在C++中,作用域(Scope)和标识符查找(IdentifierLookup)是理解代码行为的重要概念,本文将详细介绍这些规则,并通过实例来说明它们的工作原理,需... 目录作用域标识符查找规则1. 普通查找(Ordinary Lookup)2. 限定查找(Qualif

Redis过期删除机制与内存淘汰策略的解析指南

《Redis过期删除机制与内存淘汰策略的解析指南》在使用Redis构建缓存系统时,很多开发者只设置了EXPIRE但却忽略了背后Redis的过期删除机制与内存淘汰策略,下面小编就来和大家详细介绍一下... 目录1、简述2、Redis http://www.chinasem.cn的过期删除策略(Key Expir

C/C++ chrono简单使用场景示例详解

《C/C++chrono简单使用场景示例详解》:本文主要介绍C/C++chrono简单使用场景示例详解,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友... 目录chrono使用场景举例1 输出格式化字符串chrono使用场景China编程举例1 输出格式化字符串示

C++/类与对象/默认成员函数@构造函数的用法

《C++/类与对象/默认成员函数@构造函数的用法》:本文主要介绍C++/类与对象/默认成员函数@构造函数的用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录名词概念默认成员函数构造函数概念函数特征显示构造函数隐式构造函数总结名词概念默认构造函数:不用传参就可以