《c++并发编程》中无锁栈的实现为什么要用双引用计数器

2024-04-13 13:12

本文主要是介绍《c++并发编程》中无锁栈的实现为什么要用双引用计数器,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

背景

《c++并发编程》中,实现无锁栈用了引用计数技术。原因是,pop方法要删除栈顶中的节点,然而,由于1.读取栈顶指针->2.根据栈顶指针访问栈顶节点、获取栈顶节点所保存的数据以及下一个节点指针next_node->3.更新栈顶指针为next_node->4.删除栈顶节点这4个 步骤不能做到原子,所以可能出现下面情况,线程A执行完步骤1后,在执行步骤2之前,线程B一口气执行完步骤1-4,把节点删除了,然后线程A执行步骤2,就是一个空悬指针解引用的错误,因为线程A并不知道他要访问的节点,已经被线程B删除了。为了不让这中情况发生,需要使用引用计数技术,每有一个指针指向一个某个对象,这个对象的引用计数就+1。当指向一个对象的指针不再指向它时,它的引用计数就-1。当它的引用计数减少为0时,把他减为0的线程,要负责删除这个节点。所以,只要还有一个指针在指涉一个对象,这个对象就不会被删除。换句话说,就是让线程B知道线程A中有一个指针在指向它所弹出的节点,使得他不执行步骤4。

在《c++并发编程》实现引用计数用了两个计数器,一个计数器在节点内部,成为内部计数器。一个被称为外部计数器的计数器与指针绑定成结构体counted_node_ptr。栈顶指针的类型从原生指针修改为counted_node_ptr。每当有线程通过载入head指针,外部计数器+1。每当线程不再有指涉某个节点的指针,内部计数器-1,内部计数器+外部计数器=节点的实际引用计数,当它为0时,删除节点,数据结构如下图。(上上句话就是我写这篇博客的原因,我花了好长时间才想通为什么要这么做,为什么要搞内外引用计数器,为什么不合并每个计数器,后面我会讲,但现在,先让我把书本的做法介绍完)
在这里插入图片描述
当有线程要弹出数据时,它首先读取head指针(栈顶指针),存到线程局部变量local_head中并让head中的外部计数器+1,这个过程可以做到原子,接着它让local_head的计数器也变为和head中的计数器一样。然后,它通过local_head访问节点。如果它不能弹出节点(判定条件是:local_head与head不相同,也即有其他线程在本线程把head载入到local_head之后,修改了head指针),本线程载入的local_head作废),就把节点的内部计数器-1(本线程马上就不会指向这个节点的指针了)。如果节点的内部计数器因此变为了0(也即他原本为1),则本线程删除这个节点。否则,啥也不做(此时内部计数器可能为负数)。如果它能够弹出数据(判定条件是:old_head仍然与head相同,也即没有其他线程在本线程把head载入到local_head之后,修改head指针),则它把head指针修改为head.ptr->next。注意,判定并修改可以做到原子。然后,local_head的外部计数器-1(因为head指针已经不在指向这个节点),再让local_head的外部计数器-1(因为 local_head也准备不指向这个节点了,实际写代码时,让local_head减2就行,我分开讲是为了说清楚减的2是哪两个1)。然后,把local_head的计数器的值加到内部计数器。如果内部计数器因此变为0,也即他原本为local_head的外部计数器的相反数。则本线程负责把节点删除,否则,不删除节点。

为什么要两个计数器,一个可以吗?

如果一个可以,那考虑这个计数器放再哪里。放在节点内部吗?不行,因为计数器是为了解决空悬指针解引用,如果他放在节点内部,那访问计数器必须先访问节点。考虑下面场景:线程A读取head指针,存到local_head中,还没来得及通过local_head访问节点内部的引用计数器,让他加1,线程B率先访问到了节点引用计数器,让计数器+1。然后弹出节点,退出前,让计数器-1。发现计数器因此变成了0。删除节点。然后线程A才开始通过local_head访问节点内部引用计数器并试图让节点内部计数器+1。但是,节点已经被删除了,又出现了空悬指针解引用。所以,如果一个计数器可行,它只能在节点外面。那放在哪里呢?这个计数器需要让所有线程都能直接访问到(节点不属于所有线程能直接访问到的数据,它只能通过head指针间接访问)。它应该和head指针(所有线程都能直接访问)有相同的地位。参考外部指针,把计数器和head指针合2为1使得读head指针和计数器+1有机会原子进行(否则,读head指针和让计数器+1必定有时间间隙,不可能原子进行,因为他们属于两个不同的变量)。只有一个计数器,那么理论很直观。每有一个指向head节点的指针,就让计数器+1,当指针不再指向这个节点时,让它-1。理想很美好,现实怎么实现呢?
看看下面步骤
线程A载入head 到 local_head(类型为counted_node_ptr)。如果head没有变化,就让head的计数器+1。然后local_head也加1,此时他们head和local_head的计数器都为2。这些步骤都发生在访问节点之前,如果本线程确实要访问local_head指向的节点,由于计数器变为了2,所以节点肯定不会被删除。它之后可以安全地访问local_head指向的节点。但它还没来得及访问,线程B这时候载入head到local_head中,并让head计数器和local_head计数器都变为了3。(它看到head指针为3,就知道,此时除了它自己,还有另一个线程在访问head节点。),它把head指针修改为了head.ptr->next。这时候,head的计数器变为了1,因此此时head指针指向的对象改变了,而那个对象目前只有head指针一个指针在指向它。线程B检查local_head的计数器,让local_head的计数器-2。也即让local_head的计数器变为了1。由于计数器不为0,所以它没有删除节点。它完成了巩工作,pop函数退出。此时线程A安全地访问它的local_head所指向的节点,发现local_head和head已经不一样,所有它放弃弹出这节点。它让local_head的计数器-1,使得local_head的计数器变为了1,由于不为0,所以没有删除节点。这样,这个节点永远都不会被删除了。问题出在哪里呢?计数器应该是节点关联的,它应该存在节点内部,一个节点应该只有一个计数器,但这里,我们无法把计数器放在节点的内部,而放在节点的外部,又需要和head指针拼在一起使得他们读head指针和让计数器+1能够原子进行。这样,就会产生多个计数器,head指针和每个进程各有一个计数器。每个线程让计数器-1,别的进程是不可见的。这就是问题所在。
所以,一个计数器是不行的,除非我们可以让所有的节点有且只有一个计数器,就像shared_ptr那样,可惜,shared_ptr无法做到和读head指针无锁但原子地进行。

双引用计数器的原理是什么

外部计数器:为了线程读读head指针时,知道除了它自己,还有几个线程和自己读取了相同的head。一个线程退出时,如果它修改了head指针它减去自己知道的有2个指针不再指向那个节点,得出一个值x。x就是在它的视角看来,他退出后,还有x个线程在指向这个节点,把这个值加上节点内部计数器,就像是通知这个节点,你的任务已经完成了,但是,由于在我看来,还有x个线程在指向你,除非他们都不再指向你了(内部计数器的值为外部计数器的值的相反数),否则我不能删除你。如果它没有修改head指针,它让节点内部计数器-1,就像告诉节点,我已经不再指向你了,如果你现在没有被其他人引用的话(内部计数器为1),我就删除你,否则,我只是通知你。你后面可以告诉别人我不再引用你了。
内部计数器:有多少个指针在引用自己。但更新滞后,并不是每有一个指针指向它,它就立刻更新。
外部计数器更新及时,但不为所有线程所见,内部计数器为所有线程所见,但更新不及时,他们按照协议相互配合,才能正确工作。

这篇关于《c++并发编程》中无锁栈的实现为什么要用双引用计数器的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/900229

相关文章

基于Python实现温度单位转换器(新手版)

《基于Python实现温度单位转换器(新手版)》这篇文章主要为大家详细介绍了如何基于Python实现温度单位转换器,主要是将摄氏温度(C)和华氏温度(F)相互转换,下面小编就来和大家简单介绍一下吧... 目录为什么选择温度转换器作为第一个项目项目概述所需基础知识实现步骤详解1. 温度转换公式2. 用户输入处

MySQL实现多源复制的示例代码

《MySQL实现多源复制的示例代码》MySQL的多源复制允许一个从服务器从多个主服务器复制数据,这在需要将多个数据源汇聚到一个数据库实例时非常有用,下面就来详细的介绍一下,感兴趣的可以了解一下... 目录一、多源复制原理二、多源复制配置步骤2.1 主服务器配置Master1配置Master2配置2.2 从服

Java实现TXT文件导入功能的详细步骤

《Java实现TXT文件导入功能的详细步骤》在实际开发中,很多应用场景需要将用户上传的TXT文件进行解析,并将文件中的数据导入到数据库或其他存储系统中,本文将演示如何用Java实现一个基本的TXT文件... 目录前言1. 项目需求分析2. 示例文件格式3. 实现步骤3.1. 准备数据库(假设使用 mysql

C#控制台程序同步调用WebApi实现方式

《C#控制台程序同步调用WebApi实现方式》控制台程序作为Job时,需同步调用WebApi以确保获取返回结果后执行后续操作,否则会引发TaskCanceledException异常,同步处理可避免异... 目录同步调用WebApi方法Cls001类里面的写法总结控制台程序一般当作Job使用,有时候需要控制

SpringBoot集成P6Spy的实现示例

《SpringBoot集成P6Spy的实现示例》本文主要介绍了SpringBoot集成P6Spy的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录本节目标P6Spy简介抛出问题集成P6Spy1. SpringBoot三板斧之加入依赖2. 修改

Python实现数据可视化图表生成(适合新手入门)

《Python实现数据可视化图表生成(适合新手入门)》在数据科学和数据分析的新时代,高效、直观的数据可视化工具显得尤为重要,下面:本文主要介绍Python实现数据可视化图表生成的相关资料,文中通过... 目录前言为什么需要数据可视化准备工作基本图表绘制折线图柱状图散点图使用Seaborn创建高级图表箱线图热

Redis分布式锁中Redission底层实现方式

《Redis分布式锁中Redission底层实现方式》Redission基于Redis原子操作和Lua脚本实现分布式锁,通过SETNX命令、看门狗续期、可重入机制及异常处理,确保锁的可靠性和一致性,是... 目录Redis分布式锁中Redission底层实现一、Redission分布式锁的基本使用二、Red

基于Python实现数字限制在指定范围内的五种方式

《基于Python实现数字限制在指定范围内的五种方式》在编程中,数字范围限制是常见需求,无论是游戏开发中的角色属性值、金融计算中的利率调整,还是传感器数据处理中的异常值过滤,都需要将数字控制在合理范围... 目录引言一、基础条件判断法二、数学运算巧解法三、装饰器模式法四、自定义类封装法五、NumPy数组处理

Python中经纬度距离计算的实现方式

《Python中经纬度距离计算的实现方式》文章介绍Python中计算经纬度距离的方法及中国加密坐标系转换工具,主要方法包括geopy(Vincenty/Karney)、Haversine、pyproj... 目录一、基本方法1. 使用geopy库(推荐)2. 手动实现 Haversine 公式3. 使用py

C#异步编程ConfigureAwait的使用小结

《C#异步编程ConfigureAwait的使用小结》本文介绍了异步编程在GUI和服务器端应用的优势,详细的介绍了async和await的关键作用,通过实例解析了在UI线程正确使用await.Conf... 异步编程是并发的一种形式,它有两大好处:对于面向终端用户的GUI程序,提高了响应能力对于服务器端应