C++20 闩与屏障

2024-06-04 15:44
文章标签 c++ 20 屏障

本文主要是介绍C++20 闩与屏障,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

C++20 闩与屏障

闩 (latch) 与屏障 (barrier) 是线程协调机制,允许任何数量的线程阻塞直至期待数量的线程到达。闩不能重复使用,而屏障则可以。

  • std::latch:单次使用的线程屏障
  • std::barrier:可复用的线程屏障

它们定义在标头 <latch><barrier>

与信号量类似,屏障也是一种古老而广泛应用的同步机制。许多系统 API 提供了对屏障机制的支持,例如 POSIX 和 Win32。此外,OpenMP 也提供了屏障机制来支持多线程编程。

std::latch

“闩”,这个字其实个人觉得是不常见,“门闩” 是指门背后用来关门的棍子。好了好了,不用在意,在 C++ 中就是先前说的:单次使用的线程屏障

latch 类维护着一个 std::ptrdiff_t 类型的计数1,且只能减少计数,无法增加计数。在创建对象的时候初始化计数器的值。线程可以阻塞,直到 latch 对象的计数减少到零。由于无法增加计数,这使得 latch 成为一种单次使用的屏障

std::latch work_start{ 3 };void work(){std::cout << "等待其它线程执行\n";work_start.wait(); // 等待计数为 0std::cout << "任务开始执行\n";
}int main(){std::jthread thread{ work };std::this_thread::sleep_for(3s);std::cout << "休眠结束\n";work_start.count_down();  // 默认值是 1 减少计数 1work_start.count_down(2); // 传递参数 2 减少计数 2
}

运行结果

等待其它线程执行
休眠结束
任务开始执行

在这个例子中,通过调用 wait 函数阻塞子线程,直到主线程调用 count_down 函数原子地将计数减至 0,从而解除阻塞。这个例子清楚地展示了 latch 的使用,其逻辑比信号量更简单。


由于 latch 的计数不可增加,它的使用通常非常简单,可以用来划分任务执行的工作区间。例如:

std::latch latch{ 10 };void f(int id) {//todo.. 脑补任务std::this_thread::sleep_for(1s);std::cout << std::format("线程 {} 执行完任务,开始等待其它线程执行到此处\n", id);latch.arrive_and_wait();std::cout << std::format("线程 {} 彻底退出函数\n", id);
}int main() {std::vector<std::jthread> threads;for (int i = 0; i < 10; ++i) {threads.emplace_back(f,i);}
}

运行测试。

arrive_and_wait 函数等价于:count_down(n); wait();。也就是减少计数 + 等待。这意味着

必须等待所有线程执行到 latch.arrive_and_wait(); 将 latch 的计数减少至 0 才能继续往下执行。这个示例非常直观地展示了如何使用 latch 来划分任务执行的工作区间。

由于 latch 的功能受限,通常用于简单直接的需求,不少情况很多同步设施都能完成你的需求,在这个时候请考虑使用尽可能功能最少的那一个

  • 使用功能尽可能少的设施有助于开发者阅读代码理解含义。如果使用的是一个功能丰富的设施,可能就无法直接猜测其意图。

std::barrier

上节我们学习了 std::latch ,本节内容也不会对你构成难度。

std::barrierstd::latch 最大的不同是,前者可以在阶段完成之后将计数重置为构造时传递的值,而后者只能减少计数。我们用一个非常简单直观的示例为你展示:

std::barrier barrier{ 10,[n = 1]()mutable noexcept {std::cout << "\t第" << n++ << "轮结束\n"; }
};void f(int start, int end){for (int i = start; i <= end; ++i) {std::osyncstream{ std::cout } << i << ' '; barrier.arrive_and_wait(); // 减少计数并等待 解除阻塞时就重置计数并调用函数对象std::this_thread::sleep_for(300ms);}
}int main(){std::vector<std::jthread> threads;for (int i = 0; i < 10; ++i) {threads.emplace_back(f, i * 10 + 1, (i + 1) * 10);}
}

可能的运行结果

1 21 11 31 41 51 61 71 81 91    第1轮结束
12 2 22 32 42 52 62 72 92 82    第2轮结束
13 63 73 33 23 53 83 93 43 3    第3轮结束
14 44 24 34 94 74 64 4 84 54    第4轮结束
5 95 15 45 75 25 55 65 35 85    第5轮结束
6 46 16 26 56 96 86 66 76 36    第6轮结束
47 17 57 97 87 67 77 7 27 37    第7轮结束
38 8 28 78 68 88 98 58 18 48    第8轮结束
9 39 29 69 89 99 59 19 79 49    第9轮结束
30 40 70 10 90 50 60 20 80 100  第10轮结束

注意输出的规律,第一轮每个数字最后一位都是 1,第二轮每个数字最后一位都是 2……以此类推,因为我们分配给每个线程的输出任务就是如此,然后利用了屏障一轮一轮地打印。

arrive_and_wait 等价于 wait(arrive());。原子地将期待计数减少 1,然后在当前阶段的同步点阻塞直至运行当前阶段的阶段完成步骤。

arrive_and_wait() 会在期待计数减少至 0 时调用我们构造 barrier 对象时传入的 lambda 表达式,并解除所有在阶段同步点上阻塞的线程。之后重置期待计数为构造中指定的值。屏障的一个阶段就完成了。

  • 并发调用barrier 除了析构函数外的成员函数不会引起数据竞争。

另外你可能注意到我们使用了 std::osyncstream ,它是 C++20 引入的,此处是确保输出流在多线程环境中同步,免除数据竞争,而且将不以任何方式穿插或截断

虽然 std::coutoperator<< 调用是线程安全的,不会被打断,但多个 operator<< 的调用在多线程环境中可能会交错,导致输出结果混乱,使用 std::osyncstream 就可以解决这个问题。开发者可以尝试去除 std::osyncstream 直接使用 std::cout,效果会非常明显。


使用 arrivearrive_and_wait 减少的都是当前屏障计数,我们称作“期待计数”。不管如何减少计数,当完成一个阶段,就重置期待计数为构造中指定的值了。

标准库还提供一个函数 arrive_and_drop 可以改变重置的计数值:它将所有后继阶段的初始期待计数减少一,当前阶段的期待计数也减少一

不用感到难以理解,我们来解释一下这个概念:

std::barrier barrier{ 4 }; // 初始化计数为 4 完成阶段重置计数也是 4
barrier.arrive_and_wait(); // 当前计数减 1,不影响之后重置计数 4
barrier.arrive_and_drop(); // 当前计数与重置之后的计数均减 1 完成阶段会重置计数为 3

arrive_and_drop 可以用来控制在需要的时候,让一些线程退出同步,如:

std::atomic_int active_threads{ 4 };
std::barrier barrier{ 4,[n = 1]() mutable noexcept {std::cout << "\t第" << n++ << "轮结束,活跃线程数: " << active_threads << '\n';}
};void f(int thread_id){for (int i = 0; i < 5; ++i) {std::osyncstream{ std::cout } << "线程 " << thread_id << " 输出: " << i << '\n';if (i == 2 && thread_id == 2) {  // 假设线程ID为2的线程在输出完2后退出std::osyncstream{ std::cout } << "线程 " << thread_id << " 完成并退出\n";--active_threads; // 减少活跃线程数barrier.arrive_and_drop(); // 减少当前计数 1,并减少重置计数 1return;}barrier.arrive_and_wait(); // 减少计数并等待,解除阻塞时重置计数并调用函数对象}
}int main(){std::vector<std::jthread> threads;for (int i = 1; i <= 4; ++i) {threads.emplace_back(f, i);}
}

运行测试。

初始线程有 4 个,线程 2 在执行了两轮同步之后便直接退出了,调用 arrive_and_drop 函数,下一个阶段的计数会重置为 3,也就是只有三个活跃线程继续执行。查看输出结果,非常的直观。

这样,arrive_and_drop 的作用就非常明显了,使用也十分的简单。


  1. 注:通常的实现是直接保有一个 std::atomic<std::ptrdiff_t> 私有数据成员,以保证计数修改的原子性。原子类型在我们第五章的内容会详细展开。 ↩︎

这篇关于C++20 闩与屏障的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1030463

相关文章

C++中unordered_set哈希集合的实现

《C++中unordered_set哈希集合的实现》std::unordered_set是C++标准库中的无序关联容器,基于哈希表实现,具有元素唯一性和无序性特点,本文就来详细的介绍一下unorder... 目录一、概述二、头文件与命名空间三、常用方法与示例1. 构造与析构2. 迭代器与遍历3. 容量相关4

C++中悬垂引用(Dangling Reference) 的实现

《C++中悬垂引用(DanglingReference)的实现》C++中的悬垂引用指引用绑定的对象被销毁后引用仍存在的情况,会导致访问无效内存,下面就来详细的介绍一下产生的原因以及如何避免,感兴趣... 目录悬垂引用的产生原因1. 引用绑定到局部变量,变量超出作用域后销毁2. 引用绑定到动态分配的对象,对象

C++读写word文档(.docx)DuckX库的使用详解

《C++读写word文档(.docx)DuckX库的使用详解》DuckX是C++库,用于创建/编辑.docx文件,支持读取文档、添加段落/片段、编辑表格,解决中文乱码需更改编码方案,进阶功能含文本替换... 目录一、基本用法1. 读取文档3. 添加段落4. 添加片段3. 编辑表格二、进阶用法1. 文本替换2

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

C++右移运算符的一个小坑及解决

《C++右移运算符的一个小坑及解决》文章指出右移运算符处理负数时左侧补1导致死循环,与除法行为不同,强调需注意补码机制以正确统计二进制1的个数... 目录我遇到了这么一个www.chinasem.cn函数由此可以看到也很好理解总结我遇到了这么一个函数template<typename T>unsigned

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法

深入解析C++ 中std::map内存管理

《深入解析C++中std::map内存管理》文章详解C++std::map内存管理,指出clear()仅删除元素可能不释放底层内存,建议用swap()与空map交换以彻底释放,针对指针类型需手动de... 目录1️、基本清空std::map2️、使用 swap 彻底释放内存3️、map 中存储指针类型的对象

C++ STL-string类底层实现过程

《C++STL-string类底层实现过程》本文实现了一个简易的string类,涵盖动态数组存储、深拷贝机制、迭代器支持、容量调整、字符串修改、运算符重载等功能,模拟标准string核心特性,重点强... 目录实现框架一、默认成员函数1.默认构造函数2.构造函数3.拷贝构造函数(重点)4.赋值运算符重载函数

C++ vector越界问题的完整解决方案

《C++vector越界问题的完整解决方案》在C++开发中,std::vector作为最常用的动态数组容器,其便捷性与性能优势使其成为处理可变长度数据的首选,然而,数组越界访问始终是威胁程序稳定性的... 目录引言一、vector越界的底层原理与危害1.1 越界访问的本质原因1.2 越界访问的实际危害二、基

c++日志库log4cplus快速入门小结

《c++日志库log4cplus快速入门小结》文章浏览阅读1.1w次,点赞9次,收藏44次。本文介绍Log4cplus,一种适用于C++的线程安全日志记录API,提供灵活的日志管理和配置控制。文章涵盖... 目录简介日志等级配置文件使用关于初始化使用示例总结参考资料简介log4j 用于Java,log4c