1.1.1.多线程的发展--对cpu性能的压榨史

2023-12-10 15:44

本文主要是介绍1.1.1.多线程的发展--对cpu性能的压榨史,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一.压榨历史

1.单进程人工切换。纸带机。只能解决简单的数学问题。

2.单道批处理。多进程批处理。多个任务批量执行。解决手动操作时需要人工切换作业导致的系统利用率低的问题

3.多进程并行处理。把程序写在不同的内存位置来回切换。当一个作业在等待I/O处理时,多批处理系统会通过相应调度算法调度另外一个作业让计算机执行

4.多线程。一个程序内部不同任务的来回切换。实现进程中任务的切换,又可以避免进程切换内存地址空间(将计算机实际调度的单元转到线程)。

5.纤程/协程与管程

二.相关含义介绍

什么是程序?什么是进程?什么是进程?什么是纤程/协程、管程?

1.程序-->抽象概念

操作系统可以执行的一个计算机文件。是一组计算机能识别和执行的指令序列。如QQ.exe

2.进程-->静态概念

进程是程序计算机(内存)中的一次运行活动。更通俗一点来说:进程是程序的实例化(类似于程序是class,进程是class的对象)。

进程是系统进行资源分配的基本单位,进程是线程的容器。

3.线程-->动态概念

一条线程指的是进程中一个单一顺序的执行路线(也可以说是执行流、控制流)。即进程中的实际运行单位。

资源调度的基本单位。

4.线程上下文

线程上下文是指某一时间点 CPU 寄存器和程序计数器的内容。

4.1.使用场景

上下文切换 (context switch) 。即任务切换, 或者CPU寄存器切换。

当多任务内核决定运行另外的任务时, 它保存正在运行任务的当前状态, 也就是CPU寄存器中的全部内容。这些内容被保存在任务自己的堆栈中, 入栈工作完成后就把下一个将要运行的任务的当前状况从该任务的栈中重新装入CPU寄存器, 并开始下一个任务的运行, 这一过程就是context switch。

4.2.上下文切换带来的问题

程序执行效率与线程并发数,从正相关变为负相关;

三.思考问题

1.单核的CPU设定多线程是否有意义?

其实个人的观点是,需要分析多线程的本质-->是对cpu性能的压榨。

那么,如果说单线程已经达到非常好的cpu利用率,则使用多线程意义不是太大。这种作业就称为cpu密集型(性能瓶颈是CPU运算)。

相对的,将性能瓶颈是IO(网络通信、硬盘读写、阻塞等待等)的作业称为io密集型。因为这种作业会造成cpu空闲,而使用多线程可显著减少此情况。

2.工作线程数是不是设置得越大越好?

a.先看一个示例:
package com.pavin.thread;
​
import java.text.DecimalFormat;
import java.util.Random;
import java.util.concurrent.CountDownLatch;
​
public class multiThread_01 {
​private static double[] nums = new double[1_0000_0000];private static Random r = new Random();private static DecimalFormat df = new DecimalFormat("0.00");static {for (int j = 0; j < nums.length; j++) {nums[j] = r.nextDouble();}}
​private static void singleThread() {long start = System.currentTimeMillis();
​double result = 0.0;for (int j = 0; j < nums.length; j++) {result += nums[j];}
​long end = System.currentTimeMillis();System.out.println("1   " + " singleThread: cost " + (end-start) + "ms result: " + df.format(result));}
​static double result1 = 0.0, result2 = 0.0, result3 = 0.0;private static void twoThreads() throws InterruptedException {
​Thread t1 = new Thread(() -> {for (int j = 0; j < nums.length / 2; j++) {result1 += nums[j];}});
​Thread t2 = new Thread(() -> {for (int j = nums.length / 2; j < nums.length; j++) {result2 += nums[j];}});
​long start = System.currentTimeMillis();t1.start();t2.start();t1.join();t2.join();
​result3 = result1 + result2;long end = System.currentTimeMillis();System.out.println("2   " + " Threads: cost " + (end-start) + "ms result: " + df.format(result3));}
​private static void multiThreads(int threadCount) throws InterruptedException {
​Thread[] threads = new Thread[threadCount];double[] results = new double[threadCount];final int segmentCount = nums.length / threadCount;CountDownLatch latch = new CountDownLatch(threadCount);
​for (int i = 0; i < threadCount; i++) {int m = i;
​threads[i] = new Thread(() -> {for (int j = m * segmentCount; j < (m+1) * segmentCount && j < nums.length; j++) {results[m] += nums[j];}});
​latch.countDown();}
​double result = 0.0;long start = System.currentTimeMillis();for (Thread t : threads) {t.start();}
​latch.await();for (double v : results) {result += v;}
​long end = System.currentTimeMillis();System.out.println(threadCount + " Threads: cost " + (end-start) + "ms result: " + df.format(result));}
​public static void main(String[] args) throws InterruptedException {singleThread();twoThreads();
​multiThreads(10000);}
}

输出结果:

1    singleThread: cost 134ms result: 49997084.08
2    Threads: cost 78ms result: 49997084.08
10000 Threads: cost 1012ms result: 49997084.08

由此可见,使用两个线程时明显比一个线程更快,但是使用10000个线程时,非常慢。所以线程并不是越大越好。

b.造成效率下降的原因

见线程上下文

3.工作线程数(线程池中的线程数量)设置为多少合适?

公式+压测

a.公式

CPU密集型:理论上线程的数量=CPU核数最合适。

不过实际中一般会设为CPU核数+1。此时当线程因为偶尔的内存页失效或其他原因导致阻塞时,这个额外的线程可以顶上,从而保证CPU的利用率

IO密集型 :线程数 = CPU核心数 * 目标CPU利用率 *(1+平均等待时间/平均工作时间)

b.实际中的问题
i.环境开销

比如一个普通的SpringBoot 为基础的业务系统,默认Tomcat容器+HikariCP连接池+G1回收器。

Tomcat有自己的线程池,HikariCP也有自己的后台线程,JVM也有一些编译的线程,连G1都有自己的后台线程。这些线程也是运行在当前进程、当前主机上的,也会占用CPU的资源。

ii.测算"平均等待时间"、“平均工作时间”

方法1,通过日志和统计的方式得出。

方法2,第三方工具:profiler/Jprofiler

c.实际策略

一般情况下,内部业务系统相对于性能,更注重稳定好用、符合需求。实际生产推荐的线程数:CPU核心数+1

这篇关于1.1.1.多线程的发展--对cpu性能的压榨史的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/477539

相关文章

Java进程CPU使用率过高排查步骤详细讲解

《Java进程CPU使用率过高排查步骤详细讲解》:本文主要介绍Java进程CPU使用率过高排查的相关资料,针对Java进程CPU使用率高的问题,我们可以遵循以下步骤进行排查和优化,文中通过代码介绍... 目录前言一、初步定位问题1.1 确认进程状态1.2 确定Java进程ID1.3 快速生成线程堆栈二、分析

conda安装GPU版pytorch默认却是cpu版本

《conda安装GPU版pytorch默认却是cpu版本》本文主要介绍了遇到Conda安装PyTorchGPU版本却默认安装CPU的问题,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的... 目录一、问题描述二、网上解决方案罗列【此节为反面方案罗列!!!】三、发现的根本原因[独家]3.1 p

JVisualVM之Java性能监控与调优利器详解

《JVisualVM之Java性能监控与调优利器详解》本文将详细介绍JVisualVM的使用方法,并结合实际案例展示如何利用它进行性能调优,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全... 目录1. JVisualVM简介2. JVisualVM的安装与启动2.1 启动JVisualVM2

Linux CPU飙升排查五步法解读

《LinuxCPU飙升排查五步法解读》:本文主要介绍LinuxCPU飙升排查五步法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录排查思路-五步法1. top命令定位应用进程pid2.php top-Hp[pid]定位应用进程对应的线程tid3. printf"%

Java使用MethodHandle来替代反射,提高性能问题

《Java使用MethodHandle来替代反射,提高性能问题》:本文主要介绍Java使用MethodHandle来替代反射,提高性能问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑... 目录一、认识MethodHandle1、简介2、使用方式3、与反射的区别二、示例1、基本使用2、(重要)

python多线程并发测试过程

《python多线程并发测试过程》:本文主要介绍python多线程并发测试过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、并发与并行?二、同步与异步的概念?三、线程与进程的区别?需求1:多线程执行不同任务需求2:多线程执行相同任务总结一、并发与并行?1、

Python多进程、多线程、协程典型示例解析(最新推荐)

《Python多进程、多线程、协程典型示例解析(最新推荐)》:本文主要介绍Python多进程、多线程、协程典型示例解析(最新推荐),本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定... 目录一、multiprocessing(多进程)1. 模块简介2. 案例详解:并行计算平方和3. 实现逻

PyTorch高级特性与性能优化方式

《PyTorch高级特性与性能优化方式》:本文主要介绍PyTorch高级特性与性能优化方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、自动化机制1.自动微分机制2.动态计算图二、性能优化1.内存管理2.GPU加速3.多GPU训练三、分布式训练1.分布式数据

Java的"伪泛型"变"真泛型"后对性能的影响

《Java的伪泛型变真泛型后对性能的影响》泛型擦除本质上就是擦除与泛型相关的一切信息,例如参数化类型、类型变量等,Javac还将在需要时进行类型检查及强制类型转换,甚至在必要时会合成桥方法,这篇文章主... 目录1、真假泛型2、性能影响泛型存在于Java源代码中,在编译为字节码文件之前都会进行泛型擦除(ty

判断PyTorch是GPU版还是CPU版的方法小结

《判断PyTorch是GPU版还是CPU版的方法小结》PyTorch作为当前最流行的深度学习框架之一,支持在CPU和GPU(NVIDIACUDA)上运行,所以对于深度学习开发者来说,正确识别PyTor... 目录前言为什么需要区分GPU和CPU版本?性能差异硬件要求如何检查PyTorch版本?方法1:使用命