(书稿底稿)(C/C++)第一章:CPU基础知识 1.2.3 CORE内核 1.2.4 多核概念

本文主要是介绍(书稿底稿)(C/C++)第一章:CPU基础知识 1.2.3 CORE内核 1.2.4 多核概念,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!



1.2.3    CORE内核

         处理器架构和核心微架构

         上面已经描述了,CPU被分为前端和后端,它们又被多个功能块(function block)组成,如:解码单元(decode unit)、预处理分支单元(branch-prediction unit)、整数单元(integer unit)、加载存储单元(load-store unit),这些单元又有其他小单元组成如复杂整数执行单元(complex integer unit)浮点计算单元(flating-point ALU)。

         微体系架构(microarchitecture)就是上面这些所有的单元组合了一起,也称为内核(core),一般CPU的内核包含了一级缓存L1,我们一般看CPU的概念图就会发现概念图上只会标注core、二级缓存L2以及其他功能单元,一级缓存因为整合到了core中,从而概念图上只标注了core而无L1,但大家不要误认为没有一级缓存,如AMD的概念图图。整个CPU是有内核CORE部分和其他辅助单元组成,就像航母战斗群,以各个航母为核心,每个航母配备一套战舰组成单独航母战斗单位,所有的航母战斗单位组成整个航母战斗群。我们可以将航母战斗群理解成完整的CPU,各个航母对应内核core,其辅助战舰就是其他各个单元。

一级缓存、前端、后端也就是内核部分和CPU中其他单元都是独立的,如COREL2L3和内存控制器(memorycontroler)是相互独立的。将内核和其他部分区分开,一般来说可以丰富产品的型号,比如现在流行的corei7系列CPU,有4款多型号,

 

1.2.4    多核概念

         多核处理器有2种存放方式(增加超线程 COREI7就用的HT

  1. 将多个CPU直接插到同一个计算机上,也就是主板上,供同一个操作系统使用。这样的架构,如果系统需要更多CPU,只需要在主板上再多插一个即可,一般这种技术只用在超级计算机、大型机和服务器上(增加这种图片

  2. CMPchipmultiprocessing:将多个CPU内核(core)设计制造到一个CPU中,从Core 2开始PC才有的这个技术

    CMP按照实际情况又分:

  1. Pentium D 每个core都有自己的L2,因此各个core之间并无共享的缓存,无法直接通信,只能通过总线通信,这个模式和我们小区很相似,我们小区只有两栋大楼,2个大楼之间没有直接连通,每个大楼都有自己单独的走廊和楼梯,因此如果另一栋楼里住着你的朋友,你想给他东西,双方就必须都走到小区的公园,才能交换东西。因此这种模式效率比较差,因为双方无法直接交换东西,只能走到大楼外,交换完东西再回去。同样,这样的CPUcore之间交换数据,都必须走出自己的L2,到公共的普通内存中交换数据,然后将数据放回自己的L2,再进行读取。具体CPU如何使用缓存读取信息在后面章节介绍,这里只需要了解他们会这么处理就好。

  2. 这种多核CPU整合度比较深入,其代表就是现在的酷睿系统的CPU,这种整合方法为:L1私有,因为上面我们说了L1属于内核部分,内核的组成单元都是私有的,L2为共有,因为L2公有,多核core都处理同一个L2,就可能出现同时写一块内存,或者一个写入未成功时另一个就进行读取,为了避免这些情况出现,CPU中内置了负责协调访问L2的内存控制单元。这种整合方式好处有:

第一:节约,绿色环保,每个L2都需要电压支撑才能工作,只有一个L2时,就节约了制造L2的材料和对应的电力需求;

第二:因为L2是共享的,因此core之间可以通过L2直接交互信息而不是通过总线,效率高,大幅增加了Cache的命中率;

第三:提升程序运行效率,当多个core执行程序时使用了同一段代码或数据,只需要在L2中维持一份拷贝边可以同时访问,访问需要同步的数据或者volatile变量时,不需要CPU每次访问都要在各个L2中进行数据同步。

第四:Intel采用了高智能cache技术,使得每个核心都可以动态支配100%的全部cache,如:某个内核对cache利用率很低,另一个内核就会动态增加L2的使用比率,最大程度高效使用缓存;

最新的Core i7 则是L1 L2私有,共用L3,如图

http://images.anandtech.com/reviews/cpu/intel/nehalem/review/Nehalem_Die_callout.jpg

在介绍第一种架构的范例中:小区存在的种种弊端,在911后,建筑设计师们已经意识到并进行了改进,很多新建筑都采用了“空中走廊”技术,各大楼在高层之间建立互联的通道,方便大楼之间走动并且提高发生灾难时的人员逃亡率。

现在,CPU中开始融合GPU,其融合的思路和我们上面介绍的多核原理相同,以前因为CPUGPU要通过主板利用总线通讯,这样的速度无论如何都比不上将GPU整合到CPU中,直接在CPU中通过共享的内存进行相互通讯的速度。典型的技术有AMDAPUIntelSandy Bridge技术,其融合的进展和上面介绍的步骤也大致相同,最开始的融合,就是比较生硬的直接将GPUCPU融合到同一个硅片中,通过内存控制器进行互相通信,目前的融合只是对这个方法进行了优化还处于低级阶段,严格说还未真正做到融合,就像夫妻刚结婚一样,大家只是住到同一个房子中,沟通确实方便了,但是存折啥的未共享,还是存在障碍。而真正的融合需要达到尽可能的完全共享,如:地址空间、完全融合的内存系统、线程并发等。AMD预计最少2014年才能基本达成高融合。

这篇关于(书稿底稿)(C/C++)第一章:CPU基础知识 1.2.3 CORE内核 1.2.4 多核概念的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/931632

相关文章

C++中unordered_set哈希集合的实现

《C++中unordered_set哈希集合的实现》std::unordered_set是C++标准库中的无序关联容器,基于哈希表实现,具有元素唯一性和无序性特点,本文就来详细的介绍一下unorder... 目录一、概述二、头文件与命名空间三、常用方法与示例1. 构造与析构2. 迭代器与遍历3. 容量相关4

C++中悬垂引用(Dangling Reference) 的实现

《C++中悬垂引用(DanglingReference)的实现》C++中的悬垂引用指引用绑定的对象被销毁后引用仍存在的情况,会导致访问无效内存,下面就来详细的介绍一下产生的原因以及如何避免,感兴趣... 目录悬垂引用的产生原因1. 引用绑定到局部变量,变量超出作用域后销毁2. 引用绑定到动态分配的对象,对象

Java AOP面向切面编程的概念和实现方式

《JavaAOP面向切面编程的概念和实现方式》AOP是面向切面编程,通过动态代理将横切关注点(如日志、事务)与核心业务逻辑分离,提升代码复用性和可维护性,本文给大家介绍JavaAOP面向切面编程的概... 目录一、AOP 是什么?二、AOP 的核心概念与实现方式核心概念实现方式三、Spring AOP 的关

Python的pandas库基础知识超详细教程

《Python的pandas库基础知识超详细教程》Pandas是Python数据处理核心库,提供Series和DataFrame结构,支持CSV/Excel/SQL等数据源导入及清洗、合并、统计等功能... 目录一、配置环境二、序列和数据表2.1 初始化2.2  获取数值2.3 获取索引2.4 索引取内容2

Java Instrumentation从概念到基本用法详解

《JavaInstrumentation从概念到基本用法详解》JavaInstrumentation是java.lang.instrument包提供的API,允许开发者在类被JVM加载时对其进行修改... 目录一、什么是 Java Instrumentation主要用途二、核心概念1. Java Agent

C++读写word文档(.docx)DuckX库的使用详解

《C++读写word文档(.docx)DuckX库的使用详解》DuckX是C++库,用于创建/编辑.docx文件,支持读取文档、添加段落/片段、编辑表格,解决中文乱码需更改编码方案,进阶功能含文本替换... 目录一、基本用法1. 读取文档3. 添加段落4. 添加片段3. 编辑表格二、进阶用法1. 文本替换2

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

Kotlin 协程之Channel的概念和基本使用详解

《Kotlin协程之Channel的概念和基本使用详解》文章介绍协程在复杂场景中使用Channel进行数据传递与控制,涵盖创建参数、缓冲策略、操作方式及异常处理,适用于持续数据流、多协程协作等,需注... 目录前言launch / async 适合的场景Channel 的概念和基本使用概念Channel 的

C++右移运算符的一个小坑及解决

《C++右移运算符的一个小坑及解决》文章指出右移运算符处理负数时左侧补1导致死循环,与除法行为不同,强调需注意补码机制以正确统计二进制1的个数... 目录我遇到了这么一个www.chinasem.cn函数由此可以看到也很好理解总结我遇到了这么一个函数template<typename T>unsigned

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法