[处理器芯片]-3 超标量CPU实现之取指

2024-05-26 17:20

本文主要是介绍[处理器芯片]-3 超标量CPU实现之取指,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1 超标量CPU结构

前端(Frontend)

前端负责从程序中提取指令,并将其转换为微操作送入CPU的流水线中。

1)取指单元:从指令缓存或内存中提取指令,并将其送入流水线。

2)分支预测单元:负责预测分支指令的执行路径,以提前加载正确的指令,减少分支带来的流水线停顿。

3)译码器:将获取到的指令解码成CPU内部理解的格式,以便后续阶段的执行。

4)寄存器重命名:将逻辑寄存器重命名为物理寄存器,以解决数据依赖关系,避免数据冒险,并提高指令级并行度。

5)分发和发射:将已经译码并重命名的指令发送到相应的执行单元,并在需要时进行缓存或排队。在发射阶段,指令被提交给调度器进行后续处理。

6)调度器:负责根据指令的依赖关系和可用资源,将指令调度到可用的执行单元中,包括确定指令的执行顺序,管理执行单元的利用率,并确保指令的正确执行。调度器还负责管理处理器的资源,包括执行单元、寄存器文件等,它会跟踪资源的使用情况,以确保所有指令都能够得到充分利用,同时避免资源冲突和竞争。

后端(Backend)

后端负责实际执行指令和处理数据。

1)执行单元:包括整数单元、浮点单元、加载/存储单元等,负责执行各种不同类型的指令。

2)寄存器文件:存储CPU中的通用寄存器和状态寄存器,执行单元从寄存器文件中读取操作数并将结果写回。

3)乱序引擎:实现乱序执行功能,动态地重新排序指令以最大程度地利用可用的执行单元。

4)访存单元:处理加载和存储操作,包括数据缓存和地址生成单元等。

5)写回单元:将执行单元计算得到的结果写回到寄存器文件或内存中。

2 取指单元

取指单元是CPU运行第一个阶段,主要由指令缓存和计算取指地址的逻辑单元构成,指令缓存是该阶段的核心内容。

1)内存结构

CPU 内存结构通常分为多层,从高速、小容量的高级缓存到低速、大容量的主存储器,以及可能的外部存储器(例如磁盘),每一层都有不同的访问速度、容量和成本。

L1 缓存(一级缓存):

现代处理器的 L1 缓存一般分为 L1 ICache(指令缓存)和 L1 DCache(数据缓存),每个缓存大小通常在16KB到64KB之间,访问延迟在1个时钟周期。

L2 缓存(二级缓存):

L2 缓存的大小通常在数百KB到数MB之间,访问延迟相对于 L1 缓存会更长,大约在5到15个时钟周期之间。

L3 缓存(三级缓存):

L3 缓存通常是共享的,用于多个 CPU 核心之间共享数据。它的大小通常在几MB到数十MB之间,访问延迟相对于 L2 缓存会更长,大约在10到30个时钟周期之间。

主存储器(主内存):

主存储器是 CPU 访问数据的主要来源,其容量通常在几GB到数十GB之间,访问延迟相对于缓存会更长,通常在几十到数百个时钟周期之间。

2)指令缓存

指令缓存是一种特殊的高速缓存用于存储 CPU 执行的指令,提供快速访问指令的能力,以减少指令的访问延迟。

指令缓存分类

直接映射缓存:指令地址被映射到缓存中的一个固定的位置,每个指令地址只有一个可能的缓存位置。直接映射缓存的实现简单,在命中时可实现快速访问,但容易产生冲突。

全相联缓存:指令可以存储在缓存中的任何位置,没有固定的映射规则,每个指令地址都可以在缓存中的任何地方找到。全相联缓存通常需要更复杂的替换算法来管理缓存中的数据。

组相联缓存:缓存被分为多个组,每个组包含多个缓存行,指令地址被映射到某个组中的一个缓存行。组相联缓存结合了直接映射缓存和全相联缓存的优点,提供了更好的性能和成本效益。

替换策略选择

当需要访问的内存卡不在缓存中,触发缓存未命中,需要在缓存中选择剔除块进行替换,替换策略决定了当缓存满了时,哪个缓存块应该被替换掉,以便为新的数据腾出空间。

先进先出(FIFO):替换最早进入缓存的块,不管最近的访问情况。使用一个队列来跟踪缓存块的进入顺序,最早进入的块在需要替换时最先被移出,实现简单硬件开销低,但命中率可能较低,不能有效利用缓存块的访问历史信息。

最近最少使用(LRU):最近最少使用的指令被替换出去,需要维护一个访问记录列表或计数器,来跟踪每个缓存块的使用历史。具体实现可以通过链表、堆栈或计数器来记录每个缓存块的最近使用情况,具备较高的命中率,尤其是在具有较强局部性的访问模式下表现良好,是最简单的也是使用最广泛的一种替换策略。

随机替换策略(Random):随机选择一个缓存行来替换,命中率通常较低,无法利用缓存块的访问历史信息。

最少使用(LFU):替换访问次数最少的缓存块,假设使用频率较低的数据将来也不会被频繁访问。需要维护每个缓存块的访问计数器,对于具有固定访问模式的数据集,表现良好;对于变化频繁的访问模式,效果不佳。

最近最常使用(MRU):替换最近最常使用的缓存块。需要跟踪每个缓存块的使用情况,与 LRU 类似,对于某些特定的工作负载,可能有优势。

分段最近最少使用(SLRU):将缓存分为多个段例如冷热段,新加载的数据首先进入冷段,冷段的数据如果再次访问则提升到热段。分段缓存的管理需要两个或多个 LRU 列表,每个段有独立的 LRU 管理,提供更高的灵活性和命中率。

实例说明

L1 缓存:通常会采用 LRU 或 SLRU,因为这些缓存非常小(16KB到64KB),命中率至关重要,且访问速度要非常快。

L2 缓存:可能采用 SLRU 或 LFU,因为 L2 缓存的大小较大(256KB到2MB),需要在命中率和硬件开销之间取得平衡。

L3 缓存:可能采用更简单的替换策略如 FIFO 或 Random,因为 L3 缓存共享多个核心,且更关注缓存管理的整体效率。

指令缓存访问步骤

地址生成:CPU 发出指令访问请求时,会提供一个指令地址。

索引计算:根据缓存的组织结构,计算出指令地址在缓存中的索引。

索引比较:将索引与缓存中的索引进行比较,确定指令是否在缓存中。

标记比较:如果缓存中有匹配的索引,进一步比较标记以确定是否是所需的指令。

数据读取:如果命中缓存,就从缓存中读取所需的指令;如果缓存未命中,就从主存或下一级缓存中读取指令,并将其存储到缓存中以备后续访问。

这篇关于[处理器芯片]-3 超标量CPU实现之取指的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1005107

相关文章

Redis客户端连接机制的实现方案

《Redis客户端连接机制的实现方案》本文主要介绍了Redis客户端连接机制的实现方案,包括事件驱动模型、非阻塞I/O处理、连接池应用及配置优化,具有一定的参考价值,感兴趣的可以了解一下... 目录1. Redis连接模型概述2. 连接建立过程详解2.1 连php接初始化流程2.2 关键配置参数3. 最大连

Python实现网格交易策略的过程

《Python实现网格交易策略的过程》本文讲解Python网格交易策略,利用ccxt获取加密货币数据及backtrader回测,通过设定网格节点,低买高卖获利,适合震荡行情,下面跟我一起看看我们的第一... 网格交易是一种经典的量化交易策略,其核心思想是在价格上下预设多个“网格”,当价格触发特定网格时执行买

python设置环境变量路径实现过程

《python设置环境变量路径实现过程》本文介绍设置Python路径的多种方法:临时设置(Windows用`set`,Linux/macOS用`export`)、永久设置(系统属性或shell配置文件... 目录设置python路径的方法临时设置环境变量(适用于当前会话)永久设置环境变量(Windows系统

Python对接支付宝支付之使用AliPay实现的详细操作指南

《Python对接支付宝支付之使用AliPay实现的详细操作指南》支付宝没有提供PythonSDK,但是强大的github就有提供python-alipay-sdk,封装里很多复杂操作,使用这个我们就... 目录一、引言二、准备工作2.1 支付宝开放平台入驻与应用创建2.2 密钥生成与配置2.3 安装ali

Spring Security 单点登录与自动登录机制的实现原理

《SpringSecurity单点登录与自动登录机制的实现原理》本文探讨SpringSecurity实现单点登录(SSO)与自动登录机制,涵盖JWT跨系统认证、RememberMe持久化Token... 目录一、核心概念解析1.1 单点登录(SSO)1.2 自动登录(Remember Me)二、代码分析三、

PyCharm中配置PyQt的实现步骤

《PyCharm中配置PyQt的实现步骤》PyCharm是JetBrains推出的一款强大的PythonIDE,结合PyQt可以进行pythion高效开发桌面GUI应用程序,本文就来介绍一下PyCha... 目录1. 安装China编程PyQt1.PyQt 核心组件2. 基础 PyQt 应用程序结构3. 使用 Q

Python实现批量提取BLF文件时间戳

《Python实现批量提取BLF文件时间戳》BLF(BinaryLoggingFormat)作为Vector公司推出的CAN总线数据记录格式,被广泛用于存储车辆通信数据,本文将使用Python轻松提取... 目录一、为什么需要批量处理 BLF 文件二、核心代码解析:从文件遍历到数据导出1. 环境准备与依赖库

linux下shell脚本启动jar包实现过程

《linux下shell脚本启动jar包实现过程》确保APP_NAME和LOG_FILE位于目录内,首次启动前需手动创建log文件夹,否则报错,此为个人经验,供参考,欢迎支持脚本之家... 目录linux下shell脚本启动jar包样例1样例2总结linux下shell脚本启动jar包样例1#!/bin

go动态限制并发数量的实现示例

《go动态限制并发数量的实现示例》本文主要介绍了Go并发控制方法,通过带缓冲通道和第三方库实现并发数量限制,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录带有缓冲大小的通道使用第三方库其他控制并发的方法因为go从语言层面支持并发,所以面试百分百会问到

Go语言并发之通知退出机制的实现

《Go语言并发之通知退出机制的实现》本文主要介绍了Go语言并发之通知退出机制的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录1、通知退出机制1.1 进程/main函数退出1.2 通过channel退出1.3 通过cont