RISC-V处理器:1.取指令 RTL 代码分析

2024-03-24 23:38

本文主要是介绍RISC-V处理器:1.取指令 RTL 代码分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

RISC-V处理器:1.取指令 RTL 代码分析

1. 取指特点

  1. 指令在存储空间中所处的地址,称为它的指令PC(Program Counter)
  2. 取指是指处理器将指令,按照其指令PC,从存储器中读取出来的过程
  3. 处理器从存储器中取出指令的目标是:快速连续不断
  4. 指令分为普通指令非分支跳转指令分支跳转指令
  5. 对于非分支跳转指令,即便是对于地址不对齐的32位指令,也要求能够连续不断的从一个周期内读取出来
  6. 对于分支跳转指令,要能够迅速判断是否需要跳转。若果需要跳转,则从新的指令PC地址处快速取出指令。

2. 快速取指

首先应该保证存储器的读延迟越小越好:

  1. 片外DDR或者Flash存储器可能需要几十个周期的延时
  2. 片上的SRAM也可能需要几个周期的延时

我们采取 ITCM 和 I-Cache 的方法:

  1. ITCM(Instruction Tightly Coupled Memory)
    指令紧耦合存储器,指配置一小段容量很小(即使KB)的存储器(通常为SRAM),用于存储指令,且在物理上,举例处理器核很近,并且专属于处理器核,因此能够取得很小的访问延迟。这种方式只能用来存放容量大小有限的关键程序指令;
  2. I-Cache(Instruction Cache)
    指令缓存,利用软件程序的时间局部性和空间局部性,将容积量巨大的外部指令存储器空间,动态映射到容量有限的指令缓存中,将访问指令存储器的平均延迟降低到最小。但是因为缓存的容量有限,因此访问缓存存在着相当大的不确定性。
TIPS:

大多数的低功耗处理器应用场景都应用实时性较高的场景,因此更加倾向于使用延迟确定的 ITCM 。

3. 处理非对齐指令

非对齐指令:32位指令PC数值无法被4整除
因为作为存储器的 ITCM 或者 I-Cache 往往使用SRAM,而SRAM读端口的宽度是固定的。对于32位SRAM,一个时钟只能读出1个32位的数据,如果一个32位的长指令地址不对齐,则需要两个时钟周期才能取出,之后各取一部分,拼接为真正需要的32位指令。
我们要做的,就是令处理器在一个周期内取出这条指令。以普通指令非对齐和分支跳转指令讨论:

1.普通指令的非对齐

这种指令可以按顺序取指,地址连续增长,利用剩余缓存(Leftover Buffer)保存上次取指令没有用完的比特位,供下次使用。

2. 分支跳转指令的非对齐

如果跳转的目标地址和32位地址边界不对齐,并且需要取出一个32位的指令字,剩余缓存不能使用,因为剩余缓存只能在按顺序取指的情况下,才能够提前预存上次没有用完的指令字。
常见的解决方式是,采用多体化(Bank)的SRAM进行指令存储。其中,奇偶交错的方式最为常见。使用32位宽的SRAM交错进行存储。这样地址不对齐的32位地址,在一个周期内,可以同时访问两块SRAM,取出两个连续的32位指令字。各取一部分拼成真正需要的32位指令字。

4. 处理分支指令

RISC-V架构处理器的分支指令类型:

  1. 无条件跳转/分支指令:
    无条件直接跳转指令:jal(jump and link):

     jal x5,offset // 此为汇编示例,jal使用编码在指令字中的20位立即数(有// 符号)作为offset偏移量。offset x 2,之后与当前指令所在地址// 相加
    

    无条件间接跳转指令: jalr(jump and link-register) :

     jalr x1,x6,offset // 将指令字中的12位立即数作为偏移量(offset),//与另一个寄存器索引的操作数相加,得到最终的跳转目标地址
    
  2. 带条件跳转/分支:
    带条件直接跳转指令
    带条件间接跳转指令

对于分支指令,处理器采用分支预测方式:
是否需要跳转,简称为预测方向。这是对带条件跳转语句来说的。
如果跳转,目标地址是什么?简称为预测地址。

5. 简单的带条件直接跳转指令

beq:两个整数操作数相同则跳转
bne:两个整数不相等则跳转
blt:第一个有符号数小于第二个有符号数,则跳转
blut:第一个无符号数小于第二个无符号数,则跳转
bge:第一个有符号数大于第二个有符号数,则跳转
bgru:第一个无符号数大于第二个无符号数,则跳转

这篇关于RISC-V处理器:1.取指令 RTL 代码分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/843163

相关文章

怎样通过分析GC日志来定位Java进程的内存问题

《怎样通过分析GC日志来定位Java进程的内存问题》:本文主要介绍怎样通过分析GC日志来定位Java进程的内存问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、GC 日志基础配置1. 启用详细 GC 日志2. 不同收集器的日志格式二、关键指标与分析维度1.

Java中调用数据库存储过程的示例代码

《Java中调用数据库存储过程的示例代码》本文介绍Java通过JDBC调用数据库存储过程的方法,涵盖参数类型、执行步骤及数据库差异,需注意异常处理与资源管理,以优化性能并实现复杂业务逻辑,感兴趣的朋友... 目录一、存储过程概述二、Java调用存储过程的基本javascript步骤三、Java调用存储过程示

Visual Studio 2022 编译C++20代码的图文步骤

《VisualStudio2022编译C++20代码的图文步骤》在VisualStudio中启用C++20import功能,需设置语言标准为ISOC++20,开启扫描源查找模块依赖及实验性标... 默认创建Visual Studio桌面控制台项目代码包含C++20的import方法。右键项目的属性:

MySQL中的表连接原理分析

《MySQL中的表连接原理分析》:本文主要介绍MySQL中的表连接原理分析,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、环境3、表连接原理【1】驱动表和被驱动表【2】内连接【3】外连接【4编程】嵌套循环连接【5】join buffer4、总结1、背景

MySQL数据库的内嵌函数和联合查询实例代码

《MySQL数据库的内嵌函数和联合查询实例代码》联合查询是一种将多个查询结果组合在一起的方法,通常使用UNION、UNIONALL、INTERSECT和EXCEPT关键字,下面:本文主要介绍MyS... 目录一.数据库的内嵌函数1.1聚合函数COUNT([DISTINCT] expr)SUM([DISTIN

python中Hash使用场景分析

《python中Hash使用场景分析》Python的hash()函数用于获取对象哈希值,常用于字典和集合,不可变类型可哈希,可变类型不可,常见算法包括除法、乘法、平方取中和随机数哈希,各有优缺点,需根... 目录python中的 Hash除法哈希算法乘法哈希算法平方取中法随机数哈希算法小结在Python中,

Java实现自定义table宽高的示例代码

《Java实现自定义table宽高的示例代码》在桌面应用、管理系统乃至报表工具中,表格(JTable)作为最常用的数据展示组件,不仅承载对数据的增删改查,还需要配合布局与视觉需求,而JavaSwing... 目录一、项目背景详细介绍二、项目需求详细介绍三、相关技术详细介绍四、实现思路详细介绍五、完整实现代码

Java Stream的distinct去重原理分析

《JavaStream的distinct去重原理分析》Javastream中的distinct方法用于去除流中的重复元素,它返回一个包含过滤后唯一元素的新流,该方法会根据元素的hashcode和eq... 目录一、distinct 的基础用法与核心特性二、distinct 的底层实现原理1. 顺序流中的去重

Go语言代码格式化的技巧分享

《Go语言代码格式化的技巧分享》在Go语言的开发过程中,代码格式化是一个看似细微却至关重要的环节,良好的代码格式化不仅能提升代码的可读性,还能促进团队协作,减少因代码风格差异引发的问题,Go在代码格式... 目录一、Go 语言代码格式化的重要性二、Go 语言代码格式化工具:gofmt 与 go fmt(一)

HTML5实现的移动端购物车自动结算功能示例代码

《HTML5实现的移动端购物车自动结算功能示例代码》本文介绍HTML5实现移动端购物车自动结算,通过WebStorage、事件监听、DOM操作等技术,确保实时更新与数据同步,优化性能及无障碍性,提升用... 目录1. 移动端购物车自动结算概述2. 数据存储与状态保存机制2.1 浏览器端的数据存储方式2.1.