chisel入门初步2_2——-1/2次方生成器

2024-03-04 19:36

本文主要是介绍chisel入门初步2_2——-1/2次方生成器,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

由之前的GCN网络的介绍可以得知,我们需要输入两个乘数(两个节点的节点度),并输出他们乘积的-1/2次方,此处由于当时设计的booth编码的乘法器为有符号数,而此处是无符号数,实在懒得再写一份了,这里直接写个乘号,留给chisel自己去优化吧

此处设计输入的节点度位宽为8位,即支持节点最高与255个节点相连。考虑到-1/2次方对于硬件设计中的艰难性——无论是对时间和资源的消耗还是对脑力的消耗,这里对其中的主要使用查找表的方式获取对应的结果。同时由于硬件设计中寄存器位宽的确定性。而乘数的-1/2次方一定是一个小于1的数,无法直接进行表示。这里将乘数的-1/2次方所得到的结果乘以256再取整,算是对这个网络进行了一个量化操作吧。
先使用Python生成一张乘数结果和他的-1/2次方乘以256的表,Python代码如下:

import math# 定义查找表的大小
lut_size = 300      # 2^16# 计算查找表的值
lut_values = {}
for i in range(1, lut_size + 1):# 计算根号倒数乘以256value = math.sqrt(1 / i) * 256# 四舍五入到最接近的整数rounded_value = round(value)# 将值转换为32位无符号整数lut_values[i] = rounded_value & 0xFFFFFFFF# 将查找表保存到文件
with open('sqrt_inv_lut.txt', 'w') as file:for key, value in lut_values.items():# 格式化输出,适合Chisel的查找表初始化# file.write(f'({key}.U(16.W), {value}.U(8.W)),\n')file.write(f'{key}.U -> {value}.U(8.W),\n')print(f'Lookup table with {lut_size} entries has been saved to sqrt_inv_lut.txt')

生成的数据格式如下:

1.U -> 256.U(8.W),
2.U -> 181.U(8.W),
3.U -> 148.U(8.W),
4.U -> 128.U(8.W),
5.U -> 114.U(8.W),
6.U -> 105.U(8.W),
7.U -> 97.U(8.W),
8.U -> 91.U(8.W),
9.U -> 85.U(8.W),
10.U -> 81.U(8.W),

此处按理说可以直接完成查找表的编写了,但同时要考虑这样一件事。查找表规模太大了,对软硬件资源的消耗巨大,继续观察生成出来的数据特征。对于逐渐增大的输入,输出在前期变化大,而后期变化小。甚至最后上万个不同的输入对应一个相同的输出。所以,我们可以仅对前面变化较快的地方建立相应的查找表,而当输入变大后,我们可以直接采用条件判断的方式进行输出的划分。此处我选取输出大于15的部分建立查找表,而对于输出小于15的部分直接采用条件判断语句进行对输出值的选择。有一点值得注意的是,在输入最高为255的时候,输出四舍五入最小值为1,所以代码中的划分是精确的。
chisel代码

package FAM
import chisel3._  
import chisel3.util._  
import os.readimport chisel3._/* 输入起始节点和目的节点的度,计算得到他们乘积的-1/2次方
// 假设节点度最高256位,8bit
// 这里为实现整数的运算,将起始节点度与目的节点度的-1/2次方的乘积 * 256再取整
// 使用查找表完成乘法后的计算
*/class SqrtInv(val Degree_Data_width: Int = 8) extends Module {val io = IO(new Bundle {val start_point_degree = Input(UInt(Degree_Data_width.W))val end_point_degree = Input(UInt(Degree_Data_width.W))val start = Input(Bool())val done = Output(Bool())val out = Output(UInt((Degree_Data_width).W))})// 初始化状态机。共四个状态:空闲状态、输入节点乘法计算,查找表,输出val state = RegInit(0.U(2.W))val idle :: multiply :: lut :: done :: Nil = Enum(4)// 计算乘积val mulResult = RegInit(0.U((2*Degree_Data_width).W))val result = RegInit(0.U(8.W))// 初始化LUTval LUT_array = Array(1.U -> 255.U(8.W),2.U -> 181.U(8.W),3.U -> 148.U(8.W),4.U -> 128.U(8.W),5.U -> 114.U(8.W),6.U -> 105.U(8.W),7.U -> 97.U(8.W),8.U -> 91.U(8.W),9.U -> 85.U(8.W),10.U -> 81.U(8.W),11.U -> 77.U(8.W),12.U -> 74.U(8.W),13.U -> 71.U(8.W),14.U -> 68.U(8.W),15.U -> 66.U(8.W),16.U -> 64.U(8.W),17.U -> 62.U(8.W),18.U -> 60.U(8.W),19.U -> 59.U(8.W),20.U -> 57.U(8.W),21.U -> 56.U(8.W),22.U -> 55.U(8.W),23.U -> 53.U(8.W),24.U -> 52.U(8.W),25.U -> 51.U(8.W),26.U -> 50.U(8.W),27.U -> 49.U(8.W),28.U -> 48.U(8.W),29.U -> 48.U(8.W),30.U -> 47.U(8.W),31.U -> 46.U(8.W),32.U -> 45.U(8.W),33.U -> 45.U(8.W),34.U -> 44.U(8.W),35.U -> 43.U(8.W),36.U -> 43.U(8.W),37.U -> 42.U(8.W),38.U -> 42.U(8.W),39.U -> 41.U(8.W),40.U -> 40.U(8.W),41.U -> 40.U(8.W),42.U -> 40.U(8.W),43.U -> 39.U(8.W),44.U -> 39.U(8.W),45.U -> 38.U(8.W),46.U -> 38.U(8.W),47.U -> 37.U(8.W),48.U -> 37.U(8.W),49.U -> 37.U(8.W),50.U -> 36.U(8.W),51.U -> 36.U(8.W),52.U -> 36.U(8.W),53.U -> 35.U(8.W),54.U -> 35.U(8.W),55.U -> 35.U(8.W),56.U -> 34.U(8.W),57.U -> 34.U(8.W),58.U -> 34.U(8.W),59.U -> 33.U(8.W),60.U -> 33.U(8.W),61.U -> 33.U(8.W),62.U -> 33.U(8.W),63.U -> 32.U(8.W),64.U -> 32.U(8.W),65.U -> 32.U(8.W),66.U -> 32.U(8.W),67.U -> 31.U(8.W),68.U -> 31.U(8.W),69.U -> 31.U(8.W),70.U -> 31.U(8.W),71.U -> 30.U(8.W),72.U -> 30.U(8.W),73.U -> 30.U(8.W),74.U -> 30.U(8.W),75.U -> 30.U(8.W),76.U -> 29.U(8.W),77.U -> 29.U(8.W),78.U -> 29.U(8.W),79.U -> 29.U(8.W),80.U -> 29.U(8.W),81.U -> 28.U(8.W),82.U -> 28.U(8.W),83.U -> 28.U(8.W),84.U -> 28.U(8.W),85.U -> 28.U(8.W),86.U -> 28.U(8.W),87.U -> 27.U(8.W),88.U -> 27.U(8.W),89.U -> 27.U(8.W),90.U -> 27.U(8.W),91.U -> 27.U(8.W),92.U -> 27.U(8.W),93.U -> 27.U(8.W),94.U -> 26.U(8.W),95.U -> 26.U(8.W),96.U -> 26.U(8.W),97.U -> 26.U(8.W),98.U -> 26.U(8.W),99.U -> 26.U(8.W),100.U -> 26.U(8.W),101.U -> 25.U(8.W),102.U -> 25.U(8.W),103.U -> 25.U(8.W),104.U -> 25.U(8.W),105.U -> 25.U(8.W),106.U -> 25.U(8.W),107.U -> 25.U(8.W),108.U -> 25.U(8.W),109.U -> 25.U(8.W),110.U -> 24.U(8.W),111.U -> 24.U(8.W),112.U -> 24.U(8.W),113.U -> 24.U(8.W),114.U -> 24.U(8.W),115.U -> 24.U(8.W),116.U -> 24.U(8.W),117.U -> 24.U(8.W),118.U -> 24.U(8.W),119.U -> 23.U(8.W),120.U -> 23.U(8.W),121.U -> 23.U(8.W),122.U -> 23.U(8.W),123.U -> 23.U(8.W),124.U -> 23.U(8.W),125.U -> 23.U(8.W),126.U -> 23.U(8.W),127.U -> 23.U(8.W),128.U -> 23.U(8.W),129.U -> 23.U(8.W),130.U -> 22.U(8.W),131.U -> 22.U(8.W),132.U -> 22.U(8.W),133.U -> 22.U(8.W),134.U -> 22.U(8.W),135.U -> 22.U(8.W),136.U -> 22.U(8.W),137.U -> 22.U(8.W),138.U -> 22.U(8.W),139.U -> 22.U(8.W),140.U -> 22.U(8.W),141.U -> 22.U(8.W),142.U -> 21.U(8.W),143.U -> 21.U(8.W),144.U -> 21.U(8.W),145.U -> 21.U(8.W),146.U -> 21.U(8.W),147.U -> 21.U(8.W),148.U -> 21.U(8.W),149.U -> 21.U(8.W),150.U -> 21.U(8.W),151.U -> 21.U(8.W),152.U -> 21.U(8.W),153.U -> 21.U(8.W),154.U -> 21.U(8.W),155.U -> 21.U(8.W),156.U -> 20.U(8.W),157.U -> 20.U(8.W),158.U -> 20.U(8.W),159.U -> 20.U(8.W),160.U -> 20.U(8.W),161.U -> 20.U(8.W),162.U -> 20.U(8.W),163.U -> 20.U(8.W),164.U -> 20.U(8.W),165.U -> 20.U(8.W),166.U -> 20.U(8.W),167.U -> 20.U(8.W),168.U -> 20.U(8.W),169.U -> 20.U(8.W),170.U -> 20.U(8.W),171.U -> 20.U(8.W),172.U -> 20.U(8.W),173.U -> 19.U(8.W),174.U -> 19.U(8.W),175.U -> 19.U(8.W),176.U -> 19.U(8.W),177.U -> 19.U(8.W),178.U -> 19.U(8.W),179.U -> 19.U(8.W),180.U -> 19.U(8.W),181.U -> 19.U(8.W),182.U -> 19.U(8.W),183.U -> 19.U(8.W),184.U -> 19.U(8.W),185.U -> 19.U(8.W),186.U -> 19.U(8.W),187.U -> 19.U(8.W),188.U -> 19.U(8.W),189.U -> 19.U(8.W),190.U -> 19.U(8.W),191.U -> 19.U(8.W),192.U -> 18.U(8.W),193.U -> 18.U(8.W),194.U -> 18.U(8.W),195.U -> 18.U(8.W),196.U -> 18.U(8.W),197.U -> 18.U(8.W),198.U -> 18.U(8.W),199.U -> 18.U(8.W),200.U -> 18.U(8.W),201.U -> 18.U(8.W),202.U -> 18.U(8.W),203.U -> 18.U(8.W),204.U -> 18.U(8.W),205.U -> 18.U(8.W),206.U -> 18.U(8.W),207.U -> 18.U(8.W),208.U -> 18.U(8.W),209.U -> 18.U(8.W),210.U -> 18.U(8.W),211.U -> 18.U(8.W),212.U -> 18.U(8.W),213.U -> 18.U(8.W),214.U -> 17.U(8.W),215.U -> 17.U(8.W),216.U -> 17.U(8.W),217.U -> 17.U(8.W),218.U -> 17.U(8.W),219.U -> 17.U(8.W),220.U -> 17.U(8.W),221.U -> 17.U(8.W),222.U -> 17.U(8.W),223.U -> 17.U(8.W),224.U -> 17.U(8.W),225.U -> 17.U(8.W),226.U -> 17.U(8.W),227.U -> 17.U(8.W),228.U -> 17.U(8.W),229.U -> 17.U(8.W),230.U -> 17.U(8.W),231.U -> 17.U(8.W),232.U -> 17.U(8.W),233.U -> 17.U(8.W),234.U -> 17.U(8.W),235.U -> 17.U(8.W),236.U -> 17.U(8.W),237.U -> 17.U(8.W),238.U -> 17.U(8.W),239.U -> 17.U(8.W),240.U -> 17.U(8.W),241.U -> 16.U(8.W),242.U -> 16.U(8.W),243.U -> 16.U(8.W),244.U -> 16.U(8.W),245.U -> 16.U(8.W),246.U -> 16.U(8.W),247.U -> 16.U(8.W),248.U -> 16.U(8.W),249.U -> 16.U(8.W),250.U -> 16.U(8.W),251.U -> 16.U(8.W),252.U -> 16.U(8.W),253.U -> 16.U(8.W),254.U -> 16.U(8.W),255.U -> 16.U(8.W),256.U -> 16.U(8.W),257.U -> 16.U(8.W),258.U -> 16.U(8.W),259.U -> 16.U(8.W),260.U -> 16.U(8.W),261.U -> 16.U(8.W),262.U -> 16.U(8.W),263.U -> 16.U(8.W),264.U -> 16.U(8.W),265.U -> 16.U(8.W),266.U -> 16.U(8.W),267.U -> 16.U(8.W),268.U -> 16.U(8.W),269.U -> 16.U(8.W),270.U -> 16.U(8.W),271.U -> 16.U(8.W),272.U -> 16.U(8.W))// 状态机执行switch(state) {is(idle) {when(io.start) {state := multiply}}is(multiply) {mulResult := io.start_point_degree * io.end_point_degreestate := lut}is(lut) {// 使用输入值作为索引来查找结果// 接受选择信号、一个默认值,一个选择表。如果匹配成功,则按照匹配值输出,否则按默认值输出// 观察计算结果,前面数值变化相对频繁,而后面数值变化不大,这里将整个过程进行分类。变化相对频繁的地方使用查找表进行查找,// 而没那么频繁的使用条件判断所属区间进行处理when(mulResult < 273.U) {           // 查找表所属区间,即LUT_depthresult := MuxLookup(mulResult, 0.U, LUT_array)}.elsewhen(mulResult < 312.U) {      // 15result := 15.U}.elsewhen(mulResult < 360.U) {      // 14result := 14.U}.elsewhen(mulResult < 420.U) {      // 13result := 13.U}.elsewhen(mulResult < 496.U) {      // 12result := 12.U}.elsewhen(mulResult < 595.U) {      // 11result := 11.U}.elsewhen(mulResult < 727.U) {      // 10result := 10.U}.elsewhen(mulResult < 908.U) {      // 9result := 9.U}.elsewhen(mulResult < 1166.U) {     // 8result := 8.U}.elsewhen(mulResult < 1552.U) {     // 7result := 7.U}.elsewhen(mulResult < 2167.U) {     // 6result := 6.U}.elsewhen(mulResult < 3237.U) {     // 5result := 5.U}.elsewhen(mulResult < 5350.U) {     // 4result := 4.U}.elsewhen(mulResult < 10487.U) {    // 3result := 3.U}.elsewhen(mulResult < 29128.U) {    // 2result := 2.U}.otherwise {                        // 1                         result := 1.U}state := done}is(done) {state := idle}}io.done := (state === done)io.out := result}// 实例化模块并运行测试,同时生成Verilog代码
object SqrtInv extends App {(new chisel3.stage.ChiselStage).emitVerilog(new SqrtInv(), Array("--target-dir", "./verilog/FAM"))
}

测试代码

import scala.util.Random
import org.scalatest._
import chiseltest._
import chisel3._
import FAM.SqrtInv// 乘累加器的测试类  class Power_1_2Test extends FreeSpec with ChiselScalatestTester {"Power -1/2 should pass" in {test(new SqrtInv).withAnnotations(Seq(WriteVcdAnnotation))  // generate the .vcd waveform file as output{ c =>println("Start Testing")for (i <- 0 until 10) {val a = Random.nextInt(256)  // 生成0到255之间的随机数  val b = Random.nextInt(256) c.io.start_point_degree.poke(a.U)   // 将随机数a作为无符号数输入  c.io.end_point_degree.poke(b.U)     // 将随机数b作为无符号数输入c.io.start.poke(true.B)  c.clock.step(2)while (c.io.done.peekBoolean() === false) {c.clock.step(1)}val expectedResult = math.round(256/math.sqrt(a * b))     // 计算预期乘积  val actualResult = c.io.out.peek().litValue.toLong // 获取实际乘积   /* c: 这是测试环境中MAC模块的实例。c.io.result: 这是指向模块输出端口result的引用。peek(): 这是一个Chisel测试方法,用于在不推进时钟的情况下读取端口的当前值。litValue: 这是一个方法,用于从Chisel的Data类型中提取实际的Scala值(在这个例子中是BigInt) */println(s"Iteration: $i, A: $a, B: $b, Expected Result: $expectedResult, Actual Result: $actualResult")  assert(actualResult === expectedResult, s"Product is incorrect at iteration $i!\n Start_point_degree is $a, end point degree is $b.\n Expected: $expectedResult, Actual: $actualResult")  }}}
}

测试结果(使用vscode的metals插件完成测试,也可直接sbt test对所有文件进行测试)

Power_1_2Test
Start Testing
Iteration: 0, A: 167, B: 77, Expected Result: 2, Actual Result: 2
Iteration: 1, A: 180, B: 14, Expected Result: 5, Actual Result: 5
Iteration: 2, A: 212, B: 114, Expected Result: 2, Actual Result: 2
Iteration: 3, A: 171, B: 195, Expected Result: 1, Actual Result: 1
Iteration: 4, A: 196, B: 219, Expected Result: 1, Actual Result: 1
Iteration: 5, A: 101, B: 209, Expected Result: 2, Actual Result: 2
Iteration: 6, A: 138, B: 111, Expected Result: 2, Actual Result: 2
Iteration: 7, A: 113, B: 69, Expected Result: 3, Actual Result: 3
Iteration: 8, A: 115, B: 245, Expected Result: 2, Actual Result: 2
Iteration: 9, A: 219, B: 153, Expected Result: 1, Actual Result: 1
- Power -1/2 should pass
Execution took 2.75s
1 tests, 1 passed
All tests in Power_1_2Test passed

这篇关于chisel入门初步2_2——-1/2次方生成器的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/774224

相关文章

Java List 使用举例(从入门到精通)

《JavaList使用举例(从入门到精通)》本文系统讲解JavaList,涵盖基础概念、核心特性、常用实现(如ArrayList、LinkedList)及性能对比,介绍创建、操作、遍历方法,结合实... 目录一、List 基础概念1.1 什么是 List?1.2 List 的核心特性1.3 List 家族成

c++日志库log4cplus快速入门小结

《c++日志库log4cplus快速入门小结》文章浏览阅读1.1w次,点赞9次,收藏44次。本文介绍Log4cplus,一种适用于C++的线程安全日志记录API,提供灵活的日志管理和配置控制。文章涵盖... 目录简介日志等级配置文件使用关于初始化使用示例总结参考资料简介log4j 用于Java,log4c

史上最全MybatisPlus从入门到精通

《史上最全MybatisPlus从入门到精通》MyBatis-Plus是MyBatis增强工具,简化开发并提升效率,支持自动映射表名/字段与实体类,提供条件构造器、多种查询方式(等值/范围/模糊/分页... 目录1.简介2.基础篇2.1.通用mapper接口操作2.2.通用service接口操作3.进阶篇3

Python自定义异常的全面指南(入门到实践)

《Python自定义异常的全面指南(入门到实践)》想象你正在开发一个银行系统,用户转账时余额不足,如果直接抛出ValueError,调用方很难区分是金额格式错误还是余额不足,这正是Python自定义异... 目录引言:为什么需要自定义异常一、异常基础:先搞懂python的异常体系1.1 异常是什么?1.2

Python实现Word转PDF全攻略(从入门到实战)

《Python实现Word转PDF全攻略(从入门到实战)》在数字化办公场景中,Word文档的跨平台兼容性始终是个难题,而PDF格式凭借所见即所得的特性,已成为文档分发和归档的标准格式,下面小编就来和大... 目录一、为什么需要python处理Word转PDF?二、主流转换方案对比三、五套实战方案详解方案1:

使用Python构建智能BAT文件生成器的完美解决方案

《使用Python构建智能BAT文件生成器的完美解决方案》这篇文章主要为大家详细介绍了如何使用wxPython构建一个智能的BAT文件生成器,它不仅能够为Python脚本生成启动脚本,还提供了完整的文... 目录引言运行效果图项目背景与需求分析核心需求技术选型核心功能实现1. 数据库设计2. 界面布局设计3

Spring WebClient从入门到精通

《SpringWebClient从入门到精通》本文详解SpringWebClient非阻塞响应式特性及优势,涵盖核心API、实战应用与性能优化,对比RestTemplate,为微服务通信提供高效解决... 目录一、WebClient 概述1.1 为什么选择 WebClient?1.2 WebClient 与

Spring Boot 与微服务入门实战详细总结

《SpringBoot与微服务入门实战详细总结》本文讲解SpringBoot框架的核心特性如快速构建、自动配置、零XML与微服务架构的定义、演进及优缺点,涵盖开发环境准备和HelloWorld实战... 目录一、Spring Boot 核心概述二、微服务架构详解1. 微服务的定义与演进2. 微服务的优缺点三

从入门到精通详解LangChain加载HTML内容的全攻略

《从入门到精通详解LangChain加载HTML内容的全攻略》这篇文章主要为大家详细介绍了如何用LangChain优雅地处理HTML内容,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录引言:当大语言模型遇见html一、HTML加载器为什么需要专门的HTML加载器核心加载器对比表二

从入门到进阶讲解Python自动化Playwright实战指南

《从入门到进阶讲解Python自动化Playwright实战指南》Playwright是针对Python语言的纯自动化工具,它可以通过单个API自动执行Chromium,Firefox和WebKit... 目录Playwright 简介核心优势安装步骤观点与案例结合Playwright 核心功能从零开始学习