【GPU驱动开发】-Mesa ST和GLSL编译器衔接源码分析

2024-01-26 06:44

本文主要是介绍【GPU驱动开发】-Mesa ST和GLSL编译器衔接源码分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

不必害怕未知,无需恐惧犯错,做一个Creator!

(基于Mesa 22.2.5版本)

st_glsl_to_nir.c 主要实现了 GLSL 到 NIR 的转换功能,包括 GLSL 程序的链接、NIR 的最终化、优化以及统一变量的处理。以下是该文件主要实现的功能以及功能之间的实现流程:

链接 GLSL 到 NIR:
st_link_shader 函数是 GLSL 程序链接到 NIR 的入口函数。
根据着色器类型(GLSL 或 SPIR-V)调用相应的链接函数,如 gl_nir_link_glsl 或 gl_nir_link_spirv。
在链接过程中,执行了一系列的操作,包括清除着色器程序数据、创建着色器程序数据、判断着色器类型、链接着色器等。

GLSL 到 NIR 转换后的处理:
st_glsl_to_nir_post_opts 函数执行 GLSL 到 NIR 转换的链接后任务。
为使用的内建统一变量添加状态引用。

NIR 最终化和优化:
st_finalize_nir_before_variants 函数在生成变体之前最终化 NIR。
执行一系列 NIR 优化和变换,如分裂变量拷贝、降级纹理采样器、降级原子操作等。
设置受影响的状态标志(affected state flags)。

NIR 统一变量处理:
st_nir_lower_uniforms 函数用于降级 NIR 中的统一变量,根据配置使用压缩或非压缩方式。
如果启用了 lower_uniforms_to_ubo,还会将一些统一变量降级为 UBO。
最终将状态参数优化为 UBO。

统一变量的位置分配:
st_nir_lookup_parameter_index 函数根据变量在程序参数列表中的位置查找参数的索引。
st_nir_assign_uniform_locations 函数为 NIR 着色器中的统一变量分配驱动程序位置。
处理不同情况,包括无绑定和状态槽。

顶点着色器输入位置分配:
st_nir_assign_vs_in_locations 函数专门处理为顶点着色器输入分配输入位置的任务。
紧缩输入位置,删除未使用的输入,并相应调整位置。

变量位置的分配:
st_nir_assign_varying_locations 函数负责为着色器中的输入和输出变量分配位置。
对于顶点着色器,分配输出位置,并通过 st_nir_fixup_varying_slots 修正变量槽位。
对于几何着色器、Tessellation 控制着色器和 Tessellation 评估着色器,分配输入和输出位置,并修正变量槽位。
对于片段着色器,分配输入和输出位置。

NIR 向量化和坐标系变换:
st_nir_vectorize_io 函数向量化输入输出变量,特别对 Tessellation 控制着色器的 Tessellation 等级进行向量化。
st_nir_lower_wpos_ytransform 函数处理片段着色器的窗口坐标系转换。

NIR 缓存加载和存储:
st_load_nir_from_disk_cache 函数从磁盘缓存加载 NIR,以避免重新生成。
st_store_nir_in_disk_cache 函数将 NIR 存储到磁盘缓存中,以便将来重用。

释放 NIR 变体:
st_release_variants 函数释放着色器程序的变体。
在释放之前,将 NIR 存储到磁盘缓存中。

最终化着色器程序:
st_finalize_program 函数最终化着色器程序。
包括对 NIR 进行一系列最终化操作,如变量位置分配、采样器降级、统一变量降级等。
这些功能在 st_glsl_to_nir.c 文件中共同协作,完成了 GLSL 到 NIR 的转换和最终化过程,确保生成的 NIR 表示符合 Mesa 图形驱动的要求。

这篇关于【GPU驱动开发】-Mesa ST和GLSL编译器衔接源码分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/645950

相关文章

Nginx分布式部署流程分析

《Nginx分布式部署流程分析》文章介绍Nginx在分布式部署中的反向代理和负载均衡作用,用于分发请求、减轻服务器压力及解决session共享问题,涵盖配置方法、策略及Java项目应用,并提及分布式事... 目录分布式部署NginxJava中的代理代理分为正向代理和反向代理正向代理反向代理Nginx应用场景

一文详解Python如何开发游戏

《一文详解Python如何开发游戏》Python是一种非常流行的编程语言,也可以用来开发游戏模组,:本文主要介绍Python如何开发游戏的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录一、python简介二、Python 开发 2D 游戏的优劣势优势缺点三、Python 开发 3D

Redis中的有序集合zset从使用到原理分析

《Redis中的有序集合zset从使用到原理分析》Redis有序集合(zset)是字符串与分值的有序映射,通过跳跃表和哈希表结合实现高效有序性管理,适用于排行榜、延迟队列等场景,其时间复杂度低,内存占... 目录开篇:排行榜背后的秘密一、zset的基本使用1.1 常用命令1.2 Java客户端示例二、zse

基于Python开发Windows自动更新控制工具

《基于Python开发Windows自动更新控制工具》在当今数字化时代,操作系统更新已成为计算机维护的重要组成部分,本文介绍一款基于Python和PyQt5的Windows自动更新控制工具,有需要的可... 目录设计原理与技术实现系统架构概述数学建模工具界面完整代码实现技术深度分析多层级控制理论服务层控制注

Redis中的AOF原理及分析

《Redis中的AOF原理及分析》Redis的AOF通过记录所有写操作命令实现持久化,支持always/everysec/no三种同步策略,重写机制优化文件体积,与RDB结合可平衡数据安全与恢复效率... 目录开篇:从日记本到AOF一、AOF的基本执行流程1. 命令执行与记录2. AOF重写机制二、AOF的

MyBatis Plus大数据量查询慢原因分析及解决

《MyBatisPlus大数据量查询慢原因分析及解决》大数据量查询慢常因全表扫描、分页不当、索引缺失、内存占用高及ORM开销,优化措施包括分页查询、流式读取、SQL优化、批处理、多数据源、结果集二次... 目录大数据量查询慢的常见原因优化方案高级方案配置调优监控与诊断总结大数据量查询慢的常见原因MyBAT

分析 Java Stream 的 peek使用实践与副作用处理方案

《分析JavaStream的peek使用实践与副作用处理方案》StreamAPI的peek操作是中间操作,用于观察元素但不终止流,其副作用风险包括线程安全、顺序混乱及性能问题,合理使用场景有限... 目录一、peek 操作的本质:有状态的中间操作二、副作用的定义与风险场景1. 并行流下的线程安全问题2. 顺

MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决

《MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决》MyBatis默认开启一级缓存,同一事务中循环调用查询方法时会重复使用缓存数据,导致获取的序列主键值均为1,... 目录问题原因解决办法如果是存储过程总结问题myBATis有如下代码获取序列作为主键IdMappe

Java中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例解析

《Java中的分布式系统开发基于Zookeeper与Dubbo的应用案例解析》本文将通过实际案例,带你走进基于Zookeeper与Dubbo的分布式系统开发,本文通过实例代码给大家介绍的非常详... 目录Java 中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例一、分布式系统中的挑战二

基于Go语言开发一个 IP 归属地查询接口工具

《基于Go语言开发一个IP归属地查询接口工具》在日常开发中,IP地址归属地查询是一个常见需求,本文将带大家使用Go语言快速开发一个IP归属地查询接口服务,有需要的小伙伴可以了解下... 目录功能目标技术栈项目结构核心代码(main.go)使用方法扩展功能总结在日常开发中,IP 地址归属地查询是一个常见需求: