Xformers介绍

2023-11-03 12:10
文章标签 介绍 xformers

本文主要是介绍Xformers介绍,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

原基础环境配置:NVIDIA470.57.02支持的最高CUDA为11.4,实际CUDA为11.1。


最近在跑ResShift模型,是一个基于高效diffusion的图像超分扩散模型。在配置环境时,需要安装一个库xformers==0.0.20,然后就引发了一系列的版本问题:

1、xformer 0.0.20 需要的 torch版本为2.0.1左右

2、torch 2.0.1需要的cuda版本为11.7左右

3、cuda11.7需要的NVIDIA版本需要升级(CUDA版本不能超过NVIDIA支持的最高版本)

4、更新cuda后,对应的gcc版本可能也需要更新,而且以前的project环境可能会崩,呜呜呜~


Xformers作为facebook中的一个开源库,能够更加有效的实现transformer中的计算工作,能够对整体模型进行进一步的加速。注意,当处理高分辨率的图像时,xformers对于显存的降低效果更加明显。对于处理较低分辨率的图像时(如512*512)对显存没有明显优化。

另外需要注意,使用了xformers对训练过程进行优化后,模型推理时也必须要用存在xformers的环境进行推理,不然容易出现精度溢出导致的“黑图”问题。

GitHub - facebookresearch/xformers: Hackable and optimized Transformers building blocks, supporting a composable construction.Hackable and optimized Transformers building blocks, supporting a composable construction. - GitHub - facebookresearch/xformers: Hackable and optimized Transformers building blocks, supporting a composable construction.icon-default.png?t=N7T8https://github.com/facebookresearch/xformers对于xformers的详细介绍、代码中如何引入、效果和注意事项可以戳下面链接:

【stable-diffusion企业级教程04】EMA你走,拥抱16G显存!Xformers是未来! - 知乎1、回顾无所知:【stable-diffusion企业级教程03】FP16真香!(想说爱你不容易)上一讲我们成功的利用deepspeed框架,将sd模型以fp16的精度训练了起来,显存的消耗也降低到18G左右。 不过有小伙伴在下面评论,说手…icon-default.png?t=N7T8https://zhuanlan.zhihu.com/p/632607725



注意:代码中应该会在开头,定义一个全局变量,来确定是否需要使用xformers。若处理较小分辨率的图片,或者是觉得当前基础环境配置难以支持xformers,则直接卸載xformers即可,程序也能正常运行。(pip uninstall xformers)

截止20230924,所发布的xformers版本包括:(from versions: 0.0.1, 0.0.2, 0.0.3, 0.0.4, 0.0.5, 0.0.6, 0.0.7, 0.0.8, 0.0.9, 0.0.10, 0.0.11, 0.0.12, 0.0.13, 0.0.16rc424, 0.0.16rc425, 0.0.16, 0.0.17rc481, 0.0.17rc482, 0.0.17, 0.0.18, 0.0.19, 0.0.20, 0.0.21, 0.0.22.dev615, 0.0.22.dev616, 0.0.22.dev617, 0.0.22.dev627, 0.0.22.dev629)。

这篇关于Xformers介绍的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/338060

相关文章

java中BigDecimal里面的subtract函数介绍及实现方法

《java中BigDecimal里面的subtract函数介绍及实现方法》在Java中实现减法操作需要根据数据类型选择不同方法,主要分为数值型减法和字符串减法两种场景,本文给大家介绍java中BigD... 目录Java中BigDecimal里面的subtract函数的意思?一、数值型减法(高精度计算)1.

Pytorch介绍与安装过程

《Pytorch介绍与安装过程》PyTorch因其直观的设计、卓越的灵活性以及强大的动态计算图功能,迅速在学术界和工业界获得了广泛认可,成为当前深度学习研究和开发的主流工具之一,本文给大家介绍Pyto... 目录1、Pytorch介绍1.1、核心理念1.2、核心组件与功能1.3、适用场景与优势总结1.4、优

Java实现本地缓存的常用方案介绍

《Java实现本地缓存的常用方案介绍》本地缓存的代表技术主要有HashMap,GuavaCache,Caffeine和Encahche,这篇文章主要来和大家聊聊java利用这些技术分别实现本地缓存的方... 目录本地缓存实现方式HashMapConcurrentHashMapGuava CacheCaffe

Spring Security介绍及配置实现代码

《SpringSecurity介绍及配置实现代码》SpringSecurity是一个功能强大的Java安全框架,它提供了全面的安全认证(Authentication)和授权(Authorizatio... 目录简介Spring Security配置配置实现代码简介Spring Security是一个功能强

JSR-107缓存规范介绍

《JSR-107缓存规范介绍》JSR是JavaSpecificationRequests的缩写,意思是Java规范提案,下面给大家介绍JSR-107缓存规范的相关知识,感兴趣的朋友一起看看吧... 目录1.什么是jsR-1072.应用调用缓存图示3.JSR-107规范使用4.Spring 缓存机制缓存是每一

Java中 instanceof 的用法详细介绍

《Java中instanceof的用法详细介绍》在Java中,instanceof是一个二元运算符(类型比较操作符),用于检查一个对象是否是某个特定类、接口的实例,或者是否是其子类的实例,这篇文章... 目录引言基本语法基本作用1. 检查对象是否是指定类的实例2. 检查对象是否是子类的实例3. 检查对象是否

什么是ReFS 文件系统? ntfs和refs的优缺点区别介绍

《什么是ReFS文件系统?ntfs和refs的优缺点区别介绍》最近有用户在Win11Insider的安装界面中发现,可以使用ReFS来格式化硬盘,这是不是意味着,ReFS有望在未来成为W... 数十年以来,Windows 系统一直将 NTFS 作为「内置硬盘」的默认文件系统。不过近些年来,微软还在研发一款名

C#使用StackExchange.Redis实现分布式锁的两种方式介绍

《C#使用StackExchange.Redis实现分布式锁的两种方式介绍》分布式锁在集群的架构中发挥着重要的作用,:本文主要介绍C#使用StackExchange.Redis实现分布式锁的... 目录自定义分布式锁获取锁释放锁自动续期StackExchange.Redis分布式锁获取锁释放锁自动续期分布式

redis过期key的删除策略介绍

《redis过期key的删除策略介绍》:本文主要介绍redis过期key的删除策略,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录第一种策略:被动删除第二种策略:定期删除第三种策略:强制删除关于big key的清理UNLINK命令FLUSHALL/FLUSHDB命

Pytest多环境切换的常见方法介绍

《Pytest多环境切换的常见方法介绍》Pytest作为自动化测试的主力框架,如何实现本地、测试、预发、生产环境的灵活切换,本文总结了通过pytest框架实现自由环境切换的几种方法,大家可以根据需要进... 目录1.pytest-base-url2.hooks函数3.yml和fixture结论你是否也遇到过