字节开源 FLUX Dev 的 Haper SD Lora,只需要 8 步或者 16 步就可以用 FLUX 生成图片! 文章附模型下载链接

本文主要是介绍字节开源 FLUX Dev 的 Haper SD Lora,只需要 8 步或者 16 步就可以用 FLUX 生成图片! 文章附模型下载链接,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

2024 年 8 月 26 日,字节开源了 FLUX Dev 的 Haper SD Lora。 只需要 8 步或者 16 步就可以用 FLUX 生成图片,大幅减少 FLUX 的生成时间。

建议 LoRA 比例约为 0.125,该比例可适应训练和指导,比例可保持在 3.5。较低步骤的 LoRA 即将推出。

大家可以点击下面文章链接, 文章包含模型下载链接,试用地址,项目介绍等,也欢迎大家关注公众号AIGC Studio。

字节开源 FLUX Dev 的 Haper SD Lora,只需要 8 步或者 16 步就可以用 FLUX 生成图片!

为了让更多的人体验到Hyper SD Lora的神奇效果,字节跳动在Huggingface上设立了演示空间。在这里可以直观地感受到FLUX8步Lora的绘图效果,亲眼见证AI绘图技术的飞跃。

相关链接

论文地址:https://arxiv.org/pdf/2404.13686 项目地址:https://hyper-sd.github.io/

模型链接:https://huggingface.co/ByteDance/Hyper-SD

试用地址:https://huggingface.co/spaces/ByteDance/Hyper-FLUX-8Steps-LoRA

论文阅读

Hyper-SD:用于高效图像合成的轨迹分段一致性模型

摘要

最近,出现了一系列考虑扩散的蒸馏算法,以减轻与扩散模型 (DM) 的多步推理过程相关的计算开销。当前的蒸馏技术通常分为两个不同的方面:i)ODE 轨迹保存;ii)ODE 轨迹重构。然而,这些方法存在严重的性能下降或领域转移。

为了解决这些限制,我们提出了Hyper-SD,这是一个新颖的框架,它协同融合了 ODE 轨迹保存和重构的优点,同时在步骤压缩期间保持近乎无损的性能。首先,我们引入轨迹分段一致性蒸馏,以在预定义的时间步长段内逐步执行一致性蒸馏,这有助于从高阶角度保留原始 ODE 轨迹。其次,我们结合人工反馈学习来提高模型在低步长范围内的性能,并减轻蒸馏过程造成的性能损失。第三,我们集成了分数蒸馏,以进一步提高模型的低步生成能力,并首次尝试利用统一的 LoRA 支持所有步骤的推理过程。

大量实验和用户研究表明,对于 SDXL 和 SD1.5,Hyper-SD 在 1 到 8 个推理步骤中都实现了 SOTA 性能。例如,在 1 步推理中,Hyper-SDXL 在 CLIP 分数上超过 SDXL-Lightning +0.68 ,在 Aes 分数上 超过 +0.51 。

方法

Hyper-SD 采用两阶段渐进式一致性蒸馏。第一阶段在两个不同的时间段 [0, T/2] 和 [T/2 , T] 进行一致性蒸馏,以获得两段一致性 ODE。然后,在后续阶段采用此 ODE 轨迹来训练全局一致性模型。

实验

Hyper-SD 与其他方法之间的视觉比较。从第一列到第四列,这些图像的提示分别是

  1. 一只穿着白色 T 恤的狗,上面写着 "hyper" 一词…

  2. 抽象美、接近完美、纯粹的形式、黄金比例、简约、未完成…

  3. 一颗水晶心躺在宁静的禅宗花园的苔藓上……

  4. 科学家雄鹿的拟人化艺术,维多利亚风格的服装,由 krenz cushart 创作...。

Hyper-SD 与 SDXL 架构上其他基于 LoRA 的加速方法之间的定性比较。

Hyper-SD 与其他基于 LoRA 的加速方法在 SD15 架构上的定性比较。

Hyper-SD 与现有的专注于加速的方法相比表现出了显著的优势,并在 SD1.5 和 SDXL 架构上获得了更多的用户偏好。

具有不同步骤的 Hyper-SD LoRA 可应用于不同的基础模型,并持续生成高质量图像

Hyper-SD 的统一 LoRA 与 ControlNet 兼容。示例以涂鸦或精明图像为条件。

结论

我们提出了 Hyper-SD,这是一个统一的框架,可最大限度地提高扩散模型的几步生成能力,在 SDXL 和 SD15 的基础上实现了新的 SOTA 性能。通过采用轨迹分段一致性蒸馏,我们增强了蒸馏过程中的轨迹保存能力,接近原始模型的生成能力。然后,人工反馈学习和变分分数蒸馏激发了少步推理的潜力,从而为生成模型提供了更优化和更高效的轨迹。我们为 SDXL 和 SD15 开源了从 1 到 8 步推理的 LoRA,以及专用的一步 SDXL 模型,旨在进一步推动生成 AI 社区的发展。

这篇关于字节开源 FLUX Dev 的 Haper SD Lora,只需要 8 步或者 16 步就可以用 FLUX 生成图片! 文章附模型下载链接的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1117528

相关文章

Java实现字节字符转bcd编码

《Java实现字节字符转bcd编码》BCD是一种将十进制数字编码为二进制的表示方式,常用于数字显示和存储,本文将介绍如何在Java中实现字节字符转BCD码的过程,需要的小伙伴可以了解下... 目录前言BCD码是什么Java实现字节转bcd编码方法补充总结前言BCD码(Binary-Coded Decima

Java使用Javassist动态生成HelloWorld类

《Java使用Javassist动态生成HelloWorld类》Javassist是一个非常强大的字节码操作和定义库,它允许开发者在运行时创建新的类或者修改现有的类,本文将简单介绍如何使用Javass... 目录1. Javassist简介2. 环境准备3. 动态生成HelloWorld类3.1 创建CtC

Java实现将HTML文件与字符串转换为图片

《Java实现将HTML文件与字符串转换为图片》在Java开发中,我们经常会遇到将HTML内容转换为图片的需求,本文小编就来和大家详细讲讲如何使用FreeSpire.DocforJava库来实现这一功... 目录前言核心实现:html 转图片完整代码场景 1:转换本地 HTML 文件为图片场景 2:转换 H

Java实现在Word文档中添加文本水印和图片水印的操作指南

《Java实现在Word文档中添加文本水印和图片水印的操作指南》在当今数字时代,文档的自动化处理与安全防护变得尤为重要,无论是为了保护版权、推广品牌,还是为了在文档中加入特定的标识,为Word文档添加... 目录引言Spire.Doc for Java:高效Word文档处理的利器代码实战:使用Java为Wo

基于C#实现PDF转图片的详细教程

《基于C#实现PDF转图片的详细教程》在数字化办公场景中,PDF文件的可视化处理需求日益增长,本文将围绕Spire.PDFfor.NET这一工具,详解如何通过C#将PDF转换为JPG、PNG等主流图片... 目录引言一、组件部署二、快速入门:PDF 转图片的核心 C# 代码三、分辨率设置 - 清晰度的决定因

Python从Word文档中提取图片并生成PPT的操作代码

《Python从Word文档中提取图片并生成PPT的操作代码》在日常办公场景中,我们经常需要从Word文档中提取图片,并将这些图片整理到PowerPoint幻灯片中,手动完成这一任务既耗时又容易出错,... 目录引言背景与需求解决方案概述代码解析代码核心逻辑说明总结引言在日常办公场景中,我们经常需要从 W

使用Python实现无损放大图片功能

《使用Python实现无损放大图片功能》本文介绍了如何使用Python的Pillow库进行无损图片放大,区分了JPEG和PNG格式在放大过程中的特点,并给出了示例代码,JPEG格式可能受压缩影响,需先... 目录一、什么是无损放大?二、实现方法步骤1:读取图片步骤2:无损放大图片步骤3:保存图片三、示php

Python多线程实现大文件快速下载的代码实现

《Python多线程实现大文件快速下载的代码实现》在互联网时代,文件下载是日常操作之一,尤其是大文件,然而,网络条件不稳定或带宽有限时,下载速度会变得很慢,本文将介绍如何使用Python实现多线程下载... 目录引言一、多线程下载原理二、python实现多线程下载代码说明:三、实战案例四、注意事项五、总结引

C#使用Spire.XLS快速生成多表格Excel文件

《C#使用Spire.XLS快速生成多表格Excel文件》在日常开发中,我们经常需要将业务数据导出为结构清晰的Excel文件,本文将手把手教你使用Spire.XLS这个强大的.NET组件,只需几行C#... 目录一、Spire.XLS核心优势清单1.1 性能碾压:从3秒到0.5秒的质变1.2 批量操作的优雅

Python使用python-pptx自动化操作和生成PPT

《Python使用python-pptx自动化操作和生成PPT》这篇文章主要为大家详细介绍了如何使用python-pptx库实现PPT自动化,并提供实用的代码示例和应用场景,感兴趣的小伙伴可以跟随小编... 目录使用python-pptx操作PPT文档安装python-pptx基础概念创建新的PPT文档查看