推荐大模型书籍|《扩散模型从原理到实战》,大模型爱好者有福了!!

2024-08-29 15:04

本文主要是介绍推荐大模型书籍|《扩散模型从原理到实战》,大模型爱好者有福了!!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

**(https://i-blog.csdnimg.cn/direct/01b32b1893df4d0fb707a9246e4ce998.png)**

本书特点

本书内容基于 Hugging Face 的 Diffusion课程。无需读者具备专业绘画技能,**扩散模型能够快速让创意变为现实!**加速创作过程,拓展创作表达的可能性。

易学实用

以扩散模型理论知识为切入点,深入介绍了扩散模型生成图像的相关知识与实战案例,赠送配套Diffusion视频课程。

案例众多

配套大量案例(Stable Diffusion、ControlNet),帮你快速熟悉扩散模型。

注重效率

清晰的代码结构与代码注释,帮你快速实现扩散模型生成精美图像。

GitHub课程链接:https://github.com/huggingface/diffusion-models-class

PDF书籍: 完整版本链接获取

👉[CSDN大礼包🎁:《扩散模型从原理到实战》免费分享(安全链接,放心点击)]👈

作者介绍

李忻玮

RTE社区高级布道师,硕士毕业于美国常春藤盟校之一的哥伦比亚大学数据科学专业,现任声网人工智能算法工程师;主要研究方向是生成式人工智能、计算机视觉、自然语言处理、提示工程等。

苏步升

扩散模型算法工程师,AIGC创业者,Hugging Face中国社区本地化工作组成员。

徐浩然

毕业于中国海洋大学电子信息工程专业,现任声网音频算法工程师,从事扬声器声学设计、音频增强算法、音频质量评估算法等研究工作。

余海铭

本科毕业于暨南大学,硕士毕业于加州大学尔湾分校;先后在中国科学院深圳先进技术研究院、爱奇艺、美团等单位工作;主要研究方向是图像识别、图像生成、多模态及自动驾驶等领域。

大咖联袂推荐

本书系统地介绍了扩散模型的原理和相关细节,同时书中丰富的实战案例也将引领读者快速上手扩散模型。对于任何想要学习和了解扩散模型的人来说,本书都是颇具价值的参考资料。

目录 · · · · · ·

第1章 扩散模型简介

1.1 扩散模型的原理 1
1.1.1 生成模型 1
1.1.2 扩散过程 2
1.2 扩散模型的发展 5
1.2.1 开始扩散:基础扩散模型的提出与改进 6
1.2.2 加速生成:采样器 6
1.2.3 刷新纪录:基于显式分类器引导的扩散模型 7
1.2.4 引爆网络:基于CLIP的多模态图像生成 8
1.2.5 再次“出圈”:大模型的“再学习”方法——DreamBooth、LoRA和ControlNet 8
1.2.6 开启AI作画时代:众多商业公司提出成熟的图像生成解决方案 10
1.3 扩散模型的应用 12
1.3.1 计算机视觉  12
1.3.2 时序数据预测 14
1.3.3 自然语言 15
1.3.4 基于文本的多模态 16
1.3.5 AI基础科学 19

第2章 Hugging Face简介

2.1 Hugging Face核心功能介绍 21
2.2 Hugging Face开源库 28
2.3 Gradio工具介绍 30

第3章 从零开始搭建扩散模型

3.1 环境准备 33
3.1.1 环境的创建与导入 33
3.1.2 数据集测试 34
3.2 扩散模型之退化过程 34
3.3 扩散模型之训练 36
3.3.1  UNet网络 36
3.3.2 开始训练模型 38
3.4 扩散模型之采样过程 41
3.4.1 采样过程 41
3.4.2 与DDPM的区别 44
3.4.3 UNet2DModel模型 44
3.5 扩散模型之退化过程示例 57
3.5.1 退化过程 57
3.5.2 最终的训练目标 59
3.6 拓展知识 60
3.6.1 时间步的调节 60
3.6.2 采样(取样)的关键问题 61
3.7 本章小结 61

第4章 Diffusers实战

4.1 环境准备 62
4.1.1 安装Diffusers库 62
4.1.2 DreamBooth 64
4.1.3 Diffusers核心API 66
4.2 实战:生成美丽的蝴蝶图像 67
4.2.1 下载蝴蝶图像集 67
4.2.2 扩散模型之调度器 69
4.2.3 定义扩散模型 70
4.2.4 创建扩散模型训练循环 72
4.2.5 图像的生成 75
4.3 拓展知识 77
4.3.1 将模型上传到Hugging Face Hub  77
4.3.2 使用Accelerate库扩大训练模型的规模 79
4.4 本章小结 81

第5章 微调和引导

5.1 环境准备 86
5.2 载入一个预训练过的管线 87
5.3 DDIM——更快的采样过程 88
5.4 扩散模型之微调 91
5.4.1 实战:微调 91
5.4.2 使用一个最小化示例程序来微调模型 96
5.4.3 保存和载入微调过的管线 97
5.5 扩散模型之引导 98
5.5.1 实战:引导 100
5.5.2 CLIP引导 104
5.6 分享你的自定义采样训练 108
5.7 实战:创建一个类别条件扩散模型 111
5.7.1 配置和数据准备 111
5.7.2 创建一个以类别为条件的UNet模型 112
5.7.3 训练和采样 114
5.8 本章小结 117

第6章 Stable Diffusion

6.1 基本概念 118
6.1.1 隐式扩散 118
6.1.2 以文本为生成条件 119
6.1.3 无分类器引导 121
6.1.4 其他类型的条件生成模型:Img2Img、Inpainting与Depth2Img模型  122
6.1.5 使用DreamBooth进行微调 123
6.2 环境准备 124
6.3 从文本生成图像 125
6.4 Stable Diffusion Pipeline 128
6.4.1 可变分自编码器 128
6.4.2 分词器和文本编码器 129
6.4.3 UNet 131
6.4.4 调度器 132
6.4.5 DIY采样循环 134
6.5 其他管线介绍 136
6.5.1 Img2Img 136
6.5.2 Inpainting 138
6.5.3 Depth2Image 139
6.6 本章小结 140

第7章 DDIM反转

7.1 实战:反转 141
7.1.1 配置 141
7.1.2 载入一个预训练过的管线 142
7.1.3 DDIM采样 143
7.1.4 反转 147
7.2 组合封装 153
7.3 ControlNet的结构与训练过程 158
7.4 ControlNet示例 162
7.4.1 ControlNet与Canny Edge 162
7.4.2 ControlNet与M-LSD Lines 162
7.4.3 ControlNet与HED Boundary 163
7.4.4 ControlNet与涂鸦画 164
7.4.5 ControlNet与人体关键点 164
7.4.6 ControlNet与语义分割 164
7.5 ControlNet实战 165
7.6 本章小结 174

第8章 音频扩散模型

8.1 实战:音频扩散模型 175
8.1.1 设置与导入 175
8.1.2 在预训练的音频扩散模型管线中进行采样 176
8.1.3 从音频到频谱的转换 177
8.1.4 微调管线 180
8.1.5 训练循环 183
8.2 将模型上传到Hugging Face Hub 186
8.3 本章小结 187
附录A 精美图像集展示 188
附录B Hugging Face相关资源 202

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

这本大模型《扩散模型从原理到实战》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

PDF书籍: 完整版本链接获取

👉[CSDN大礼包🎁:《扩散模型从原理到实战》免费分享(安全链接,放心点击)]👈

这篇关于推荐大模型书籍|《扩散模型从原理到实战》,大模型爱好者有福了!!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1118197

相关文章

Java中流式并行操作parallelStream的原理和使用方法

《Java中流式并行操作parallelStream的原理和使用方法》本文详细介绍了Java中的并行流(parallelStream)的原理、正确使用方法以及在实际业务中的应用案例,并指出在使用并行流... 目录Java中流式并行操作parallelStream0. 问题的产生1. 什么是parallelS

Java中Redisson 的原理深度解析

《Java中Redisson的原理深度解析》Redisson是一个高性能的Redis客户端,它通过将Redis数据结构映射为Java对象和分布式对象,实现了在Java应用中方便地使用Redis,本文... 目录前言一、核心设计理念二、核心架构与通信层1. 基于 Netty 的异步非阻塞通信2. 编解码器三、

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Python版本信息获取方法详解与实战

《Python版本信息获取方法详解与实战》在Python开发中,获取Python版本号是调试、兼容性检查和版本控制的重要基础操作,本文详细介绍了如何使用sys和platform模块获取Python的主... 目录1. python版本号获取基础2. 使用sys模块获取版本信息2.1 sys模块概述2.1.1

Redis中Hash从使用过程到原理说明

《Redis中Hash从使用过程到原理说明》RedisHash结构用于存储字段-值对,适合对象数据,支持HSET、HGET等命令,采用ziplist或hashtable编码,通过渐进式rehash优化... 目录一、开篇:Hash就像超市的货架二、Hash的基本使用1. 常用命令示例2. Java操作示例三

Redis中Set结构使用过程与原理说明

《Redis中Set结构使用过程与原理说明》本文解析了RedisSet数据结构,涵盖其基本操作(如添加、查找)、集合运算(交并差)、底层实现(intset与hashtable自动切换机制)、典型应用场... 目录开篇:从购物车到Redis Set一、Redis Set的基本操作1.1 编程常用命令1.2 集

Redis中的有序集合zset从使用到原理分析

《Redis中的有序集合zset从使用到原理分析》Redis有序集合(zset)是字符串与分值的有序映射,通过跳跃表和哈希表结合实现高效有序性管理,适用于排行榜、延迟队列等场景,其时间复杂度低,内存占... 目录开篇:排行榜背后的秘密一、zset的基本使用1.1 常用命令1.2 Java客户端示例二、zse

Redis中的AOF原理及分析

《Redis中的AOF原理及分析》Redis的AOF通过记录所有写操作命令实现持久化,支持always/everysec/no三种同步策略,重写机制优化文件体积,与RDB结合可平衡数据安全与恢复效率... 目录开篇:从日记本到AOF一、AOF的基本执行流程1. 命令执行与记录2. AOF重写机制二、AOF的

Python爬虫HTTPS使用requests,httpx,aiohttp实战中的证书异步等问题

《Python爬虫HTTPS使用requests,httpx,aiohttp实战中的证书异步等问题》在爬虫工程里,“HTTPS”是绕不开的话题,HTTPS为传输加密提供保护,同时也给爬虫带来证书校验、... 目录一、核心问题与优先级检查(先问三件事)二、基础示例:requests 与证书处理三、高并发选型:

java程序远程debug原理与配置全过程

《java程序远程debug原理与配置全过程》文章介绍了Java远程调试的JPDA体系,包含JVMTI监控JVM、JDWP传输调试命令、JDI提供调试接口,通过-Xdebug、-Xrunjdwp参数配... 目录背景组成模块间联系IBM对三个模块的详细介绍编程使用总结背景日常工作中,每个程序员都会遇到bu