教你用SadTalker一键整合包轻松制作专属数字人

2024-01-10 19:28

本文主要是介绍教你用SadTalker一键整合包轻松制作专属数字人,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

数字人的效果: 

🎵我用SadTalker制作了专属虚拟数字人,还会唱歌哦,多多点赞关注就出教程呦💗

SadTalker有独立离线版Ai数字人,也可以在Stable Diffusion以插件的形式使用,但是如果显卡小的话还是建议使用独立版,毕竟Stable Diffusion也要占用显卡。

我在逛B站时,找到了一键整合包,直接下载双击启动就可以使用,非常方便,那么安装包可以如下方式下载。

百度网盘:百度网盘 请输入提取码

夸克链接(不限速):https://pan.quark.cn/s/129af21d115d

B站:Ai应用分享站丨Danny

先说下我的显卡,大家参考下,我的显卡是6G,10秒内的音频转换数字人需要一分钟左右,我的显卡就不能选择高清了,选择高清就卡的不行。

 下载下来解压,目录内容如下:

我们进入SadTalker里的ffmpeg文件夹,这里我们需要按如下方式先配置下环境变量,

然后进入SadTalker目录里点击一键启动,弹出CMD,等待CMD里出现WEB UI的路径地址,复制地址到网页上就可以了。

界面如下,左部分是原文件上传,右上部分是进行数字人转换时参数的设置,右下部分是生成数字人后显示的地方。

素材准备

首先我们准备图片,可以真人,动漫都可以,最好是正面头像,(测试后最好是咧嘴微笑的照片口型更自然,紧闭双唇嘴部运动效果不明显,)有些图片效果不好,可以多换些图片,有的效果很好,然后图片可以是SD生成图片,也可以你本人照片,或者网图。

语音准备,我是在在线的文本转语音工具,这个工具还蛮不错的,不用登录什么的,可以直接使用,界面如下,

在线免费文字转语音 - TTSMaker官网 | 马克配音

 转换成功,可以点击下载文件到本地,全程不用其他登录注册操作,这点简直太棒了!

 

上传图片和声音直接点击生成,等待片刻,控制台就开始处理,

参数说明:

  • Pose style:视频人物的姿势,姿势变化种类。
  • face model resolution:视频分辨率,小显卡老老实实的256,我试过512界面直接卡的不行,而且生成时间比较长。
  • preprocess:图片处理方式,包括crop/resize/full/extcrop/extfull

          crop:从图片中截取头部生成视频

          resize:拉伸,适合大头照或证件照

          full:保留全身,全身照生成视频

          extcrop:加强版裁剪主要聚焦头部,试了下,小显卡效果还是不行

          extfull:加强版全身,试了下,小显卡效果还是不行

  • still mode:减少头部运动,负面效果就是头不怎么动了,按自己需求使用。
  • batch size in generation:同时处理数,越大处理越快,但是也废显存,看GPU能力。
  • GFPGAN as Face enhancer:修脸,基于gfpgan对视频增强。

 执行转换时的控制台,此时转换完毕。

 因为我们选择的默认的crop,所以就裁剪了头部,视频截图如下。

如果全身图的效果,就是眼睛效果不太好,一直有点眯眯眼,然后测试了多个发现微笑以及咧嘴笑的生成效果最好,嘴部说话效果最好。

 选择了resize就崩了,哈哈哈,但是这个分图片,有的图片选择resize就可以。

这篇关于教你用SadTalker一键整合包轻松制作专属数字人的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/591829

相关文章

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

C#实现一键批量合并PDF文档

《C#实现一键批量合并PDF文档》这篇文章主要为大家详细介绍了如何使用C#实现一键批量合并PDF文档功能,文中的示例代码简洁易懂,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言效果展示功能实现1、添加文件2、文件分组(书签)3、定义页码范围4、自定义显示5、定义页面尺寸6、PDF批量合并7、其他方法

Spring Boot 整合 SSE(Server-Sent Events)实战案例(全网最全)

《SpringBoot整合SSE(Server-SentEvents)实战案例(全网最全)》本文通过实战案例讲解SpringBoot整合SSE技术,涵盖实现原理、代码配置、异常处理及前端交互,... 目录Spring Boot 整合 SSE(Server-Sent Events)1、简述SSE与其他技术的对

Java整合Protocol Buffers实现高效数据序列化实践

《Java整合ProtocolBuffers实现高效数据序列化实践》ProtocolBuffers是Google开发的一种语言中立、平台中立、可扩展的结构化数据序列化机制,类似于XML但更小、更快... 目录一、Protocol Buffers简介1.1 什么是Protocol Buffers1.2 Pro

Python脚本轻松实现检测麦克风功能

《Python脚本轻松实现检测麦克风功能》在进行音频处理或开发需要使用麦克风的应用程序时,确保麦克风功能正常是非常重要的,本文将介绍一个简单的Python脚本,能够帮助我们检测本地麦克风的功能,需要的... 目录轻松检测麦克风功能脚本介绍一、python环境准备二、代码解析三、使用方法四、知识扩展轻松检测麦

springboot整合mqtt的步骤示例详解

《springboot整合mqtt的步骤示例详解》MQTT(MessageQueuingTelemetryTransport)是一种轻量级的消息传输协议,适用于物联网设备之间的通信,本文介绍Sprin... 目录1、引入依赖包2、yml配置3、创建配置4、自定义注解6、使用示例使用场景:mqtt可用于消息发

基于Python实现数字限制在指定范围内的五种方式

《基于Python实现数字限制在指定范围内的五种方式》在编程中,数字范围限制是常见需求,无论是游戏开发中的角色属性值、金融计算中的利率调整,还是传感器数据处理中的异常值过滤,都需要将数字控制在合理范围... 目录引言一、基础条件判断法二、数学运算巧解法三、装饰器模式法四、自定义类封装法五、NumPy数组处理

小白也能轻松上手! 路由器设置优化指南

《小白也能轻松上手!路由器设置优化指南》在日常生活中,我们常常会遇到WiFi网速慢的问题,这主要受到三个方面的影响,首要原因是WiFi产品的配置优化不合理,其次是硬件性能的不足,以及宽带线路本身的质... 在数字化时代,网络已成为生活必需品,追剧、游戏、办公、学习都离不开稳定高速的网络。但很多人面对新路由器

SpringBoot+EasyPOI轻松实现Excel和Word导出PDF

《SpringBoot+EasyPOI轻松实现Excel和Word导出PDF》在企业级开发中,将Excel和Word文档导出为PDF是常见需求,本文将结合​​EasyPOI和​​Aspose系列工具实... 目录一、环境准备与依赖配置1.1 方案选型1.2 依赖配置(商业库方案)二、Excel 导出 PDF

SpringBoot整合Dubbo+ZK注册失败的坑及解决

《SpringBoot整合Dubbo+ZK注册失败的坑及解决》使用Dubbo框架时,需在公共pom添加依赖,启动类加@EnableDubbo,实现类用@DubboService替代@Service,配... 目录1.先看下公共的pom(maven创建的pom工程)2.启动类上加@EnableDubbo3.实