教你用SadTalker一键整合包轻松制作专属数字人

2024-01-10 19:28

本文主要是介绍教你用SadTalker一键整合包轻松制作专属数字人,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

数字人的效果: 

🎵我用SadTalker制作了专属虚拟数字人,还会唱歌哦,多多点赞关注就出教程呦💗

SadTalker有独立离线版Ai数字人,也可以在Stable Diffusion以插件的形式使用,但是如果显卡小的话还是建议使用独立版,毕竟Stable Diffusion也要占用显卡。

我在逛B站时,找到了一键整合包,直接下载双击启动就可以使用,非常方便,那么安装包可以如下方式下载。

百度网盘:百度网盘 请输入提取码

夸克链接(不限速):https://pan.quark.cn/s/129af21d115d

B站:Ai应用分享站丨Danny

先说下我的显卡,大家参考下,我的显卡是6G,10秒内的音频转换数字人需要一分钟左右,我的显卡就不能选择高清了,选择高清就卡的不行。

 下载下来解压,目录内容如下:

我们进入SadTalker里的ffmpeg文件夹,这里我们需要按如下方式先配置下环境变量,

然后进入SadTalker目录里点击一键启动,弹出CMD,等待CMD里出现WEB UI的路径地址,复制地址到网页上就可以了。

界面如下,左部分是原文件上传,右上部分是进行数字人转换时参数的设置,右下部分是生成数字人后显示的地方。

素材准备

首先我们准备图片,可以真人,动漫都可以,最好是正面头像,(测试后最好是咧嘴微笑的照片口型更自然,紧闭双唇嘴部运动效果不明显,)有些图片效果不好,可以多换些图片,有的效果很好,然后图片可以是SD生成图片,也可以你本人照片,或者网图。

语音准备,我是在在线的文本转语音工具,这个工具还蛮不错的,不用登录什么的,可以直接使用,界面如下,

在线免费文字转语音 - TTSMaker官网 | 马克配音

 转换成功,可以点击下载文件到本地,全程不用其他登录注册操作,这点简直太棒了!

 

上传图片和声音直接点击生成,等待片刻,控制台就开始处理,

参数说明:

  • Pose style:视频人物的姿势,姿势变化种类。
  • face model resolution:视频分辨率,小显卡老老实实的256,我试过512界面直接卡的不行,而且生成时间比较长。
  • preprocess:图片处理方式,包括crop/resize/full/extcrop/extfull

          crop:从图片中截取头部生成视频

          resize:拉伸,适合大头照或证件照

          full:保留全身,全身照生成视频

          extcrop:加强版裁剪主要聚焦头部,试了下,小显卡效果还是不行

          extfull:加强版全身,试了下,小显卡效果还是不行

  • still mode:减少头部运动,负面效果就是头不怎么动了,按自己需求使用。
  • batch size in generation:同时处理数,越大处理越快,但是也废显存,看GPU能力。
  • GFPGAN as Face enhancer:修脸,基于gfpgan对视频增强。

 执行转换时的控制台,此时转换完毕。

 因为我们选择的默认的crop,所以就裁剪了头部,视频截图如下。

如果全身图的效果,就是眼睛效果不太好,一直有点眯眯眼,然后测试了多个发现微笑以及咧嘴笑的生成效果最好,嘴部说话效果最好。

 选择了resize就崩了,哈哈哈,但是这个分图片,有的图片选择resize就可以。

这篇关于教你用SadTalker一键整合包轻松制作专属数字人的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/591829

相关文章

SpringBoot整合OpenFeign的完整指南

《SpringBoot整合OpenFeign的完整指南》OpenFeign是由Netflix开发的一个声明式Web服务客户端,它使得编写HTTP客户端变得更加简单,本文为大家介绍了SpringBoot... 目录什么是OpenFeign环境准备创建 Spring Boot 项目添加依赖启用 OpenFeig

SpringBoot整合mybatisPlus实现批量插入并获取ID详解

《SpringBoot整合mybatisPlus实现批量插入并获取ID详解》这篇文章主要为大家详细介绍了SpringBoot如何整合mybatisPlus实现批量插入并获取ID,文中的示例代码讲解详细... 目录【1】saveBATch(一万条数据总耗时:2478ms)【2】集合方式foreach(一万条数

Spring Boot 整合 SSE的高级实践(Server-Sent Events)

《SpringBoot整合SSE的高级实践(Server-SentEvents)》SSE(Server-SentEvents)是一种基于HTTP协议的单向通信机制,允许服务器向浏览器持续发送实... 目录1、简述2、Spring Boot 中的SSE实现2.1 添加依赖2.2 实现后端接口2.3 配置超时时

Python实现特殊字符判断并去掉非字母和数字的特殊字符

《Python实现特殊字符判断并去掉非字母和数字的特殊字符》在Python中,可以通过多种方法来判断字符串中是否包含非字母、数字的特殊字符,并将这些特殊字符去掉,本文为大家整理了一些常用的,希望对大家... 目录1. 使用正则表达式判断字符串中是否包含特殊字符去掉字符串中的特殊字符2. 使用 str.isa

springboot整合阿里云百炼DeepSeek实现sse流式打印的操作方法

《springboot整合阿里云百炼DeepSeek实现sse流式打印的操作方法》:本文主要介绍springboot整合阿里云百炼DeepSeek实现sse流式打印,本文给大家介绍的非常详细,对大... 目录1.开通阿里云百炼,获取到key2.新建SpringBoot项目3.工具类4.启动类5.测试类6.测

使用Node.js制作图片上传服务的详细教程

《使用Node.js制作图片上传服务的详细教程》在现代Web应用开发中,图片上传是一项常见且重要的功能,借助Node.js强大的生态系统,我们可以轻松搭建高效的图片上传服务,本文将深入探讨如何使用No... 目录准备工作搭建 Express 服务器配置 multer 进行图片上传处理图片上传请求完整代码示例

使用Python实现一键隐藏屏幕并锁定输入

《使用Python实现一键隐藏屏幕并锁定输入》本文主要介绍了使用Python编写一个一键隐藏屏幕并锁定输入的黑科技程序,能够在指定热键触发后立即遮挡屏幕,并禁止一切键盘鼠标输入,这样就再也不用担心自己... 目录1. 概述2. 功能亮点3.代码实现4.使用方法5. 展示效果6. 代码优化与拓展7. 总结1.

macOS无效Launchpad图标轻松删除的4 种实用方法

《macOS无效Launchpad图标轻松删除的4种实用方法》mac中不在appstore上下载的应用经常在删除后它的图标还残留在launchpad中,并且长按图标也不会出现删除符号,下面解决这个问... 在 MACOS 上,Launchpad(也就是「启动台」)是一个便捷的 App 启动工具。但有时候,应

一文详解如何从零构建Spring Boot Starter并实现整合

《一文详解如何从零构建SpringBootStarter并实现整合》SpringBoot是一个开源的Java基础框架,用于创建独立、生产级的基于Spring框架的应用程序,:本文主要介绍如何从... 目录一、Spring Boot Starter的核心价值二、Starter项目创建全流程2.1 项目初始化(

Spring Boot 整合 MyBatis 连接数据库及常见问题

《SpringBoot整合MyBatis连接数据库及常见问题》MyBatis是一个优秀的持久层框架,支持定制化SQL、存储过程以及高级映射,下面详细介绍如何在SpringBoot项目中整合My... 目录一、基本配置1. 添加依赖2. 配置数据库连接二、项目结构三、核心组件实现(示例)1. 实体类2. Ma