AI克隆自己的声音只需5秒,MockingBird实现AI克隆声音!

2024-02-06 10:04

本文主要是介绍AI克隆自己的声音只需5秒,MockingBird实现AI克隆声音!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、环境搭建

  • 搭建Anaconda运行环境
    搭建Anaconda运行环境请跳转链接查看https://blog.csdn.net/m0_50269929/article/details/136036402
  • 安装pytorch
pip3 install torch torchvision torchaudio

在这里插入图片描述

  • 安装ffmpeg
    打开官网
    https://ffmpeg.org/download.html#get-packages
    在这里插入图片描述
    下载地址
    https://github.com/BtbN/FFmpeg-Builds/releases
    在这里插入图片描述
    下载过程有点慢,建议操作下一步开通代理后处理加速下载问题
    在这里插入图片描述
    解压项目到对应安装目录下
    在这里插入图片描述在这里插入图片描述

解压完成后,把bin 目录放到系统环境变量中
D:\APP\ffmpeg-master-latest-win64-gpl\bin
在这里插入图片描述
ffmpeg -version查看是否配置成功
在这里插入图片描述

  • 下载MockingBird源码
    git clone https://github.com/babysor/MockingBird.git
    下载时可能网速不是很好或者连不上,自己可以代理下网络。
    推荐fastgithub_win-x64这个代理下,自行去开源网站也能找到。也可以使用我这边提供的迅雷下载链接:https://pan.xunlei.com/s/VNpr2zhMZVwS0oRu67kYWvPCA1?pwd=2f8j
    在这里插入图片描述
    下载完解压运行
    在这里插入图片描述
    在这里插入图片描述
    再次执行代码克隆git clone https://github.com/babysor/MockingBird.git发现就能克隆成功了。
    在这里插入图片描述
  • 安装requirements
    进入下载完成MockingBird的源码目录
    在这里插入图片描述
    输入cmd回车
    在这里插入图片描述
    使用pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt下载(使用清华镜像下载提升速度)
    等待下载完成
    在这里插入图片描述

下载时可能会报错
ERROR: Ignored the following versions that require a different python version: 0.55.2 Requires-Python < 3.5
ERROR: Could not find a version that satisfies the requirement monotonic-align0.0.3 (from versions: 1.0.0)
ERROR: No matching distribution found for monotonic-align
0.0.3
在MockingBird目录下打开文件requirements.txt
在这里插入图片描述
修改值monotonic-align==1.0.0在这里插入图片描述
使用pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt下载
安装出现问题图下
在这里插入图片描述
解决方案
https://visualstudio.microsoft.com/visual-cpp-build-tools/ 下载生成工具
在这里插入图片描述
等待安装完成
在这里插入图片描述
安装完成执行再次 使用pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt下载

发现还存在一个问题
在这里插入图片描述
成功截图如下
在这里插入图片描述

  • 下载预训练模型
    https://github.com/babysor/MockingBird
    在这里插入图片描述
    导入模型
    在这里插入图片描述
  • 运行

python demo_toolbox.py
在这里插入图片描述

这篇关于AI克隆自己的声音只需5秒,MockingBird实现AI克隆声音!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/683959

相关文章

python+OpenCV反投影图像的实现示例详解

《python+OpenCV反投影图像的实现示例详解》:本文主要介绍python+OpenCV反投影图像的实现示例详解,本文通过实例代码图文并茂的形式给大家介绍的非常详细,感兴趣的朋友一起看看吧... 目录一、前言二、什么是反投影图像三、反投影图像的概念四、反向投影的工作原理一、利用反向投影backproj

Django之定时任务django-crontab的实现

《Django之定时任务django-crontab的实现》Django可以使用第三方库如django-crontab来实现定时任务的调度,本文主要介绍了Django之定时任务django-cront... 目录crontab安装django-crontab注册应用定时时间格式定时时间示例设置定时任务@符号

Python中edge-tts实现便捷语音合成

《Python中edge-tts实现便捷语音合成》edge-tts是一个功能强大的Python库,支持多种语言和声音选项,本文主要介绍了Python中edge-tts实现便捷语音合成,具有一定的参考价... 目录安装与环境设置文本转语音查找音色更改语音参数生成音频与字幕总结edge-tts 是一个功能强大的

Java实现按字节长度截取字符串

《Java实现按字节长度截取字符串》在Java中,由于字符串可能包含多字节字符,直接按字节长度截取可能会导致乱码或截取不准确的问题,下面我们就来看看几种按字节长度截取字符串的方法吧... 目录方法一:使用String的getBytes方法方法二:指定字符编码处理方法三:更精确的字符编码处理使用示例注意事项方

使用Python和PaddleOCR实现图文识别的代码和步骤

《使用Python和PaddleOCR实现图文识别的代码和步骤》在当今数字化时代,图文识别技术的应用越来越广泛,如文档数字化、信息提取等,PaddleOCR是百度开源的一款强大的OCR工具包,它集成了... 目录一、引言二、环境准备2.1 安装 python2.2 安装 PaddlePaddle2.3 安装

嵌入式Linux之使用设备树驱动GPIO的实现方式

《嵌入式Linux之使用设备树驱动GPIO的实现方式》:本文主要介绍嵌入式Linux之使用设备树驱动GPIO的实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录一、设备树配置1.1 添加 pinctrl 节点1.2 添加 LED 设备节点二、编写驱动程序2.1

Android 实现一个隐私弹窗功能

《Android实现一个隐私弹窗功能》:本文主要介绍Android实现一个隐私弹窗功能,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友一起看看吧... 效果图如下:1. 设置同意、退出、点击用户协议、点击隐私协议的函数参数2. 《用户协议》、《隐私政策》设置成可点击的,且颜色要区分出来res/l

spring IOC的理解之原理和实现过程

《springIOC的理解之原理和实现过程》:本文主要介绍springIOC的理解之原理和实现过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、IoC 核心概念二、核心原理1. 容器架构2. 核心组件3. 工作流程三、关键实现机制1. Bean生命周期2.

Redis实现分布式锁全解析之从原理到实践过程

《Redis实现分布式锁全解析之从原理到实践过程》:本文主要介绍Redis实现分布式锁全解析之从原理到实践过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、背景介绍二、解决方案(一)使用 SETNX 命令(二)设置锁的过期时间(三)解决锁的误删问题(四)Re

Java根据IP地址实现归属地获取

《Java根据IP地址实现归属地获取》Ip2region是一个离线IP地址定位库和IP定位数据管理框架,这篇文章主要为大家详细介绍了Java如何使用Ip2region实现根据IP地址获取归属地,感兴趣... 目录一、使用Ip2region离线获取1、Ip2region简介2、导包3、下编程载xdb文件4、J