ChatTTS增强版V3【已开源】,长文本修复,中英混读,导入音色,批量SRT、TXT

本文主要是介绍ChatTTS增强版V3【已开源】,长文本修复,中英混读,导入音色,批量SRT、TXT,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

ChatTTS增强版V3来啦!本次更新增加支持导入SRT、导入音色等功能。结合上次大家反馈的问题,修复了长文本、中英混读等问题。

项目已开源(https://github.com/CCmahua/ChatTTS-Enhanced)

项目介绍

V3

ChatTTS增强版V3,长文本修复,中英混读,导入音色,批量SRT、TXT,代码开源_哔哩哔哩_bilibili

V2

ChatTTS增强版V2,批量导出srt,语速控制,情感控制,支持朗读数字,问题修复_哔哩哔哩_bilibili

V1

ChatTTS增强版整合包,增强音质、批量处理、固定音色、支持长文本(WIN、MAC)_哔哩哔哩_bilibili

更新内容

批量SRT、TXT

批量功能新增支持多个TXT文本或SRT批量导入,会针对每文件进行处理。并支持导出对应SRT。

TXT文本内容格式不用严格按照换行的来。

你可以按照之前换行的格式来。

也可以直接所有内容文本粘进去,会自动根据标点符号进行切分。

长文本

不少朋友反馈上个版本长文本的问题很多,这个版本进行调整。文本内容会自动按照标点符号进行断句。

(音频效果)

英文效果

(音频效果)

中英混读

(效果)

文本选项

删除了之前数字转换选项、合成整个音频的选项。

数字转换已经内置进去,无需手动勾选。合成整个音频默认自动合成。

导出的完整的音频路径为:output_audio/你的txt名/合并/

导出的音频切片路径为:output_audio/你的txt名/切片/

导出的增强音频切片路径为:output_audio/你的txt名/增强切片/

音色选项

新增上传音色功能。

支持导入ChatTTS_Speaker项目的.pt音色文件。

项目地址:

https://modelscope.cn/studios/ttwwwaa/ChatTTS_Speaker

在该项目上试听音色,下载.pt文件

音色这里把.pt文件上传。

点击生成即可。

配置管理

之前的配置文件格式是.json。这个版本统一保存为.pt格式。

📢注意

当你使用ChatTTS_Speaker的音色pt文件时,也可以保存配置文件。

下次使用时,只需要选择配置文件即可,无需再上传音色。配置文件包含音色文件信息。

配置要求

以下是整合包运行所需配置

WIN

  • Windwos10/11操作系统
  • 支持CPU/GPU

MAC

  • Apple Silicon M系列芯片、Intel 芯片
  • MacOS 10.13以上版本

云端版本

适用于机器配置低的朋友,云端镜像一键部署。

https://www.xiangongyun.com/image/detail/f086c8d6-a802-4a94-b3b5-f4e2f0e2d631?r=2UKFZQ

云端部署教程

关于显存,最低4G显存(不开启音频增强的情况下)

关于MAC显卡:官方更新了MPS相关代码,但我测下来还有些问题,后面再增加支持,所以现在还是先用CPU。

整合包获取

👇🏻👇🏻👇🏻下方下方下方👇🏻👇🏻👇🏻

关注公众号,发送【ChatTTSV3】关键字获取整合包。

c9d252d6c546419798a870adf532fec3.png

如果发了关键词没回复你!记得看下复制的时候是不是把空格给粘贴进去了!

写在最后

最近有点忙,拖了2周左右。看到后台有很多朋友的想法和建议,很不错,但是精力有限,实在不能保证把大家的想法都更上去,后面抽时间慢慢更。

把项目代码开源了,希望对大家有帮助,有能力的也可以自行修改。

本项目开源地址:https://github.com/CCmahua/ChatTTS-Enhanced

最后感谢以下项目:

ChatTTS:https://github.com/2noise/ChatTTS

Resemble Enhance:https://github.com/resemble-ai/resemble-enhance

ChatTTS_colab:https://github.com/6drf21e/ChatTTS_colab

PaddleSpeech:https://github.com/PaddlePaddle/PaddleSpeech

ChatTTS_Speaker:https://github.com/6drf21e/ChatTTS_Speaker

WeTextProcessing:https://github.com/wenet-e2e/WeTextProcessing

制作不易,如果本文对您有帮助,还请点个免费的赞或在看!感谢您的阅读!

这篇关于ChatTTS增强版V3【已开源】,长文本修复,中英混读,导入音色,批量SRT、TXT的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1086028

相关文章

苹果macOS 26 Tahoe主题功能大升级:可定制图标/高亮文本/文件夹颜色

《苹果macOS26Tahoe主题功能大升级:可定制图标/高亮文本/文件夹颜色》在整体系统设计方面,macOS26采用了全新的玻璃质感视觉风格,应用于Dock栏、应用图标以及桌面小部件等多个界面... 科技媒体 MACRumors 昨日(6 月 13 日)发布博文,报道称在 macOS 26 Tahoe 中

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取

详解如何使用Python从零开始构建文本统计模型

《详解如何使用Python从零开始构建文本统计模型》在自然语言处理领域,词汇表构建是文本预处理的关键环节,本文通过Python代码实践,演示如何从原始文本中提取多尺度特征,并通过动态调整机制构建更精确... 目录一、项目背景与核心思想二、核心代码解析1. 数据加载与预处理2. 多尺度字符统计3. 统计结果可

Java如何从Redis中批量读取数据

《Java如何从Redis中批量读取数据》:本文主要介绍Java如何从Redis中批量读取数据的情况,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一.背景概述二.分析与实现三.发现问题与屡次改进3.1.QPS过高而且波动很大3.2.程序中断,抛异常3.3.内存消

电脑蓝牙连不上怎么办? 5 招教你轻松修复Mac蓝牙连接问题的技巧

《电脑蓝牙连不上怎么办?5招教你轻松修复Mac蓝牙连接问题的技巧》蓝牙连接问题是一些Mac用户经常遇到的常见问题之一,在本文章中,我们将提供一些有用的提示和技巧,帮助您解决可能出现的蓝牙连接问... 蓝牙作为一种流行的无线技术,已经成为我们连接各种设备的重要工具。在 MAC 上,你可以根据自己的需求,轻松地

MySQL数据库实现批量表分区完整示例

《MySQL数据库实现批量表分区完整示例》通俗地讲表分区是将一大表,根据条件分割成若干个小表,:本文主要介绍MySQL数据库实现批量表分区的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考... 目录一、表分区条件二、常规表和分区表的区别三、表分区的创建四、将既有表转换分区表脚本五、批量转换表为分区

电脑提示Winmm.dll缺失怎么办? Winmm.dll文件丢失的多种修复技巧

《电脑提示Winmm.dll缺失怎么办?Winmm.dll文件丢失的多种修复技巧》有时电脑会出现无法启动程序,因为计算机中丢失winmm.dll的情况,其实,winmm.dll丢失是一个比较常见的问... 在大部分情况下出现我们运行或安装软件,游戏出现提示丢失某些DLL文件或OCX文件的原因可能是原始安装包

无法启动此程序因为计算机丢失api-ms-win-core-path-l1-1-0.dll修复方案

《无法启动此程序因为计算机丢失api-ms-win-core-path-l1-1-0.dll修复方案》:本文主要介绍了无法启动此程序,详细内容请阅读本文,希望能对你有所帮助... 在计算机使用过程中,我们经常会遇到一些错误提示,其中之一就是"api-ms-win-core-path-l1-1-0.dll丢失

MySQL Workbench工具导出导入数据库方式

《MySQLWorkbench工具导出导入数据库方式》:本文主要介绍MySQLWorkbench工具导出导入数据库方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝... 目录mysql Workbench工具导出导入数据库第一步 www.chinasem.cn数据库导出第二步

Oracle 通过 ROWID 批量更新表的方法

《Oracle通过ROWID批量更新表的方法》在Oracle数据库中,使用ROWID进行批量更新是一种高效的更新方法,因为它直接定位到物理行位置,避免了通过索引查找的开销,下面给大家介绍Orac... 目录oracle 通过 ROWID 批量更新表ROWID 基本概念性能优化建议性能UoTrFPH优化建议注