标贝科技:TensorFlow 框架提升语音合成效果

2023-10-28 17:40

本文主要是介绍标贝科技:TensorFlow 框架提升语音合成效果,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文 / 标贝(北京)科技有限公司


长久以来,传统的语音合成技术,主要围绕着统计参数合成和拼接合成展开,两种方法虽各有利弊,但基本满足了可懂度的要求,语音合成技术得以在多种场景下应用,尤其是导航播报这样的强需求场景。

 

最近几年,基于深度学习的语音合成技术快速发展,语音合成系统中的模型逐步被深度学习模型所替代。

 

尤其是 2016 年,随着 wavenet 技术的问世,将参数合成技术带入了一个新的阶段。神经网络声码器的合成效果,逐步接近拼接合成的音质,而其流畅度明显好于拼接合成。从 wavenet,parallel wavenet,到 waveglow, wavernn 等, 神经网络声码器技术持续进步,算法复杂度不断下降,逐渐让工程化应用成为可能。


640?wx_fmt=jpeg


标贝科技,一直密切关注语音合成技术的演化,分析技术变革所带来的需求场景的可能的变化,充分结合自身的技术优势,投入到新技术的研发当中。

 

标贝科技所研发的语音合成相关模型,都是采用 TensorFlow 框架进行实现的。模型的训练情况,也是通过 TensorBoard 进行分析,从而进行优化。越来越复杂的模型,固然有其优势,但同时也产生了一些不稳定的因素,通过对模型的可视化分析,我们进行了一系列的改进,从而使得模型效果不断提升。

 

TensorFlow 是目前应用最为广泛的开源深度学习框架,不但提供了一些列底层实现,而且提供了很多高级功能,非常便于开展实验研究,快速发现和解决问题。

 

通过利用 TensorFlow,我们可以快速验证相关的算法,并进行改进,大大缩短了技术开发周期,降低了研发成本和风险 — 将输入维度从数万维降为数十维,并且降低了运算量。

 

同时,利用自有的技术和数据资源, 研发了一种基于 Attention 的高质量语音合成系统,通过利用 TensorFlow 搭建的训练平台对声音建模后,合成效果有了明显提升 — 更自然的抑扬顿挫、情感起伏,逼真度也有了进一步提升。


640?wx_fmt=png


本次利用 TensorFlow 模型对合成系统的全新升级,标贝科技以 “声音超市” 的模式,对外提供一系列的语音合成解决方案。新的合成效果以及推广模式都已经得到广大合作伙伴的认可,行业影响力快速提升,成为了语音合成领域的知名企业。

 

同时,标贝科技利用新型合成技术进行了一次大胆的尝试 — 合成娱乐明星、知名 IP 的声音,直接用成果面对更大的用户市场来检验技术和算法。

 

明星的声音是具有极高辨识性的,这个辨识性不单单是指声线的独特。观众和粉丝群体会对这个声音有很高的心理预期。从更像真人到更像本人,除了声音要相似外,还要符合明星本人的个性和发音习惯,这就意味着 “及格线” 提高了。


640?wx_fmt=png


我们联合《创造101》的成员陈意涵、魏瑾,利用新技术合成出她们的声音,将端口放到活动页面中,用户输入任何文字,就能听她们 “亲口” 送上独一无二的专属话语。

 

本次尝试,让标贝科技在活动当天就登上了当天的微博热门话题,当天全网总曝光量达千万次,数百万人使用了这两位明星端口合成语音。除了收获好评外,本次活动也让标贝科技看到了广大的用户市场对于高质量语音合成技术的惊喜和更多期待。

 

未来,标贝科技会利用 TensorFlow 框架所带来的技术红利结合不同的应用场景,通过 “声音超市” 的模式进行技术的落地。对标贝科技来说,仅作为场景需求的解决方是不够的,应用场景有多宽广、语音合成未来能有多好玩,也需要技术人员天马行空的 “造梦”,才能为用户带来更好的声音体验。



更多 AI 相关阅读:

  • 通过机器学习实现实时 AR 自我表达

  • 全神经设备端语音识别器

  • 激活地图集:深入探索图像分类的神经网络



640?wx_fmt=gif

这篇关于标贝科技:TensorFlow 框架提升语音合成效果的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/294875

相关文章

解决若依微服务框架启动报错的问题

《解决若依微服务框架启动报错的问题》Invalidboundstatement错误通常由MyBatis映射文件未正确加载或Nacos配置未读取导致,需检查XML的namespace与方法ID是否匹配,... 目录ruoyi-system模块报错报错详情nacos文件目录总结ruoyi-systnGLNYpe

Python Web框架Flask、Streamlit、FastAPI示例详解

《PythonWeb框架Flask、Streamlit、FastAPI示例详解》本文对比分析了Flask、Streamlit和FastAPI三大PythonWeb框架:Flask轻量灵活适合传统应用... 目录概述Flask详解Flask简介安装和基础配置核心概念路由和视图模板系统数据库集成实际示例Stre

Olingo分析和实践之OData框架核心组件初始化(关键步骤)

《Olingo分析和实践之OData框架核心组件初始化(关键步骤)》ODataSpringBootService通过初始化OData实例和服务元数据,构建框架核心能力与数据模型结构,实现序列化、URI... 目录概述第一步:OData实例创建1.1 OData.newInstance() 详细分析1.1.1

一文解密Python进行监控进程的黑科技

《一文解密Python进行监控进程的黑科技》在计算机系统管理和应用性能优化中,监控进程的CPU、内存和IO使用率是非常重要的任务,下面我们就来讲讲如何Python写一个简单使用的监控进程的工具吧... 目录准备工作监控CPU使用率监控内存使用率监控IO使用率小工具代码整合在计算机系统管理和应用性能优化中,监

PowerShell中15个提升运维效率关键命令实战指南

《PowerShell中15个提升运维效率关键命令实战指南》作为网络安全专业人员的必备技能,PowerShell在系统管理、日志分析、威胁检测和自动化响应方面展现出强大能力,下面我们就来看看15个提升... 目录一、PowerShell在网络安全中的战略价值二、网络安全关键场景命令实战1. 系统安全基线核查

Spring 框架之Springfox使用详解

《Spring框架之Springfox使用详解》Springfox是Spring框架的API文档工具,集成Swagger规范,自动生成文档并支持多语言/版本,模块化设计便于扩展,但存在版本兼容性、性... 目录核心功能工作原理模块化设计使用示例注意事项优缺点优点缺点总结适用场景建议总结Springfox 是

Python中Tensorflow无法调用GPU问题的解决方法

《Python中Tensorflow无法调用GPU问题的解决方法》文章详解如何解决TensorFlow在Windows无法识别GPU的问题,需降级至2.10版本,安装匹配CUDA11.2和cuDNN... 当用以下代码查看GPU数量时,gpuspython返回的是一个空列表,说明tensorflow没有找到

Python的端到端测试框架SeleniumBase使用解读

《Python的端到端测试框架SeleniumBase使用解读》:本文主要介绍Python的端到端测试框架SeleniumBase使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全... 目录SeleniumBase详细介绍及用法指南什么是 SeleniumBase?SeleniumBase

C++ HTTP框架推荐(特点及优势)

《C++HTTP框架推荐(特点及优势)》:本文主要介绍C++HTTP框架推荐的相关资料,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录1. Crow2. Drogon3. Pistache4. cpp-httplib5. Beast (Boos

Kotlin Compose Button 实现长按监听并实现动画效果(完整代码)

《KotlinComposeButton实现长按监听并实现动画效果(完整代码)》想要实现长按按钮开始录音,松开发送的功能,因此为了实现这些功能就需要自己写一个Button来解决问题,下面小编给大... 目录Button 实现原理1. Surface 的作用(关键)2. InteractionSource3.