3.语音增强短时谱估计算法——功率谱减法

2023-10-13 16:10

本文主要是介绍3.语音增强短时谱估计算法——功率谱减法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

谱减法有两种实现方法:幅度谱减法功率谱减法,在该专栏之前的文章中,已经介绍了幅度谱减法的原理,本篇文章将针对于功率谱减法进行介绍(使用的参数与幅度谱减法的参数意义一致)。

假设语音信号与噪声信号不想管,带噪语音信号的功率谱如下:

                                                   \left | Y(\omega ) \right |^{2}=\left | S(\omega ) \right |^{2}+\left | D(\omega ) \right |^{2}

由于噪声平稳,假设发声前与发生期间的噪声功率谱相同,可利用发音前后的、没有语音只有噪声的“寂静帧”来估计噪声。然而语音是非常稳定的,实际上只能利用一小段加窗信号进行分析,用下式表示:

                           \left | Y(\omega ) \right |^{2}=\left | S(\omega ) \right |^{2}+\left | D(\omega ) \right |^{2}+S_{w}(\omega )D^{*}_{w}(\omega )+S^{*}_{w}(\omega )D_{w}(\omega )

式中*表示复共轭,由于d(n)和s(n)互不相关,则互谱的统计均值为0,所以原始语音的功率谱估值如下所示:

                                                  \left | \hat{S}(\omega ) \right |^{2}=\left | Y(\omega ) \right |^{2}-\left | \hat{D}(\omega ) \right |^{2}

当以上差值为负时,则结果令为0。

带噪语音的相位argY(\omega)直接与\left | \hat{S}(\omega ) \right |相乘,可以得到增强后的语音信号:

                                       \hat{S}(\omega )=IFFT\left \{ \left | \hat{S(\omega ) }\cdot exp\left [ jargY(\omega ) \right ] \right | \right \}

功率谱减法的原理框图如下所示:

                      

我的博客即将同步至腾讯云开发者社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan?invite_code=1yqgrvpm3ge84

这篇关于3.语音增强短时谱估计算法——功率谱减法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/204383

相关文章

使用雪花算法产生id导致前端精度缺失问题解决方案

《使用雪花算法产生id导致前端精度缺失问题解决方案》雪花算法由Twitter提出,设计目的是生成唯一的、递增的ID,下面:本文主要介绍使用雪花算法产生id导致前端精度缺失问题的解决方案,文中通过代... 目录一、问题根源二、解决方案1. 全局配置Jackson序列化规则2. 实体类必须使用Long封装类3.

Springboot实现推荐系统的协同过滤算法

《Springboot实现推荐系统的协同过滤算法》协同过滤算法是一种在推荐系统中广泛使用的算法,用于预测用户对物品(如商品、电影、音乐等)的偏好,从而实现个性化推荐,下面给大家介绍Springboot... 目录前言基本原理 算法分类 计算方法应用场景 代码实现 前言协同过滤算法(Collaborativ

Python中edge-tts实现便捷语音合成

《Python中edge-tts实现便捷语音合成》edge-tts是一个功能强大的Python库,支持多种语言和声音选项,本文主要介绍了Python中edge-tts实现便捷语音合成,具有一定的参考价... 目录安装与环境设置文本转语音查找音色更改语音参数生成音频与字幕总结edge-tts 是一个功能强大的

openCV中KNN算法的实现

《openCV中KNN算法的实现》KNN算法是一种简单且常用的分类算法,本文主要介绍了openCV中KNN算法的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录KNN算法流程使用OpenCV实现KNNOpenCV 是一个开源的跨平台计算机视觉库,它提供了各

springboot+dubbo实现时间轮算法

《springboot+dubbo实现时间轮算法》时间轮是一种高效利用线程资源进行批量化调度的算法,本文主要介绍了springboot+dubbo实现时间轮算法,文中通过示例代码介绍的非常详细,对大家... 目录前言一、参数说明二、具体实现1、HashedwheelTimer2、createWheel3、n

SpringBoot实现MD5加盐算法的示例代码

《SpringBoot实现MD5加盐算法的示例代码》加盐算法是一种用于增强密码安全性的技术,本文主要介绍了SpringBoot实现MD5加盐算法的示例代码,文中通过示例代码介绍的非常详细,对大家的学习... 目录一、什么是加盐算法二、如何实现加盐算法2.1 加盐算法代码实现2.2 注册页面中进行密码加盐2.

Java时间轮调度算法的代码实现

《Java时间轮调度算法的代码实现》时间轮是一种高效的定时调度算法,主要用于管理延时任务或周期性任务,它通过一个环形数组(时间轮)和指针来实现,将大量定时任务分摊到固定的时间槽中,极大地降低了时间复杂... 目录1、简述2、时间轮的原理3. 时间轮的实现步骤3.1 定义时间槽3.2 定义时间轮3.3 使用时

使用Python实现文本转语音(TTS)并播放音频

《使用Python实现文本转语音(TTS)并播放音频》在开发涉及语音交互或需要语音提示的应用时,文本转语音(TTS)技术是一个非常实用的工具,下面我们来看看如何使用gTTS和playsound库将文本... 目录什么是 gTTS 和 playsound安装依赖库实现步骤 1. 导入库2. 定义文本和语言 3

讯飞webapi语音识别接口调用示例代码(python)

《讯飞webapi语音识别接口调用示例代码(python)》:本文主要介绍如何使用Python3调用讯飞WebAPI语音识别接口,重点解决了在处理语音识别结果时判断是否为最后一帧的问题,通过运行代... 目录前言一、环境二、引入库三、代码实例四、运行结果五、总结前言基于python3 讯飞webAPI语音

如何通过Golang的container/list实现LRU缓存算法

《如何通过Golang的container/list实现LRU缓存算法》文章介绍了Go语言中container/list包实现的双向链表,并探讨了如何使用链表实现LRU缓存,LRU缓存通过维护一个双向... 目录力扣:146. LRU 缓存主要结构 List 和 Element常用方法1. 初始化链表2.