3.语音增强短时谱估计算法—

3.语音增强短时谱估计算法——功率谱减法

本文主要是介绍3.语音增强短时谱估计算法——功率谱减法，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

谱减法有两种实现方法：幅度谱减法与功率谱减法，在该专栏之前的文章中，已经介绍了幅度谱减法的原理，本篇文章将针对于功率谱减法进行介绍（使用的参数与幅度谱减法的参数意义一致）。

假设语音信号与噪声信号不想管，带噪语音信号的功率谱如下：

$\left | Y(\omega ) \right |^{2}=\left | S(\omega ) \right |^{2}+\left | D(\omega ) \right |^{2}$

由于噪声平稳，假设发声前与发生期间的噪声功率谱相同，可利用发音前后的、没有语音只有噪声的“寂静帧”来估计噪声。然而语音是非常稳定的，实际上只能利用一小段加窗信号进行分析，用下式表示：

$\left | Y(\omega ) \right |^{2}=\left | S(\omega ) \right |^{2}+\left | D(\omega ) \right |^{2}+S_{w}(\omega )D^{*}_{w}(\omega )+S^{*}_{w}(\omega )D_{w}(\omega )$

式中*表示复共轭，由于d(n)和s(n)互不相关，则互谱的统计均值为0，所以原始语音的功率谱估值如下所示：

$\left | \hat{S}(\omega ) \right |^{2}=\left | Y(\omega ) \right |^{2}-\left | \hat{D}(\omega ) \right |^{2}$

当以上差值为负时，则结果令为0。

带噪语音的相位 $argY(\omega)$ 直接与 $\left | \hat{S}(\omega ) \right |$ 相乘，可以得到增强后的语音信号：

$\hat{S}(\omega )=IFFT\left \{ \left | \hat{S(\omega ) }\cdot exp\left [ jargY(\omega ) \right ] \right | \right \}$

功率谱减法的原理框图如下所示：

我的博客即将同步至腾讯云开发者社区，邀请大家一同入驻：https://cloud.tencent.com/developer/support-plan?invite_code=1yqgrvpm3ge84

这篇关于3.语音增强短时谱估计算法——功率谱减法的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

3.语音增强短时谱估计算法——功率谱减法

相关文章

Java中的雪花算法Snowflake解析与实践技巧

使用雪花算法产生id导致前端精度缺失问题解决方案

Springboot实现推荐系统的协同过滤算法

Python中edge-tts实现便捷语音合成

openCV中KNN算法的实现

springboot+dubbo实现时间轮算法

SpringBoot实现MD5加盐算法的示例代码

Java时间轮调度算法的代码实现

使用Python实现文本转语音(TTS)并播放音频

讯飞webapi语音识别接口调用示例代码(python)