碧波液压网 欢迎你,游客。 登录 注册

改进的最小均方误差语音增强算法的研究

版权信息:站内文章仅供学习与参考,如触及到您的版权信息,请与本站联系。
液压导航网

   

    1 引 言

    人们在语音通信过程中不可避免地会受到来自周围环境、传输媒介引入的噪声, 通信内部电噪收到的语音已非纯净的原始语音信号, 而是受噪声污染的带噪语音信号。目前的很多语音处理系统大都是在安静环境中工作的。环境噪声污染使许多语音处理系统的性能急剧恶化。因此就需要采用语音增强技术进行预处理, 有效改善系统性能。

    语音增强的目的是从带噪语音中提取尽可能纯净的原始语音, 改进语音质量, 消除背景噪声, 提高语音的可懂度[1]。语音增强方法种类繁多, 它们大都基于各种噪声消除方法结合语音信号的特征来研究具有针对性的算法。如基于卡尔曼滤波的语音增强算法; 基于子空间分解的语音增强算法; 基于语音模型的方法; 基于短时谱幅度估计的语音增强算法等。由于基于短时谱幅度估计(STSA, short time spec-tral amplitude)的算法原理简单, 计算复杂度低, 易于实现实时处理, 因此得到广泛使用[2-4]。由于人耳对语音的感知是通过语音信号中各频谱分量幅度获取的, 而对各分量的相位不敏感, 因此可认为在语音增强过程中, 语音信号的相位保持不变[1]。

    在大多数语音增强算法中, 都假定噪声功率谱的估计是已知的。这些噪声功率谱的估计对语音增强算法是十分重要的。如果噪声功率谱估计太低,会听到残留噪声, 如果噪声功率谱估计太高, 会损害语音信号。因此, 在非平稳环境下, 快速估计出变化的背景噪声有很重要的意义。本文主要研究一种改进的 MMSE-STSA 的语音增强算法, 这种算法在传统 MMSE-STSA 算法的基础上, 改进了对背景噪声的估计方法, 提高了其在非平稳噪声环境中对噪声估计的准确性, 减少了增强语音的失真。

    2 MMSE-STSA 语音增强算法

    由于语音增强中无法确定听觉意义上的失真准则和给定噪声情况下语音频谱的先验分布, 因此需要寻找针对特定的失真准则和对后验概率不敏感的估计方法。基于短时谱估计(STSA)的语音增强方法有很多种, 对于相当多的失真度量函数及信号与噪声的联合概率密度集合来说, MMSE 准则下的条件均值估计是最优的[5]。

    假设语音 s(t) 的短时谱为高斯分布, d(t) 为平稳、加性、高斯噪声。带噪语音信号为:

y(t)=s(t)+d(t) (1)

    相应的, 带噪语音信号, 纯净语音信号和噪声信号在第 n 帧第 k 个频率分量上的短时谱幅度可以表示为|Yn(k)|, |Sn(k)|和|Dn(k)|。带噪语音信号的后验信噪比和先验信噪比的计算如下:

    E{·}表示求期望值操作。因为 E{|Dn(k)|2得到, 通常用它的估计值 #n(k) 来计算得到后验信噪比!n(k)的近似值!!n(k)。

你没有登陆,无法阅读全文内容

您需要 登录 才可以查看,没有帐号? 立即注册

标签:
点赞   收藏

相关文章

发表评论

请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。

用户名: 验证码: 看不清?点击更换

最新评论