孤立词语音识别算法在医疗仪器中的应用
随着语音识别技术的发展,语音识别技术在旅游业、服务业和军事领域中都被广泛应用。本文主要研究的是孤立词语音识别算法应用于医疗仪器中,实现人与机器之间的通信,比如便携式肺功能仪、家用心脑血管仪等,它使得医疗仪器使用起来更加方便自然,让老年人和残疾人可以无障碍地使用。
1 孤立词语音识别系统
孤立词语音识别系统的原理如图1所示。
在训练阶段,用户将每个词依次说一遍,并将计算得到的每个词所对应的特征矢量序列作为模板存入模板库中。在识别阶段,将输入语音的特征矢量序列依次与模板库中的每一模板进行相似度比较,将相似度最高者作为识别结果输出。
2 孤立词语音识别算法设计
孤立词语音识别算法设计主要包括三大部分:一是带噪声端点检测,本文采用短时能量和短时过零率相结合的方法,力求使噪声的干扰降到最低,满足抗干扰的要求。二是特征参数提取,采用一种符合人耳听觉特性的Mel频率倒谱系数MFCC算法,该算法能很好地表征语音信号,而且在噪声环境下能取得很好的识别效果。三是模板匹配,采用平行四边形限制动态规整范ADTW算法,可以大大减小计算量,提高程序的性能。
2.1 带噪声端点检测算法
(1)短时平均能量[1]。设S(n)为加窗语音信号,第t帧语音的短时平均能量为:
式中:N为分析窗宽度;St(n)为第t帧语音信号中的第n个点的信号样值。上面两式原理是相同的,但式(2)有利于区别小取样值和大取样值,不像式(1)取平方造成很大差异[2]。短时平均能量是时域特征参数。把它用于模型参数时,应进行归一化处理,本文将取其对数值后使用,使计算和识别结果均取得了较好的效率和结果。
(2)短时过零率[1]。短时过零率ZCR(zero cross-ing rate)为:
在开始进行端点检测之前,首先为短时能量和过零率分别确定2个门限[3]。一个是比较低的门限,其数值比较小,对信号的变化比较敏感,很容易被超过;另一个是比较高的门限,数值比较大,信号必须达到一定的强度,该门限才可能被超过。低门限被超过未必就是语音的开始,有可能是时间很短的噪声引起的。高门限被超过则可以基本确信是由于语音信号引起的。整个语音信号的端点检测可以分成4段[4]:静音、过渡段、语音段、结束。在静音段,如果能量或过零率超越了低门限,就应该开始标记起始点,进入过渡段。在过渡段中,由于参数的数值比较小,不能确信是否处于真正的语音段,因此只要2个参数的数值回落到低门限以下,就将当前状态恢复到静音状态。而如果在过渡段中两个参数中的任一个超过了高门限,就可以确信进入语音段了。一些突发性的噪声也可以引起短时能量或过零率的数值很高,但是往往不能维持足够长的时间,如门窗的开关、物体的碰撞等引起的噪声,这些都可以通过设定最短时间门限来判别。当前状态处于语音段时,如果2个参数的数值降低到低门限以下,而且总的计时长度小于最短时间门限,则认为这是一段噪音。
相关文章
- 2024-08-15浅谈风机机座上两轴承孔同轴度偏差过大的修正
- 2024-05-21再谈智能高速在线涡流探伤系统的研发
- 2024-08-28多功能形位误差测量系统的研制与应用
- 2023-10-30智能化仪器监控程序的结构设计
- 2023-11-03MSP430单片机在新型智能水表开发中的应用
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。