碧波液压网 欢迎你,游客。 登录 注册

基于语音参数的普通话韵母区别特征

版权信息:站内文章仅供学习与参考,如触及到您的版权信息,请与本站联系。

  

  1 引 言

  区别特征的原始概念起源于 20 世纪 30 年代的“布拉格学派”。其代表人物 Trubetzkoy 首先创立了音位对立的二分(区别特征)概念[1]。其后,Jakobson把所有语言的区别特征列为十二项“最小对立体”,作为分析语音的标尺[2]。上世纪 60 年代后,Chomsky和 Halle 提出的区别特征体系中,对二元特征做了修订,允许多元特征的存在[3]。国内对普通话的区别特征研究开始于上世纪 80 年代。吴宗济建立了普通话区别特征矩阵,并探讨了它们之间的相互关系模型[4]。其后,叶蜚声等列出了北京话音位的区别特征表”[5]。陆致极进一步采用 12 对区别特征来建立普通话音位的区别特征矩阵[6]。最近,张家騄根据汉语语音知觉混淆的群集分析结果,建立声母-韵母音位系统的区别特征[7,8]。此外,王洪君对韵母组合音段的区别特征进行了研究[9]。

  由于缺少相应声学参数的支持,现有的区别特征理论很少应用于语音工程之中。虽然张家騄提出区别特征系统时是以声学参数为核心的,但是并没有实际的语音声学参数作支撑。此外,王洪君对韵母根据其组合位置(介音、韵腹和韵母),使用传统区别特征进行划分。由于传统区别特征没有对应的声学参数,因此在此基础上的组合,也是没有声学参数支持的。区别特征是语音学中的概念,而在语音工程中常用的语音参数是从信号处理或是结合听感模型提出的,这两者从起源上就存在差别,因此传统的区别特征在应用于语音识别、语音评测等语音工程实践中时可能并不合适。因此,有必要从语音声学参数的角度考虑来建立区别特征。

  2 特征计算

  在本文的研究中,使用了在中国传媒大学录制的语音数据库中的数据,发音人为播音专业的学生。采用了语音库中单独录制的普通话韵母语音,每个韵母大约有 300 个左右的样本。本文主要使用了 LPCC、PLP 和基于 MEL 滤波器组的主成分参数来描述语音信号的不同特征。

  LPC 的倒谱系数(LPCC),包含了信号谱的包络信息,可以看作是对原始信号短时倒谱的一种近似,对准稳态浊音部分有很好的描述。本文在计算中采用 13 阶的 LPCC 参数,以表征声道特征。同时,PLP(Perceptual Linear Prediction)参数在使用全极点模型计算线性预测系数的过程中,把临界带分析、等响曲线的预加重等人耳听觉特征应用到信号处理中,其结果更加符合人耳的听觉特点。本文根据非特定人的语音识别实验结果,PLP 选择 5 阶参数进行计算[10]。

  为了反映区别特征在各个频段的特征,使用类似于耳蜗作用的 Mel 频率滤波器组[11]。滤波器组包括 40 个滤波器,包含有 13 个线性滤波器和 27 个对数滤波器。滤波器组由混迭的三角窗构成,将每个滤波器频带内的能量进行叠加作为滤波器的输出。Mel 频率滤波器组的输出参数较多,使用主成份分析(Principal Component Analysis)对参数进行降维。当 Mel 滤波器组输出降成 7 维主成份时,累计贡献率为 85%。将滤波器组的输出参数根据载荷矩阵转换为 7 维的 Mel-PCA 参数。将以上三种参数按顺序进行拼接,得到一个包含 25 维参数的特征向量,本文以此为基础构建韵母决策树。

你没有登陆,无法阅读全文内容

您需要 登录 才可以查看,没有帐号? 立即注册

标签:
点赞   收藏

相关文章

发表评论

请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。

用户名: 验证码:

最新评论