支持向量机语音识别算法在OMAP5912上的移植
随着语音识别和语音合成技术的不断更新与发展,将语音识别技术应用于嵌入式产品中已得到广泛应用。SVM(支持向量机)作为统汁概率模型已经被证明是一种很好的识别模型。OMAP5912处理器是由TI公司的TMS320C55X 型DSP内核与低功耗、增强型ARM926EJ-S微处理器组成的双核应用处理器。ARM核可满足控制和接口方面的需要,DSP核以其低功耗高性能来实现多媒体应用。目前存0MAP平台上实现的多媒体应用有语音、音频、图像、视频等。在实验室开发的基于0MAP5912嵌入式语音识别系统上进行基于SVM的语音识别程序开发。
1 SVM多类分类方法
SVM最初是为处理两类分类问题而设计的,如何有效地处理多类分类问题目前仍是一个持续研究的课题。采用SVM中的“一对一”方法实现多类分类,下面对这种方法进行简单介绍。
S.Knerr等在1990年首次介绍了“一对一”方法。J.Friedman在1996年和U KreBel在1999年分别首次在支持向量机中使用这种方法。它需要构造k(k-1)/2个分类器,每个分类器由特定的某两类训练样本训练得到,判定测试样本的类别时,结合所有两类分类器对测试样本类别的判定意见,采用“投票法”的策略,并认为得票数最多(Max Wins)的类别就是测试样本所属的类别。具体如下:考虑K类的分类问题,设训练集
首先对所有的(i,j)∈{(i,j)|i≤j,i,j=1,…,K}进行运算:从训练集中抽取所有y=i和y=j的样本点。基于这些样本点组成一个训练集Ti-j,每个两类分类SVM解决问题
约束条件为:
通过求解式(3)的最优化问题得到k(k-1)/2个决策函数,如果函数判断x属于i类,则i类的得票数增加1;否则j类的得票数增加1。最终判定得票数最多的类别就是测试样本x所属的类别。
“一对一”方法的特点是训练时需要构造k(k-1)/2个分类器,预测时则采用投票选择策略。这样做的优点是:每一个分类问题的规模较小,需要求的问题较简单,样本数量不很大时训练速度较快,而且由于类别有较少的重合,改善了样本拒分、错分的范同;缺点是:投票法可能存在得票相同的类,即可能存在一个样本同时属于多个类的情况。这可以使用其他方法解决,这里重点研究SVM算法在0MAP上的实现。
2 嵌入式系统开发环境的搭建
0MAP5912处理器是由TI公司的TMS320C55x 型DSP内核(192 MHz)与低功耗、增强型ARM926EJ-S微处理器(192 MHz)组成的双核应用处理器,采用0.13μm CMOS工艺制造。TMS320C55x型DSP可提供对低功耗应用的实时多媒体处理的支持;ARM926EJ-S MPU可满足控制和接口方面的处理需要。基于双核结构的0MAP5912具有极强的运算能力和极低的功耗,采用开放式、易于开发的软件设施,支持广泛的操作系统。嵌入式系统开发在解决了硬件平台的设计和操作系统的搭建后就需要考虑应用程序如何编译、主机如何与开发板通信、程序如何调试、程序如何下载到开发板这几个方面的问题。
相关文章
- 2024-05-24利用ADuC834构成二次仪表系统
- 2023-11-01利用小型后坐冲击模拟试验装置进行重锤加速度的测量与分析
- 2023-06-02基于模板匹配和神经网络的车牌字符识别方法
- 2023-04-20激光三角测量中图像传感器参量自适应控制
- 2024-09-30基于特征点位置及速度的空间非合作目标质心位置测量方法
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。