基于DSP的声控电子记事本的设计与实现
语音识别及语音编解码技术经过几十年的发展,已经日趋成熟,步入实用化阶段。语音识别技术已开始应用于电话查询服务、智能玩具、PDA、家用电器、通信、工业控制、语言学习等应用领域;其于码激励线性预测(CELP)技术的语音编解码算法也因其音质好,压缩比大而在通信和数字录音设备中获得了广泛应用。
语音输入方式与手写输入方式相比,具有操作简便、查找方便、识别准确率高等优点。省去了大量的输入时间,降低了信息检索的复杂度。本文所介绍的声控电子记事本系统将语音识别和语音编解码在同一片DSP芯片上实现,用语音方式代替其它方式进行信息输入,提高了系统的灵活性。
1 系统功能
可存200张语音名片,每张语音名片包含四条信息:姓名、电话号码、工作单位、备注;声控查找语音名片信息,用户只需口述所要查找人的姓名,即可获得电话号码、工作单位、备注等信息,同时电话号码显示在液晶显示屏上。
具有双音多频(DTMF)拨号功能,用户用声控查找到电话号码并显示在液晶屏上之后,只需轻触一个拨号键,即可通过普通电话机的话筒实现快速自动拨号。
数字录音,每段录音加语音标识;声控放音,在放音时只需口述所要语音段的语音标识即可自动找到该段录音并加放,累计录音时间达两个半小时以上。
具有方便的编辑功能,增加、删除语音名片,增加、删除数字录音段。
2 系统构成
本文所介绍的声控电子记事本系统,是在定点16位DSP芯片上实现的,它包含特定人孤立词语音识别算法和代数码本激励线性预测(ACELP)语音编解码算法数(MFCC)为语音特征、以动态时间规划(DTW)为模板匹配算法,对于普通词条,识别率达到了99%以上。用于“录音”功能的ACELP算法是该码率下性能优异的编解码算法,虽然算法复杂度较高,但共重建语音质量的平均主观评测分数(MOS分)达到了4.0,非常接近于压缩前的分数4.3。
如图1所示,系统由MCU实现总线控制,接受外部键盘输入,并在液晶屏上显示信息。在本系统中,语音充当大部分人机界面的角色,尽量省去复杂的键盘操作,而且用语音提示或语音回放代替一部门液晶文字提示。由于语音要经过DSP处理,所以MCU需要与DSP经常交换信息,以便实现友好的操作界面。
2.1 DSP
DSP(ADSP2185)是整个硬件系统的信号处理中心,完成语音识别、训练、编解码,进行片内RAM及外部FLASH存储芯片的数据管理与调度,并向主控芯片MCU提供简洁的命令与反馈信息。ADSP2185是Analog Devices公司的产品,其主要性能如下:
相关文章
- 2024-01-30记忆合金海底火山口热液采样器
- 2023-06-28一种显微镜LED光源驱动设计
- 2023-08-02一种低温混合样品状态监测仪
- 2024-02-06临床生化自动分析仪的实验室管理体会
- 2022-09-15旧式大型工具显微镜数显化
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。