基于DSP的孤立词语音识别系统的设计
1 引言
随着语音信号处理技术的不断发展与成熟,语音识别正逐步成为信息技术中人机接口的关键技术。DSP芯片,即数字信号处理器,是专门为快速实现各种信号处理算法而设计的、具有特殊结构的微处理器,其处理速度比最快的CPU还快10~50倍。本文介绍的就是基于TMS320VC5402配合TLC320AD50C和AT89S52的实验室用机器人的孤立词语音识别系统。
2 语音识别系统的基本介绍
2.1 语音识别系统的组成
计算机语音识别过程与人对语音识别处理过程基本上是一致的。语音信号本身的特点造成了语音识别的困难。这些特点包括多变性,动态性,瞬时性和连续性等。目前主流的语音识别技术是基于统计模式识别的基本理论。一个完整的语音识别系统可如图1所示。
2.2 语音识别系统的分类
根据对说话人说话方式的要求,可以分为孤立词语音识别系统,连续字语音识别系统和连续语音识别系统;根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统;根据词汇量大小,可以分为小词汇量、中等词汇量、大词汇量以及无限词汇量语音识别系统。
3 硬件系统设计
此语音识别系统的目的让机器人能听懂我们所发出的简单的命令,首先由TLC320AD50C采集计算机声卡的语音,经过转换后送给TMS320VC5402, TMS320VC5402完成语音信号处理,即识别出所发出的语音,然后把结果送给AT89S52显示,同时通过串行通讯送给机器人(PC-104),以使机器人能够控制自己的行动。其结构框图如图2所示。
该系统以TMS320VC5402为核心电路,对孤立词语音信号进行采集和处理,AIC为TMS320VC5402的模拟接口电路,包括放大、滤波、和A/D转换的电路,把由话筒采集进来的模拟语音信号,转换成数字语音信号。其中SRAM和Flash分别为TMS 320VC5402的数据存储器和程序存储器。键盘和显示部分则由AT89S52来控制,AT89S52把键盘操作转换为控制信号再传送给TMS320VC5402,控制系统的工作是训练还是识别,TMS320VC5402把要显示的系统状态通讯给AT89S52,以实现LCD显示。这些硬件工作过程如图3所示。
3.1 TMS320VC5402与TLC320AD50C的接口设计
TMS320VC5402提供了两个增强型的高速、全双工多通道缓存串行口McBSP, McBSP具有全双工的通信机制以及双缓存的发送寄存器和三缓存的接收寄存器,允许连续的数据流传输,数据长度可以为8,12,16,20,24,32;同时还提供了A-律和μ律压扩,多达128个通道的发送与接收。McBSP通过7个引脚使得一个数据通路和一个控制通路与外部设备相连。McBSP的引脚如下:
相关文章
- 2022-07-22基于MCl45026/27的病房传呼系统的研制
- 2024-02-04机械秒表测量不确定度分析
- 2021-11-19波特率自适应的RS-485中继器设计
- 2023-03-13简单活塞式压力计的误差修正
- 2023-11-02电冰箱换热器以铝代铜腐蚀特性的实验研究
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。