MPEG声音编码的单片DSP实现
MPEG声音压缩算法是关于高保真数字声音压缩的第1个国际标准,自1992年末国际标准化组织和国际电工委员会采纳这项标准以来,它在数字声音的存储、Internet上的多媒体传输、声音数字广播(DAB)等领域都得到了广泛的应用.然而,MPEG声音编码算法相当复杂,它对运算量和存储量都有很高的要求,加上市场对编码器的需求不大,因而到目前为止还没有专门的ASIC芯片.现在常用的方法是采用通用的DSP完成MPEG声音压缩编码,但是国外仅有DEC,Philips,Xingit等为数不多的几家公司在单片DSP中完成了此算法,而且购买时费用昂贵,没有源码;国内也有使用两片TI公司的TMS320C30实现MPEG声音编码第2层[3],但是使用两片DSP不但协调控制电路复杂,而且加上片外存储器价格仍然不菲.因此,研究具有自有产权并且价格便宜的软硬件实现成为必然的选择.
1 MPEG声音编码原理
MPEG声音编码是一种基于人耳听觉特性的子带声音编码算法,它属于一种感觉声音编码方法.感觉声音编码算法的基本结构如图1所示.根据编码器着重于频率分辨率还是时间分辨率,可分为子带编码器和变换编码器.MPEG声音第2层编码算法在频域上把声音信号划分为32个子带,属于一种子带编码器.在图1 中,时频映射也称滤波器组,用于把输入的声音信号映射成亚抽样的频率分量.根据使用的滤波器组的性质,即滤波器组在频域的分辨率的大小,这些频率分量又可叫做子带样值或频率线.
(a)
(b)
图1 感觉声音解码器结构框图
滤波器的输出或者与滤波器组并行的时频变换的输出,提供给心理声学模型以估计时间相关的声音掩蔽门限.心理声学模型使用了人们所知的同时掩蔽效应,包括有调音的掩蔽特性和无调音的掩蔽特性.如果使用声音的前后掩蔽效应,还可进一步提高掩蔽门限估计的准确性.子带样值或频率线按照尽量保证量化噪声的频谱处于掩蔽门限以下的准则进行量化和编码,这样能保证被人耳感知的量化引入的噪声最小.根据对复杂度的要求,可以使用块压扩或熵编码的分析合成方法.
帧打包把量化编码的输出和相关边信息按照规定的格式组合起来,以便供解码器使用.
2 编码质量和DSP速度
单片ADSP-2181实现MPEG声音编码关键需要解决两个问题:一是如何保证声音编码质量;其次是如何充分利用DSP的运算速度.而这两个问题往往又是一对矛盾,需要找到其最佳结合点.
一般而言,决定MPEG声音编码器的优劣主要是声学模型的好坏.但是,对于使用单片16bit定点DSP的应用而言,这个结论就不再适用了.分析表明,此时有限字长效应对编码质量的影响成了主要矛盾.特别是分析滤波器组,截尾效应竟带来了33倍于16bitAD转换量化误差的噪声,而窗系数的有限长度表示则使本来高达96dB旁瓣衰减的滤波器响应降低到不到70dB.因此,要保证声音编码质量,分析滤波器组算法必须进行精度扩展.
相关文章
- 2022-06-16基于Small RTOS51的PS/2键盘驱动程序开发
- 2022-12-16回转机械扭矩监测仪数字信号无线传输的研究
- 2021-11-12基于DSP和IPM的变频调速的硬件设计
- 2022-06-06基于DSP系统的多道脉冲幅度分析器设计
- 2022-06-23显微测量系统外参数标定的研究
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。