视频DSP中运动估计的快速实现
1概述:
视频是时变图象序列,是时空信号,与静态图象相比不仅在空间上存在冗余,而且在时间上存在冗余。视频的压缩一方面可以利用图象本身的空间相关性,还可以利用时间上的相关性。视频编码需要将帧内编码和帧间编码混合起来达到高的压缩率。帧内编码即单幅图象本身的编码过程,通常采用DCT变换编码方法。帧间编码可分为无运动补偿的差分脉码调制(DPCM)和有运动补偿的差分脉码调制。帧内编码通常是以宏块为单位的DCT编码,帧间编码是在帧内编码的基础上进行的,在不同帧之间以对应的宏块为对象进行DPCM编码。所谓运动补偿是指对宏块在下一帧的位置做运动估计,将该运动估计用于确定下一帧对应宏块的位置,再进行DPCM编码,使编码考虑了图象的运动分量,即对运动做了补偿,提高编码效率。
可见,运动估计是序列图象编码和计算机视觉领域中的一项关键技术,是运动补偿技术的核心部分,在目前已成为国际标准的电视图象编码方法中,从H.261、 H.263到MPEG-1、MPEG-2和MPEG-4,都无一例外用到了"简单帧间预测+运动补偿"的技术框架。本文针对VDSP芯片的运动估计部分的实现方法进行讨论。
2 运动估计的几种方案的工作原理及其比较
2.1帧间补偿技术简介
在对运动估计进行分析之前,我们先对补偿预测技术给予简要的介绍,其通常分为以下几个步骤:
⑴首先把图象分割为静止的和运动的两部分;图象分割是运动补偿的基础,但实际上要把图象分割成不同运动的物体比较困难,通常采用两种较简单的的方法。一种是把图象分为矩形子块,适当选择块的大小,把子块分为动和不动两种,估计出运动子块的位移,进行预测传输;另一种方法是对每个象素的位移进行递归估计。相比较而言,通常象素递归较块匹配法精度高,对多运动画面的适应能力也强,但只能跟踪较小的位移,且实现复杂。块匹配法(BMA)虽然精度低于象素递归法,但由于其位移跟踪能力强(不低于6-7象素/帧)且硬件实现比较方便,是目前最常用的运动估计算法,活动图象编码国际建议H.261和MPEG都采用 BMA作运动估计。由硬件实现的运动估计多采用BMA来实现,在后面我们对其硬件实现给予详细说明。
⑵估计物体的位移值;在一定的范围内,以每一象素的亮度分量作为比较量,根据前后两帧内子块所有象素的亮度分量的差的绝对值的和确定一个二维的运动矢量。即寻找前后两帧相差最小的图象块。
⑶用位移估值(即运动矢量)进行运动补偿预测;以位移估计和象素块之间的方差等指标为基础,为每个子块选出一种压缩模式。这一过程分支判断较为复杂,如在 h.261标准中,以位移块差分这一指标为基础,为每个块选择一种压缩模式,压缩模式一般有帧内模式、带有零运动矢量的帧间模式、运动补偿帧间模式和带有循环滤波的运动补偿帧间模式几种,补偿后得到预测图象,这一部分的工作量较大,用中小规模的硬件电路难以完成,一般采用软件实现。
相关文章
- 2022-09-23人机界面在铁路辅助机试验台中的应用
- 2024-07-03基于数码相机的图象数字变焦(视图插补)算法
- 2022-07-28基于力控组态软件的电加热炉温度监控系统
- 2024-06-19基于模糊技术的中央空调控制器设计
- 2024-04-10蒸汽流量计算数学模型建立方法研究
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。