王运波,卿粼波,王正勇,杨 红
(四川大学 电子信息学院 图像信息研究所,四川 成都 610065)
基于变换域Wyner-Ziv视频编码的有效重建算法
王运波,卿粼波,王正勇,杨 红
(四川大学 电子信息学院 图像信息研究所,四川 成都 610065)
为了减少分布式视频编码系统重建值与真实值之间误差,提出了基于变换域Wyner-Ziv视频编码最小均方误差(MMSE)重建的一种有效重建算法。该算法充分利用视频帧间相关性,对MMSE重建算法积分区间做出调整,当边信处于解码值对应量化区间之内时,在量化区间内利用MMSE重建;当边信息处于解码值对应量化区间之外时,对量化区间做出调整,在改进后的区间利用MMSE重建。实验结果表明,与最佳重建最小均方误差重建算法相比,该算法可以有效提高解码视频的平均PSNR。
分布式视频编码;Wyner-Ziv视频编码;MMSE重建;量化区间
当前常用的视频编码标准如MPEG、H.26x是在编码端做复杂的运动估计补偿及帧内模式的预测决定来消除视频中大量存在的冗余信息,从而获取压缩性能,编码端计算复杂度高于解码端,适用于广播及一次编码多次解码的视频系统。然而,随着视频传感器网络、无线视频监控系统、多视角视频等新型应用的出现,其要求编码端设备简单、低功耗、低复杂度,一种新的视频编码方案——分布式视频编码(DVC)应运而生,它将编码端的计算复杂度转移到解码端,在解码端做运动估计补偿,其理论基础是两大信息理论即Slepian-Wolf理论[1]和Wyner-Ziv理论[2]。这两个理论指出:利用独立编码、联合解码的方法对两个统计相关信源进行压缩,可以达到与传统联合编解码方法相同的压缩效率。目前,研究者主要以像素域Wyner-Ziv视频编码系统和变换域Wyner-Ziv视频编码系统作为研究对象,后者因结构简单,性能良好,得到了广泛关注。
DVC系统中,重建函数是解码端的关键环节,对视频解码质量有很大影响,但对它的研究有所欠缺。最初的重建方案是文献[3]提出的边界重建算法,其原理是:当边信息落于译码符号对应的量化区间内时,直接使用边信息值作为重建值;否则,使用区间边界值作为重建值。文献[4]提出了一种运动补偿重建算法来减少误差,对整帧以简单的块的形式进行运动补偿,利用前后向关键帧的信息改进重建。文献[5]在像素域中提出一种可变的重建方案,根据边信息与解码值的差距,通过调节变量λ的大小来调整边信息对最终重建的贡献值。Vatis等[6]提出一种增强重建算法,研究边信息与原始帧之间关系,利用最后得到的平均期望值来作重建。文献[7]提出了一种基于对称运动矢量和HASH码字的运动补偿内插的边信息生成算法来改善解码性能。Kubasov等[8]提出一种最小均方误差重建算法,该算法根据边信息与原始帧之间的虚拟相关噪声模型求取使得均方误差最小的期望值作为重建值,以使重建帧的均方误差最小,受到广泛的应用。文献[9]提出了一种有效重建方案,在最小均方误差重建的基础上,针对无码率传输的频带系数,根据边信息帧与原使帧之间拉普拉斯分布参数α,重构最优重建值。对于边信息落于译码符号对应区间之外的情况,文献[8-9]并未更多考虑利用边信息,此时,边信息仍有很大的参考价值,尤其边信息落入离译码符号对应区间最近的左、右区间时,因此,针对最小均方误差重建算法本文提出一种有效重建算法,当边信息处于区间之外时,根据拉普拉斯分布,删除一部分小概率区间,在新的区间利用最小均方误差重建,从而改善Wyner-Ziv视频编码中帧的重建质量。
目前最常用的DVC系统是由斯坦福大学Aaron等人[3]提出的变换域Wyner-Ziv视频编码系统,系统框图如图1所示。
图1 变换域Wyner-Ziv视频编码系统
(1)
解码端首先利用与当前WZ帧相邻的已解码关键帧求出边信息SI,将得到的SI与编码端进行相同的DCT变换和量化,得到SI的变换系数Y。然后,对接收到的校验码进行解码重构得到量化索引值q。最后,根据量化索引值q及对应的边信息值y∈Y,重建当前WZ帧的DCT系数x′,设z(q)表示量化索引值q对应量化之前的最小系数。重建算法[3]如下
(2)
式中:y表示边信息值;z(q)为量化索引值q对应的量化区间的下限值;z(q+1)为区间上限值,该算法虽然简单,但性能较差。文献[8]对该算法作出改进,将边信息帧与原WZ帧之间虚拟信道的噪声模型参数考虑在内,采用最小均方误差重建算法
x′=E[x|x∈[z(q),z(q+1)),y]=
(3)
式中:y为边信息值;[z(q),z(q+1))为量化索引值q对应的量化区间;x为区间里的某个系数;fx|y(x|y)是已知y时x的条件概率密度函数,其满足拉普拉斯分布。
图2 概率密度函数
边信息小于下边界值y
表1 真实值在预估区间比例
3.1 DC频带重建
DC频带中,系数值为正数,解码值q的量化区间为[z(q),z(q+1)),根据解码重构得到的量解码值和边信息值通过式(3)计算重建系数x′,依据上述分析,对原WZ帧系数所在区间做出调整,确定在概率高的区间里重建减少重建误差,由于边信息与解码值区间有3种关系,因此,分以下情况讨论:
1)当边信息y x′=E[x|x∈[z(q),z(q+1)-d),y]= (4) 2)当边信息y≥z(q+1),如图3b所示,q为解码值,[z(q),z(q+1))为量化区间,纵坐标曲线为概率密度函数,根据概率密度函数分布,去掉原WZ系数在区间中概率较少的一段,即图3b中阴影部分,该段距离记为d,在区间[z(q)+d,z(q+1))用最小均方误差重建,得重建系数x′ x′=E[x|x∈[z(q)+d,z(q+1)),y]= (5) 图3 边信息落于量化区间之外时概率密度函数 3)当边信息y∈[z(q),z(q+1))时,在区间[z(q),z(q+1))用式(3)重建系数x′。 3.2 AC频带重建 AC频带中,系数有正有负,其量化间隔分布是以0为对称中心,量化索引值q对应的量化区间与DC频带有些不同,为了减少系统码率,对于落在量化间隔对称中心的区间[-Δk,Δk)里的系数其量化值均记0,因此,针对AC系数,为进一步确定原WZ帧系数所在区间,减少重建误差,分以下情况讨论: 1)当解码值q!=0时,根据边信息与解码值量化区间的关系,分边信息小于区间下边界值、边信息在区间内、边信息大于区间上边界值,其重建同上述DC频带系数重建一样。 2)当解码值q=0时,此时,量化区间为[-Δk,Δk),边信息y可能小于-Δk,可能大于Δk,以及在区间内3种情况,为减少重建误差,使重建值更精确,对重建区间做出改进,具体如图4所示。 (1)y<-Δk或y∈[-Δk,-0.5Δk)时,分别如图4a、图4b所示,y表示边信息,[-Δk,Δk)为q=0时对应的量化区间,纵坐标曲线为概率密度函数,根据概率密度函数分布,此时原系数在区间[-Δk,0)概率比较大,在区间[-Δk,0)用式(3)重建系数x′。 图4 解码值为0时概率密度函数 (2)y≥Δk或y∈[0.5Δk,Δk)时,分别如图4c,4d所示,y表示边信息,[-Δk,Δk)为q=0时对应的量化区间,纵坐标曲线为概率密度函数,根据概率密度函数分布,此时原系数在区间[0,Δk)概率比较大,在区间[0,Δk)用式(3)重建系数x′。 (3)y∈[-0.5Δk,0.5Δk)时,重建系数x′用边信息y代替。 为了评估本文提出的算法,选取了常用的几种视频序列Foreman@101帧、Hall-monitor@201帧、Coastguard@201帧、Mobile@201帧进行测试,图像格式为QCIF,图帧频为30 f/s(帧/秒),图像组长GoP为2,KEY帧采用H.264/AC帧内编解码方式,WZ帧采用Wyner-Ziv编码,量化方式采用文献[11]中的Qi={8,7,6,5}4种量化表,所有率失真结果只对WZ帧亮度分量进行评估。实验中参数值d取相应频带量化步长的三分之一。在TDWZ系统平台上,将本文提出的算法与最小均方误差重建算法做了比较。 图5给出了RD性能比较,从实验结果可以看出,与最佳重建MMSE重建算法相比,在相同码率条件下使用本文提出的重建算法,可有效提高解码重构图像的PSNR。对于Foreman序列,恢复图像的PSNR平均可以提高0.32 dB;对于Coastguard序列,恢复图像的PSNR平均可以提高0.44 dB。两个序列增益不同的原因是:Foreman序列相对于Coastguard序列运动平缓,边信息质量好,此时边信息落入量化区间里的比例较大,而运动较强的Coastguard序列边信息质量相对较差,落在量化区间外的比例较大,由于对落在区间外时的重建做出改进,所以运动相对较强的Coastguard序列整体性能增益优于Foreman序列。 图6给出了Hall、Mobile序列中帧的PSNR实验结果,可以看出本文算法相对最佳重建MMSE重建算法对重建图像有一定质量提升,图中Hall序列平均PSNR增加的小,而Mobile序列增加的多,是因为Hall序列整体边信息质量好,边信息落在量化区外的情况较少,Mobile序列整体边信息质量差,落在量化区间外的比例较多,因此,Mobile序列的增益比Hall大。 图5 RD性能比较 图6 Wyner-Ziv帧客观质量比较 文中提出了一种基于最小均方误差重建的新的有效重建算法,该算法主要考虑到当边信息落在译码符号对应量化区间之内或之外时边信息的可信度。该算法中,对于边信息值落在译码符号对应量化区间之内的值,直接在量化区间里利用最小均方误差重建算法重建;对于边信息落在译码符号对应量化区间之外的值,则对量化区间做出调整,再利用最小均方误差重建算法进行重建。在不增加码率和计算复杂度的基础上,与最小均方误差重建算法相比,该方案可有效改善视频序列解码性能。 [1]SLEPIAN D,WOLF J.Noiseless coding of correlated information sources[J].IEEE Trans.Inform.Theory,1973,19(4):471-480. [2] WYNER A,ZIV J.The rate-distortion function for source coding with side information at the decoder [J].IEEE Trans.Inform.Theory,1976,22(1):1-10. [3]ARON A,ZHANG R,GIROD B.Wyner-Ziv coding of motion video[C]//Proc.36th Asilomar Conference on Signals,Systems and Computers.Pacific Grove:IEEE Press,2002:240-244. [4]SUN J,LI H.Motion compensated Wyner-Ziv video coding[C]//Proc.7th Workshop Conference on Multimedia Signal Processing.Shanghai:IEEE Press,2005:1-4. [5]YANG C L,LIN Y G,PO L M,et al.Variable reconstruction scheme for distributed video decoding[C]//Proc.2008 IEEE Region Conference(TENCON 2008).Hyderabad:IEEE Press,2008:1-5. [6]VATIS Y,KLOMP S,OSTEMANN J.Enhanced reconstruction of the quantised transform confficients for Wyner-Ziv Coding[C]//Proc.IEEE International Conferenceon Multimedia and Expo.Beijing:IEEE Press,2007:172-175. [7]史萍,罗坤.分布式视频编码中边信息的产生[J].电视技术,2010,34(11):27-29. [8]KUBASOV D,NAYAK J,GUILLEMOT C.Optimal reconstruction in Wyner-Ziv video coding with multiple side information[C]//Proc.9th Workshop Conference on Multimedia Signal Processing.Crete:IEEE Press:183-186. [9]WANG Fengqin,FAN Yangyu,JIA Meng.Efficient reconstruction scheme for transform domain Wyner-Ziv video coding[J].The Journal of China Universities of Posts and Telecommunications,2010,17(4):52-57. [10]BRITES C,PEREIRA F.Correlation noise modeling for efficient pixel and transform domain Wyner-Ziv video coding[J].IEEE Trans.Circuits and SysIems for Video Technology,2008,18(9):1177-1190. [11]ARTIGAS X,ASCENSO J,DALAI M,et al.The DISCOVER codec:architecture,techniques and evaluation [J].Picture Coding Symposium,2007,17(9):1103-1120. 王运波(1990— ),硕士生,主研图像处理、视频编码; 卿粼波(1982— ),副教授,主要研究方向为图像处理、模式识别、多媒体通信; 王正勇(1969— ),硕士生导师,主要研究方向为图像处理、模式识别、多媒体通信; 杨 红(1983— ),讲师,博士生,主要研究方向为视频通信。 责任编辑:时 雯 Efficient Reconstruction Algorithm Based on Transform Domain Wyner-Ziv Video Coding WANG Yunbo,QING Linbo,WANG Zhengyong,YANG Hong (ImageInformationInstitute,SchoolofElectronicsandInformationEngineering,SichuanUniversity,Chengdu610065,China) In order to reducing the error between the reconstructed value and the ture vale in the distributed video coding system,an efficient reconstruction algorithm based on minimun mean square error(MMSE) reconstruction is proposed for transform domain Wyner-Ziv video coding.By making full use of the temporal correlation among the video frame,the reconstruction algorithmmakes an adjustment aiming at the integral interval of MMSE reconstruction.When side information is within the decoded quantization bin, the reconstructed value is derived from using MMSE on the original quantized interval.When the side information is outside the decoded quantization bin,the integral interval is adjusted and the reconstructed value is derivedfrom using MMSE on the adjusted interval.Experimental results show that the proposed scheme can improve the averagePSNRof the reconstructed video effectively,compared with the minimum mean square error reconstruction algorithm. distributed video coding;Wyner-Ziv video coding;MMSE reconstruction;quantized interval 国家自然科学基金项目(61201388);高等学校博士学科点专项科研基金项目(20110181120009) TN919.81 A 10.16280/j.videoe.2015.05.007 2014-03-24 【本文献信息】王运波,卿粼波,王正勇,等.基于变换域Wyner-Ziv视频编码的有效重建算法[J].电视技术,2015,39(5).4 实验结果与分析
5 结论