首页 文学文摘 时政新闻 科技科普 经济法律 健康生活 管理财经 教育教学 文化艺术 社科历史

基于小波变换和广义有限自动机的视频压缩

作者:赵国锋,康戈文,孟继成 来源:现代电子技术


  摘 要:为了改进视频编码的比特率,提出基于小波变换的位平面模型和广义有限自动机(GFA)的视频压缩。该算法是把一个连续画面中(GOP)的视频序列作为整体做小波变换,然后对小波系数的自适应量化及位平面模型。帧间,频带间,位平面间都类似成为相同位平面模型。这样可以更好地使用广义有限自动机(GFA)来压缩位平面。最后用熵编码方式编码GFA描述的节点信息为可分级的比量流,它是一个高效可分级视频编码方案。以前多数不切实际的多媒体通信应用将可能实现。
  关键词:视频压缩;广义有限自动机;小波变换;位平面
  中图分类号:TN91981文献标识码:A
  文章编号:1004-373X(2009)20-063-03
  
  Video Coding Based on Wavelet Transform and GFA Modeling
  ZHAO Guofeng,KANG Gewen,MENG Jicheng
  (University of Electronic Science and Technology of China,Chengdu,610054,China)
  Abstract:In order to improve the video coding in bitrates,a video coding scheme based on the statistical bitplane modeling and the Generalized Finite Automata (GFA) representation of video sequences in wavelet domain is presented.In the proposed scheme,a video sequence Group of Pictures (GOP) is represented as an overall binary image by bitplane modeling the coefficients of the video sequence within subbands using a generalized Gaussian quantizer,adaptive to the coefficient statistics of the video sequence.The inter-frame (motion),interband (frequency) and inter-bitplane (spectrum) similarities are optimally explored in the bitplane model,to form a compact GFA representation of the video sequence.Finally,all the transitions (edges) and the leaf nodes in the GFA representation are entropy encoded into a scalable bitstream.It is an effective scalable video coding scheme.Numerous multimedia communication applications,previously unpractical,should be envisaged with the low bitrates.
  Keywords:video compression;generalized finite automata;wavelet transform;bitplane
  
  0 引 言
  随着互联网的飞速发展,消费类电子、通信、影视及广播、计算机技术日益紧密地结合起来,使得基于互联网的多媒体产业成为本世纪初发展最快、规模最大的产业之一。在通信网络上传输,数字视频数据量的大小成为多媒体技术中非常重要的问题[1]。因此数据压缩成为电子信息领域的重要技术,数据压缩意味着减少表示某信息(如一幅图像) 所需的数据量,即减少容纳给定信息集合或数据采样集合的空间;这样一种处理技术的应用,可以有效地节省数据的存储空间,并在一定程度上缓解因信道带宽和容量不足给电子信息技术进步带来的问题。
  H.264/AVC标准是当前国际上最新的图像编码标准。它主导思想是基于块的混合编码方法。主要的技术有:4×4的整数变换与量化,基于空域的帧内预测,熵编码采用CAVLC或CABAC,去块效应滤波器等[2]。
  图1 基于小波变换和GFA的
  视频压缩编码的系统框图
  1 小波变换
  在此以小波变换和广义有限自动机编码(GFA)的视频压缩算法[3],不像传统的视频压缩算法用到I帧,P帧,B帧等概念,而是以视频序列GoP(Group of Pictures)为单位做小波变换、量化、位平面、GFA(Generalized Finite Automata)、算术编码。算法编码示意图如图1所示。
  小波变换是自1986年以来,迅速发展起来的一门新兴学科。研究平稳信号的理想工具是傅里叶分析,而非平稳信号可以分解为小波的线性组合。小波分析在时域和频域同时具有良好的局部化性质,能将图像信号分解为与人类视觉特性相匹配的不同分辨率、不同方向特性的子带,并使能量集中到某些子带,为图像的压缩提供一个有效的手段[4]。
  一维小波变换公式为:
  当f(x)∈L2(R)时,
  时域:
  cwt(s,b)=1s∫f(x)ψx-bsdx
  频域:
  CWT(s,w)=sF(w)Φ(sw)
  二维小波变换公式为:
  当f(x)∈L2(R)时,
  时域:
  cwt(s,a,b)=1sf(x,y)ψx-as,y-bsdxdy
  频域:
  CWT(s,w1,w2)=sF(w1,w2)Φ(sw1,sw2)
  对于一维信号的正交小波分解和重构均可通过子带滤波的形式实现,分别如图2所示。
  图2 一维离散小波变换
  对于二维图像,以图2分别在水平和垂直方向进行滤波的方法实现二维图像小波多辨率分解[5]。图3为经二维小波分解的频带划分示意图。
  图3 二维小波分解频带示意图
  小波变换本身并不直接引起比特率的减少,只是为减少比特率提供条件,还必须与量化技术结合才能达到压缩目的。量化是通过降低整数的精度来减少存储整数值所需位数的过程。通常对所得到的子带,根据人类的视觉生理和心理特点分别做不同策略的量化处理,其中低频子带用小步长量化,高频子带可以用大步长进行量化,以达到更好的压缩效果。
  经过小波分解后,得到低频子带图像依然保持原始图像的概貌,但由于经过多重低频滤波后,能量高度集中,系数之间的相关性很强。各面高频子带包含原图像在水平、垂直和对角线方向的高频分量,因而其中大部分区域变化幅度不大,且能量低。所以低频子带用较多层位平面表示,高频子带用较少层位平面表示。
  所谓位平面,是这样的一个平面概念:在这个平面上的是图像的某个数据位上的所有比特。比如对于24位真彩图像,它的单个像素的红色成分用一个字节来表示,则整幅图像的红色成分可以用8 个位平面来表示,从高位到低位依次是第7,第6,…,第1,第0位平面,每个位平面上包含了红色成分字节中相应数据位的比特值[6]。
  
  2 广义有限自动机
  有限自动机(Finite Automata)是为研究有限内存的计算过程和某些语言类而抽象出来的一种具有离散输入/输出系统的数学计算模型,它具有任意有限数量的内部格局或状态,用来记忆过去输入的有关信息,根据当前的输入可确定下一步的状态和行为[7]。有限自动机可以分为确定型和非确定型两种。非确定型有限自动机(NFA)可转化为确定型有限自动机(DFA)。而广义有限自动机(GFA)是一个确定型的自动机,其状态转换图中,每条边上的标识符可以是一个字而不是单个字符。它的每种转换都用一个输入符号表示,同时它还具有如图4所示的8种转换方法。变换规则为:原始,上下转,左右转,上下左右转和它们的相补。该算法GFA变换模型原理如图5所示。
  图4 图像转换示意图
  3 算法简单说明及压缩率估计
  视频一般格式为YUV,YUV主要的采样格式有YUV4∶2∶0,YUV 4∶2∶2,YUV 4∶1∶1和YUV 4∶4∶4。基中YUV4∶2∶0子采样格式是指在水平和垂直方向上每2个连续的采样点上取4个亮度Y样本,1个红色差U样本和1个蓝色差V样本,平均每个像素用1.5个样本表示。
  上述为一些基本的概念的介绍,以下是结合以上的基本概念介绍本文的算法的主要特点及压缩率的估计。本文的算法结合了小波变换和GFA压缩编码两种方法。考虑到视频压缩的稳定性,小波变换采用Daubechies小波族中的db7小波,对一个GOP视频序列(4×4=16帧)的Y分量进行三级小波分解。变换后第一级高频子带对峰-峰信噪比(PSNR)影响不大,可以不对其编码,所以压缩率的估计为1/4。而U,V分量在一个GOP视频序列变化不太,从而对压缩率估计可以不记,所以对YUV4∶2∶0子采样格式压缩率的估计为4/6。小波变换的基带系数在(0,2 048)范围内,要用步长11量化;其他层系数在(-100,100)范围内,要用步长8量化。对于基带系数只做高8位的位平面,对于其他层系数只做高4位的位平面。由于基带的系数与其他层系数的个数相比为1∶15,所以对压缩率的估计可以都按只做4位的位平面计算,又因原Y分量为8位,所以压缩率的估计为4/8。总结以上压缩率的估计为1/4×4/6×4/8=1/12。
  图5 GFA变换模型示意图
  而GFA变换模型的最小基本小块(11×9)的大小,最后只用大约1 024(210=1 024)个基本小块表示位平面。所以压缩率估计为10/(11×9),总结以上压缩率估计为1/12×10/(11×9)1/120。
  4 实验结果及分析
  该实验算法结合小波变换和GFA压缩编码两种方法。考虑到视频压缩的稳定性,小波变换采用Daubechies小波族中的db7小波对GOP的Y分量进行预处理。只对GOP的Y分量进行三级小波分解,提取三级分解后的小波系数过行位平面操作,最后经GFA编码实现二次压缩。图6为压缩前后GOP的Y分量。大量实验验证在压缩率为1/120左右时, PSNR 都在35以上。同时,由于小波视频编码具有质量分级、分辨率分级和帧率分级的特性[8],因此可以实现伸缩性压缩视频。
  图6 压缩前的GOP的Y分量和解压后的GOP的Y分量
  5 结 语
  该算法本质是利用视频帧间帧内图像本身的自相似性以减少描述视频图像所需要的比特数。广义有限自动机编码算法因其独特的设计方法与较好的编码性能更好应用于视频压缩编码领域。但仍有许多需要改进地方,至少有以下几点可以提高速度和压缩比:
  (1) 快速的小波变换算法;
  (2) 提高广义有限自动机编码算法的自适能力;
  (3) 本文用到一个GOP视频16帧为单位做压缩,可以采用一个GOP视频序列的很多帧(如8×8=64帧)为单位做压缩。
  
  参考文献
  [1]萨达卡 A H.压缩视频通信[M].卢燕飞,译.北京:科学出版社,2004.
  [2]余兆明,查日勇,黄磊.图像编码标准H.264技术[M].北京:人民邮电出版社,2006.
  [3]Bao P.Xiaohu Ma.Video Coding Based on Bitplane and GFA Modeling[A].2006 International Conference on Communications,Circuits and Systems Proceedings[C].Guilin,2006:109-113.
  [4]姚庆栋,毕厚杰,王兆华,等.图像编码基础[M].3版.北京:清华大学出版社,2006.
  [5]张春田,苏育挺,张静.数字图像压缩编码[M].北京:清华大学出版社,2006.
  [6]张国彬,罗钧,罗泽文.基于位平面自适应算术编码的小波图像压缩技术[J].光学工程,2003,30(2):68-71.
  [7]陈欢琴.基于广义有限自动机的图像压缩编码研究[D].苏州:苏州大学,2008.
  [8]全子一.图像信源压缩编码及信道传输理论与新技术[M].北京:北京工业大学出版社,2006.