《数字电视技术》课件2.pptx

资源描述

1、西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码第第2 2章信章信源源编编码码2.1视频压缩技术视频压缩技术 2.2音频压缩技术音频压缩技术 2.3 压缩技术的应压缩技术的应用用思考练习题思考练习题西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码 2.1 视频压缩视频压缩技术技术2.1.1视频信号压缩的可能性视频信号压缩的可能性1.空间冗余空间冗余视频图像在水平方向的相邻像素之间、垂直方向的相邻像素之间的变化一般都很小，即存在极强的空间相关性。特别是同一景物各点的灰度和颜色之间往往存在着空间连贯性，从而产生

2、了空间冗余，常称为帧内相关性。2.时间冗余时间冗余在相邻场或相邻帧的对应像素之间，亮度和色度信息存在着极强的相关性。当前帧图像往往具有与前、后两帧西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码图像相同的背景和移动物体，只不过移动物体所在的空间位置略有不同，对大多数像素来说，亮度和色度信息是基本相同的，这称为帧间相关性或时间相关性。3.结构冗余结构冗余在有些图像的纹理区，图像的像素值存在着明显的分布模式，如方格状的地板图案等。已知分布模式，可以通过某一过程生成图像，称为结构冗余。4.知识冗余知识冗余有些图像与某些知识有相当大的相关性。如人脸的图像有固定的

3、结构，嘴的上方有鼻子，鼻子的上方有眼睛，鼻子位于脸部图像的中线上等。这类规律性的结构可由先西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码验知识得到，此类冗余称为知识冗余。5.视觉冗余视觉冗余人眼具有视觉非均匀特性，因此对视觉不敏感的信息可以适当地舍弃。在记录原始的图像数据时，通常假定视觉系统是线性的和均匀的，对视觉敏感和不敏感的部分同等对待，从而产生了比理想编码(即把视觉敏感和不敏感的部分区分开来编码)更多的数据，这就是视觉冗余。人眼对图像细节、幅度变化和图像的运动并非同时具有最高的分辨能力。人眼视觉对图像的空间分解力和时间分解力的要求具有交换性，当对

4、一方要求较高时，对另一方的要求就较低西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码根据这个特点，可以采用运动检测自适应技术，降低静止图像或慢运动图像的时间轴抽样频率，例如每两帧传送一帧；还可以降低快速运动图像的空间抽样频率。另外，人眼视觉对图像的空间、时间分解力的要求与对幅度分解力的要求也具有交换性，对图像的幅度差值存在一个随图像内容而变的可察觉门限，低于门限的幅度差值不被察觉。在图像的空间边缘(轮廓)或时间边缘(景物突变瞬间)附近，可察觉门限比远离边缘处增大34倍，这称为视觉掩盖效应。因此可以采用边缘检测自适应技术，对图像的平缓区或正交变换后代表图像

5、低频成分的系数细量化，对图像轮廓附近或正交变换后代表图像高频成分的系数粗量化；西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码当快速运动的景物使帧间预测编码码率高于正常值时进行粗量化，反之则进行细量化。在量化中，尽量使每种情况下所产生的幅度误差刚好处于可察觉门限之下，这样既能实现较高的数据压缩率而又使人眼对图像的感觉不变。2.1.2视频信号的数字化视频信号的数字化模拟视频信号通过取样、量化后编码为二进制数字信号的过程称为模/数变换(AD变换)或PCM(Pulse Coding Modulation，脉冲编码调制)，所得到的信号也称为PCM信号，其过程可

6、用图2-1(a)表示。若取样频率等于fs，用n比特量化，则PCM信号的数码率为nfs(bs)。PCM编码既可以对彩色全电视信号直接进行，也可以对亮度信号和两个色差信号分别进行。前者称为全信号编码，后者称为分量编码。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码PCM信号经解码和插入滤波后恢复为模拟信号，如图2-1(b)所示。解码是编码的逆过程，插入滤波是把解码后的信号用理想低通滤波恢复为平滑、连续的模拟信号。这两个步骤合称为数/模变换(DA变换)或PCM解码。图2-1电视信号的数字化和复原(a)A/D变换；(b)D/A变换西安电子科技大学出版社XIDI

7、AN UNIVERSITY PRESS第2章信源编码 1.奈奎斯特取样定理奈奎斯特取样定理理想取样时，只要取样频率大于或等于模拟信号中最高频率的两倍，就可以不失真地恢复模拟信号，这称为奈奎斯特取样定理。模拟信号中最高频率的两倍称为折叠频率。一般取样频率应为最高频率的35倍。2.亚奈奎斯特取样亚奈奎斯特取样按取样定理，若取样频率fs小于模拟信号最高频率fmax的两倍，就会产生混叠失真，但若巧妙地选择取样频率，令取样后频谱中的混叠分量落在色度分量和亮度分量之间，就可用梳状滤波器去除混叠成分。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码 3.均匀量化

8、和非均匀量化均匀量化和非均匀量化在输入信号的动态范围内，量化间距处处相等的量化称为均匀量化或线性量化。均匀量化时信噪比随输入信号动态幅度的增加而增加。采用均匀量化，在强信号时固然可把噪波淹没掉，但在弱信号时，噪波的干扰就十分显著。为改善弱信号时的信噪比，量化间距应随输入信号幅度而变化，大信号时进行粗量化，小信号时进行细量化，也就是采用非均匀量化，或称非线性量化。非均匀量化有两种方法。一是把非线性处理放在编码器前和解码器后的模拟部分，编、解码仍采用均匀量化，在均匀量化编码器之前，对输入信号进行压缩，这样等效西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码于

9、对大信号进行粗量化，对小信号进行细量化；在均匀量化解码器之后，再进行扩张，以恢复原信号。另一种方法是直接采用非均匀量化器，输入信号大时进行粗量化(量化间距大)，输入信号小时进行细量化(量化间距小)。也有采用若干个量化间距不等的均匀量化器，当输入信号超过某一电平时进入粗间距均匀量化器，低于某一电平时进入细间距量化器，这称为准瞬时压扩方式。通常用Q表示量化，用IQ或Q1表示反量化。量化过程相当于由输入值找到它所在的区间号，反量化过程相当于由量化区间号得到对应的量化电平值。量化区间总数远远小于输入值的总数，所以量化能实现数据压缩。很明显，西安电子科技大学出版社XIDIAN UNIVERSITY PR

10、ESS第2章信源编码反量化后并不能保证得到原来的值，因此量化过程是一个不可逆过程，用量化的方法来进行压缩编码是一种非信息保持型编码。通常这两个过程均可用查表法实现，量化过程在编码端完成，而反量化过程则在解码端完成。对量化区间标号(量化值)的编码可以采用等长编码方法，当量化分层总数为K时，经过量化压缩后的二进制数码率为lb Kb量化值。也可以采用可变字长编码如哈夫曼编码或算术编码来进一步提高编码效率。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码 4.ITU-R BT.601分量数字系统分量数字系统数字视频信号是将模拟视频信号经过取样、量化和编码而

11、形成的。模拟电视有PAL、NTSC等制式，必然会形成不同制式的数字视频信号，不便于国际数字视频信号的互通。1982年10月，CCIR(Consultative Committee for International Radio，国际无线电咨询委员会)通过了第一个关于演播室彩色电视信号数字编码的建议，1993年变更为ITU-R(Interna-tional Telecommunications Union-Radio communications Sector，国际电联无线电通信部门)BT.601分量数字系统建议。我国对应的国家标准为GB/T1485793演播室数字电视编码参数规范。西安电子科技

12、大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码 BT.601建议采用对亮度信号和两个色差信号分别编码的分量编码方式，对不同制式的信号均采用相同的取样频率，对亮度信号Y采用的取样频率为13.5 MHz。由于色度信号的带宽远比亮度信号的带宽窄，因此对色度信号U和V的取样频率为 6.75 MHz。每个数字有效行分别有720个亮度取样点和3602个色差信号取样点。对每个分量的取样点都是均匀量化的，即对每个取样进行8 b精度的PCM编码。Y信号的黑、白电平分别对应16级和235级；U和V信号的最大正电平对应240级，零电平对应128级，最小负电平对应16级。这几个参数对52

13、5行、60场秒和625行50场秒的制式都是相同的。有效取样点是指只有行、场扫描正西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码程的样点有效，逆程的样点不在PCM编码的范围内。因为在数字化的视频信号中不再需要行、场同步信号和消隐信号，所以用定时基准码SAV(Start of Active Video)代表有效视频开始，用定时基准码EAV(End of Active Video)代表有效视频结束。定时基准码占用4个字节，前3个字节是0FF0000H，第4个字节是奇偶标志、场正程、逆程标志和校验位。HDTV中常采用10比特量化，定时基准码占用4个字，每个字1

14、0比特，第1个字全为“1”，后面2个字全为“0”，第4个字是奇偶标志、场正程、逆程标志和校验位。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码对应于每个有效行的数据是1728个样值，其中有效图像样值为1440个，定时基准码为8个，行消隐期的280个样值传送辅助信息。场消隐期也传送辅助信息，辅助信息有时间码、宽高比、测试诊断信息、数字音频信息和图文电视。色度信号的取样率是亮度信号的取样率的一半，常称作422格式，可以理解为每一行里的Y、U、V的样点数之比为422。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码2

15、.1.3熵编码熵编码熵编码(Entropy Coding)是一类无损编码，因编码后的平均码长接近信源的熵而得名。熵编码多用可变字长编码(Variable Length Coding，VLC)实现。其基本原理是对信源中出现概率大的符号赋予短码，对出现概率小的符号赋予长码，从而在统计上获得较短的平均码长。所编的码应是即时可译码，且某一个码不会是另一个码的前缀，各个码之间无需附加信息便可自然分开。1.Huffman编码编码霍夫曼(Huffman)编码是一种可变长编码，编码方法如图2-2所示。其具体步骤是：西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码 (1)

16、将输入信号符号以出现概率由大至小为序排成一列。(2)将两处最小概率的符号相加合成为一个新概率，再按出现概率大小排序。(3)重复步骤(2)，直至最终只剩两个概率。(4)编码从最后一步出发逐步向前进行，概率大的符号赋予“0”码，另一个概率赋予“1”码，直至到达最初的概率排列为止。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码图2-2Huffman编码西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码 2.算术编码算术编码Huffman编码的每个代码都要使用一个整数位，如果一个符号只需要用2.5位就能表示，在Huffma

17、n编码中却必须用3个符号表示，因此它的效率较低。与其相比，算术编码并不为每个符号产生一个单独的代码，而是使整条信息共用一个代码，增加到信息上的每个新符号都递增地修改输出代码。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码假设信源由4个符号s1、s2、s3和s4组成，其概率模型如表2-1所示。把各符号出现的概率表示在如图2-3所示的单位概率区间之中，其中区间的宽度代表概率值的大小，各符号所对应的子区间的边界值实际上是从左到右各符号的累积概率。在算术编码中通常采用二进制的小数来表示概率，每个符号所对应的概率区间都是半开区间，如s1对应0，0.001)，s

18、2对应0.001，0.011)。算术编码所产生的码字实际上是一个二进制小数值的指针，该指针指向所编的符号对应的概率区间。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码表表2-1信源概率模型和算术编码信源概率模型和算术编码过程过程西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码图2-3算术编码过程示意图西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码例例1将符号序列s3s3s2s4进行算术编码，序列的第一个符号为s3，我们用指向图2-3中第3个子区间的指针来代表这个符号，由

19、此得到码字0.011。后续的编码将在前面编码指向的子区间内进行。将0.011，0.111区间再按符号的概率值划分成4份，对第2个符号s3，指针指向0.1001，码字串变为0.1001。然后s3所对应的子区间又被划分为4份，开始对第3个符号进行编码算术编码的基本法则如下：(1)初始状态：编码点(指针所指处)C0=0，区间宽度A0=1。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码 (2)新编码点：Ci=Ci1+Ai1Pi (2-1)式中：Ci1是原编码点，Ai1是原区间宽度，Pi为所编符号对应的累积概率。新区间宽度：Ai=Ai1pi (2-2)式中：pi

20、为所编符号对应的概率。根据上述法则，对序列s3s3s2s4进行算术编码的过程如下：第个符号s3：C1=C0+A0P1=0+10.011=0.011西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码A1=A0p1=10.1=0.10.011，0.111)第2个符号s3：C2=C1+A1P2=0.011+0.10.011=0.1001 A2=A1p2=0.10.1=0.010.1001，0.1101)第3个符号s2：C3=C2+A2P3=0.1001+0.010.001=0.10011A3=A2p3=0.010.01=0.00010.10011，0.10101

21、)第4个符号s4：C4=C3+A3P4=0.10011+0.00010.111=0.1010011西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码 A4=A3p4=0.00010.001=0.00000010.1010011，0.10101 3.游程编码游程编码游程编码(Run Length Coding，RLC)是一种十分简单的压缩方法，它将数据流中连续出现的字符用单一的记号来表示。游程编码的压缩率不高，但编码、解码的速度快，因而仍得到了广泛的应用，特别是在变换编码及进行Z字形(zig-zag)扫描后，再进行游程编码，会有很好的效果。西安电子科技大学出

22、版社XIDIAN UNIVERSITY PRESS第2章信源编码 2.1.4预测编码和变换编码预测编码和变换编码1.DPCM原理原理基于图像的统计特性进行数据压缩的基本方法就是预测编码。它利用图像信号的空间或时间相关性，用已传输的像素对当前的像素进行预测，然后对预测值与真实值的差预测误差进行编码处理和传输。目前用得较多的是线性预测方法，其全称为差值脉冲编码调制(Differential Pulse Code Modulation，DPCM)。利用帧内相关性(像素间、行间的相关)的DPCM被称为帧内预测编码。如果对亮度信号和两个色差信号分别进行DPCM编码，即对亮度信号采用较高的取样率和较

23、多位数西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码编码，对色差信号用较低的取样率和较少位数编码，那么构成时分复合信号后再进行DPCM编码，数码率可以更低。利用帧间相关性(邻近帧的时间相关性)的DPCM被称为帧间预测编码，因帧间相关性大于帧内相关性，所以其编码效率更高。若把这两种DPCM组合起来，再配上变字长编码技术，就能获得较好的压缩效果。DPCM是图像编码技术中研究得最早且应用最广的一种方法，它的一个重要特点是算法简单，易于硬件实现。图2-4(a)是它的示意图。编码单元主要包括线性预测器和量化器两部分。编码器的输出不是图像像素的样值f(m，n)，而

24、是该样值与预测值西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码g(m，n)之间的差值，即预测误差e(m，n)的量化值E(m，n)。根据图像信号统计特性的分析，给出一组恰当的预测系数，使预测误差主要分布在“0”附近,再经非均匀量化，采用较少的量化分层，图像数据便得到了压缩，而量化噪声又不易被人眼所觉察，图像的主观质量并不明显下降。图2-4(b)是DPCM解码器，其原理和编码器刚好相反。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码图2-4DPCM原理(a)DPCM编码器；(b)DPCM解码器西安电子科技大学出版社

25、XIDIAN UNIVERSITY PRESS第2章信源编码 DPCM的编码性能主要取决于预测器的设计。设计预测器时要确定预测器的阶数N以及各预测系数。图2-5是一个四阶预测器的示意图，其中图(a)表示预测器所用的输入像素和被预测像素之间的位置关系，图(b)表示预测器的结构。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码图2-5四阶预测器(a)输入像素和被预测像素的位置关系；(b)预测器的结构西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码 2.变换编码原理变换编码原理图像变换编码是将空间域里描述的图像经过

26、某种变换(如傅立叶变换、离散余弦变换、沃尔什变换等)，在变换域中进行描述，即将图像能量在空间域的分散分布变为在变换域的相对集中分布，便于用Z字形扫描、自适应量化、变长编码等进一步处理，完成对图像信息的有效压缩。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码先从一个实例来看一个域的数据变换到另一个域后其分布是如何改变的。以12像素构成的子图像，即相邻两个像素组成的子图像为例，每个像素有3 b编码，取07共8个灰度级，两个像素有64种可能的灰度组合，由图2-6(a)中的64个坐标点表示。一般图像的相邻像素之间存在着很强的相关性，绝大多数的子图像中相邻像素

27、灰度级相等或很接近，也就是说，在x1=x2直线附近出现的概率大，如图2-6(a)中的阴影区所示。现在将坐标系逆时针旋转45，如图2-6(b)所示。在新的坐标系y1、y2中，概率大的子图像区位于y1轴附近，表明变量y1、y2之间的联系比变量x1、x2之间的联系在统计西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码上更加独立，方差也重新分布。在原来的坐标系中，子图像的两个像素具有较大的相关性，能量的分布比较分散，两者具有大致相同的方差。而在变换后的坐标系中，子图像的两个像素之间的相关性大大减弱，能量分布向y1轴集中，y1的方差也远大于y2。这种变换后坐标轴上

28、方差不均匀分布的情况正是正交变换编码能够实现图像数据压缩的理论根据。若按照人的视觉特性，只保留方差较大的那些变换系数分量，就可以获得更大的数据压缩比，这就是视觉心理编码的方法。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码图2-6变换编码的物理意义(a)子图像在阴影区的概率较大；(b)旋转变换后西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码把一个nn像素的子图像看成n2维坐标系中的一个坐标点。在n2维坐标系中，每一个坐标点对应于n2个像素。这个坐标点的数值是其对应的n2个像素的灰度组合。图像在n2维变换域中的

29、相关性大大下降，因此用变换后的系数进行编码，比直接用图像数据编码会获得更大的数据压缩。变换编码将被处理数据按照某种变换规则映射到另一个域中去处理，常采用二维正交变换的方式。若将整个图像作为一个二维矩阵，则变换编码的计算量太大，所以将一幅图像分成一个个小图像块，通常是88或1616的小方块，每个图像块可以看成一个二维数据矩阵，变换编码西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码以这些小图像块为单位，把统计上密切相关的像素构成的矩阵通过线性正交变换，变成统计上较为相互独立甚至完全独立的变换系数所构成的矩阵。信息论的研究表明，变换前后，图像的信息量并无损失

30、，可以通过反变换得到原来的图像值。统计分析表明，正交变换后，数据的分布向新坐标系中的少数坐标集中，且集中于少数的直流或低频分量的坐标点。正交变换并不压缩数据量，但它去除了大部分相关性，数据分布相对集中，可以依据人的视觉特性对变换系数进行量化，允许引入一定量的误差，只要它们在重建图像中造成的图像失真不明显，或者能达到所要求的观赏质量就行。量化可以增加许多不用编码的0系数，西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码然后再对量化后的系数实行变长编码。3.离散余弦变换离散余弦变换(DCT)在常用的正交变换中，离散余弦变换(Discrete Cosine T

31、ransform，DCT)的性能接近最佳，是一种准最佳变换。DCT矩阵与图像内容无关，由于它构造成对称的数据序列，因而避免了子图像轮廓处的跳跃和不连续现象。DCT也有快速算法FDCT，在图像编码的应用中，大都采用二维DCT。88 DCT和88 DCT反变换的数学表达式分别为西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码其中:当u=v0时，；当u=v其它值时，C(u)=C(v)=1。88 DCT的变换核函数为按u、v分别展开后得到88个88点的像块组，称为基图(2-3)(2-4)西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信

32、源编码像，如图2-7所示。u=0和v=0对应左上方的像块，图像在x和y方向都没有变化；u=7和v=7对应右下方的像块，图像在x和y方向上的变化频率是最高的。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码图2-788 DCT的基图像西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码可以把DCT过程看做是把一个图像块表示为基图像的线性组合，这些基图像是输入图像块的组成“频率”。DCT输出的64个基图像的幅值称为DCT系数，是输入图像块的“频谱”。64个变换系数中包括一个代表直流分量的“DC系数”和63个代表交流

33、分量的“AC系数”。可以把DCT反变换看做是用64个DCT变换系数经逆变换运算，重建一个64点的图像块的过程。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码对于一般图像，在二维DCT的变换域中，幅值较大的系数集中在低频区域。图2-8是一幅图像上的两个88像素矩阵及其二维DCT系数矩阵。图2-8(a)是背景区域的一小块图像，它的系数矩阵左上角的50为DCT系数的直流分量，它标志着该块图像的亮度平均值；其余系数皆为零，说明在变换域中系数的分布是相当集中的。图2-8(b)为细节较多的区域里的一小块图像，其系数的分布集中的程度要差一些。西安电子科技大学出版社

34、XIDIAN UNIVERSITY PRESS第2章信源编码图2-8图像块的DCT变换(a)背景部分图像块的DCT；(b)细节部分图像块的DCT西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码对自然景物图像的统计表明，DCT系数矩阵的能量集中在反映水平和垂直低频分量的左上角。量化以后，DCT系数矩阵变得稀疏，位于矩阵右下角的高频分量系数大部分被量化为零。游程编码的思想是：用适当的扫描方式将已量化的二维DCT系数矩阵变换为一维序列，所用的扫描方式应使序列中连零的数目尽量多，或者说使序列中连零的游程尽量长。对游程的长度进行游程编码(Run Lengt

35、h Coding，RLC)，以替代逐个地传送这些零值，就能进一步实现数据压缩。常用的Z字形扫描和交替扫描如图2-9所示。MPEG-2标准中规定可以选用交替扫描。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码图2-9游程编码(a)Z字形扫描；(b)交替扫描西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码游程编码的方法是将扫描得到的一维序列转化为一个由二元数组(run，level)组成的数组序列，其中run表示连零的长度，level表示这串连零之后出现的一个非零值。当剩下的所有系数都为零时，用一个符号EOB(End

36、 of Block，块结束)来代表。4.混合编码混合编码混合编码是近年来广泛采用的方法，这种方法充分利用各种单一压缩方法的长处，以期在压缩比和效率之间取得最佳的平衡。如广泛流行的JPEG和MPEG压缩方法都是典型的混合编码方案。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码2.1.5静止图像压缩标准静止图像压缩标准静止图像是指内容不变的图像，可能是不活动场景图像或是活动场景图像某一瞬时的“冻结”图像。静止图像编码是指对单幅图像的编码。静止图像用于传送文件、模型、图片和现场的实况监视图像。实况监视每隔一定时间间隔更换一幅新的图像，可以不连续地看到现场的情

37、况，是一种准实时的监视。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码对静止图像进行编码有以下要求：(1)清晰度：静止图像中的细节容易被观察到，要求有更高的清晰度。(2)逐渐浮现(Progressive Build up)的显示方式：在传输频带较窄时为了减少等待时间，要求编码能提供逐渐浮现的显示方式，即先传模糊的整幅图像，再逐渐变清晰。(3)抗干扰：一幅图像的传输时间较长，各种干扰噪声的显示时间也较长，影响观看，要求编码与调制方式都有较强的抗干扰能力。图2-10是静止图像数字传输系统示意图。摄像机摄取的全电视信号，经数据采集卡捕获一帧图像，数字化后存

38、西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码放在帧存储器中(也可用数字摄像机直接得到数字图像)。编码器对存放在帧存储器中的数字图像进行压缩编码，因时间充裕可采用较复杂的算法提高压缩比，保持较高的清晰度。然后把编码经调制后送到信道中传输。接收的过程则相反，信号经解调、解码后送至帧存储器，然后以一定的方式读出，经DA变换后在显示屏上显示或被拷贝下来。图2-10静止图像数字传输系统西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码静止图像的主要编码方法是DPCM 和变换编码。JPEG是ISO(Internationa

39、l Standardization Organization，国际标准化组织)IEC(International Electrotechnical Committee，国际电工技术委员会)和ITUT(International Telecommunications Union，国际电信联盟)的联合图片专家小组(Joint Photographic Experts Group)的缩写。1991年3月，JPEG建议(ISOIEC10918号标准)“多灰度静止图像的数字压缩编码(通常简称为JPEG标准)”正式通过，这是一个适用于彩色和单色多灰度或连续色调静止数字图像的压缩标准，包括无损压缩及基于离散

40、余弦变换和Huffman编码的有损压缩两个部分。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码基本JPEG算法的操作可分成6个步骤，如图2-11所示。(1)彩色坐标转换。彩色坐标转换是要去除数据冗余量，它不属于JPEG算法，因为JPEG是独立于彩色坐标的。压缩可采用不同坐标(如RGB、YUV、YIQ等)的图像数据。图2-11JPEG算法步骤西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码 (2)离散余弦变换(DCT)。JPEG采用的是88子块的二维离散余弦变换算法。在编码器的输入端，把原始图像(U、V的像素是Y

41、的一半)顺序地分割成一系列88的子块。在88图像块中，像素值变化缓慢，具有较低的空间频率。进行二维88离散余弦变换可以将图像块的能量集中在极少数系数上。DCT的(0，0)元素是块的平均值，其它元素表明在每个空间频率下的谱能为多少。一般地，离原点(0，0)越远，元素衰减得越快。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码(3)量化。为了达到压缩数据的目的，对DCT系数需作量化处理。量化的作用是在保持一定质量的前提下，丢弃图像中对视觉效果影响不大的信息。量化是多对一映射，是造成DCT编码信息损失的根源。JPEG标准中采用线性均匀量化器，量化过程为对64个

42、DCT系数除以量化步长并四舍五入取整，量化步长由量化表决定。量化表元素因DCT系数的位置和彩色分量的不同而取不同值。量化表为88矩阵，与DCT变换系数一一对应。JPGE标准根据人类视觉特性和压缩图像的特点给出了亮度量化表和色度量化表(见表2-2和表2-3)。DCT变换系数除以量化表中对应位置的量化步长并舍去小数部分后，多数变为零，从而达到了压西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码缩的目的。从量化表中可以看出，左上角量化间隔小而右下角量化间隔大，这是因为图像的低频分量最重要，量化间隔小，量化误差也小，精度高；图像的高频分量只影响图像的细节，精度要

43、求可以低一些，量化间隔可以大一些。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码表表2-2JPEG亮度量化表亮度量化表西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码表表2-3JPEG色度量化色度量化表表西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码 (4)差值脉冲编码调制(DPCM)。64个变换数经量化后，DCT的(0，0)元素是直流分量(DC系数)，即空间域中64个图像采样值的均值。相邻88子块之间的DC系数一般有很强的相关性，变化应该较缓慢。JPEG标准对DC系数采

44、用DPCM编码方法，即对相邻像素块之间的DC系数的差值进行编码，这样能将它们中的大多数数值减小。(5)交流分量游程编码。其余63个交流分量(AC系数)采用游程编码。如果从左到右、从上到下地扫描块，则零元素不集中，因此采用从左上角开始沿对角线方向的Z字形扫描。量化后的AC系数通常会有许多零值。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码 (6)熵编码。为了进一步压缩数据，需对DC和AC的码字再作统计特性的熵编码。JPEG标准推荐采用Huffman编码，并给出差分编码和游程编码变换为Huffman编码的码表。西安电子科技大学出版社XIDIAN UNIVE

45、RSITY PRESS第2章信源编码2.1.6 活动图像压缩标准活动图像压缩标准MPEG2 活动图像压缩标准MPEG 2制定以前已经存在多种图像压缩标准,MPEG 2是在这些标准的基础上制定的。表2 4是常用图像标准的名称、编号和主要应用。MPEG 2标准MPEG(MovingPicturesExpertsGroup,活动图像专家组,正式名称是ISO/IECJTC1/SC29/WG11)工作组制定的第二个国际标准,标准号是ISO/IEC13818,名称是通用的运动图像及其伴音的编码。它主要包括系统、视频、音频、一致性、参考软件、数字存储媒体的命令与控制、高级音西安电子科技大学出版社XID

46、IAN UNIVERSITY PRESS第2章信源编码频编码、10比特视频编码和实时接口9个部分。我国相应的国家标准是GB/T17975信息技术运动图像及其伴音信息的通用编码。作为一个通用的编码标准,其应用范围很广,包括标准清晰度电视、高清晰度电视和MPEG 1的工作范围。MPEG 2的解码器可以对MPEG 1码流进行解码。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码表表2-4 常用常用图像标准的名称、编号和主要应用图像标准的名称、编号和主要应用西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码 1.类和级

47、为了适应不同的数字电视体系,MPEG-2有四种输入格式(用级(Levels)加以划分)和五种不同的处理方法(用类(Profiles,也译成档次)加以划分)。(1)低级(Low Level,LL)的图像输入格式,以亮度像素(Pixel,记为pel)数目计算,为35224030pel/s或35228825pel/s,最大输出数码率是4Mb/s。(2)主级(Main Level,ML)的图像输入格式完全符合ITU R601标准,即72048030pel/s或72057625pel/s,最大输出数码率为15Mb/s(高类主级是20Mb/s)。西安电子科技大学出版社XIDIAN UNIVERSITY

48、PRESS第2章信源编码 (3)高1440级(High 1440 Level,H14L)的图像输入格式是1440 1152pel/s的高清晰度格式,最大输出数码率为60Mb/s(高类为80Mb/s)。(4)高级(High Level,HL)的图像输入格式是1920 1152 pel/s的高清晰度格式,最大输出数码率为80Mb/s(高类为100Mb/s)。在MPEG-2的五个类中,每升高一类将提供前一类未使用的附加的码率压缩工具,编码更为精细。类之间存在向后兼容性,若接收机能解码用高类工具编码的图像,也就能解码用较低类工具编码的图像。(1)简单类(Simple Profile,SP)是最低

49、的类。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码 (2)主类(Main Profile,MP)比简单类增加了双向预测压缩工具。主类没有可分级性,但质量要尽量好。(3)信噪比可分级类(SNR Scalable Profile,SNRP)。(4)空间可分级类(Spatially Scalable Profile,SSP)。SNRP和SSP两个类允许将编码的视频数据分为基本层以及一个以上的上层信号。基本层包含编码图像的基本数据,但相应的图像质量较低,上层信号用来改进信噪比或清晰度。以上四个类是逐行顺序处理色差信号的(例如420)。西安电子科技大学出版社X

50、IDIAN UNIVERSITY PRESS第2章信源编码 (5)高类(High Profile,HP)则支持逐行同时处理色差信号(例如422),并且支持全部可分级性。MPEG-2的类和级见表2 5,表中MPEG-2格式用类和级的英文缩写词来表示。例如,MPML指的是主类和主级,目前标准清晰度数字电视采用这种格式;MPHL指的是主类和高级,在高清晰度数字电视中采用这种格式。在表25中只列出了在20种可选组合中的11种获准通过的组合,这些格式称为MPEG-2适用点。以上这些标准的幅型比都是43。西安电子科技大学出版社XIDIAN UNIVERSITY PRESS第2章信源编码表2-5

展开阅读全文