视频的编解码的原理的深度学习
在时间方向上
采用基于16X16子块的运动补偿。
有表头+图片组+结束标志
由一系列图片构成。
是基本编码单元,包含一个亮度信号和两个色度信号。
由一个或多个连续的宏块构成。
运动补偿的基本单元。
宏块 —- 运动补偿的基本单元
块 —-DCT操作的基本单元
I: 帧内图(Intra Pictrue) P: 预测图(Predicted Picture) B: 双向图 (Bidirectional Pictrue)
I,P,B 表示1/25s时间间隔的帧序列画面。
MPEG的GOP结构图 (如下图所示)
I帧采用类似JPEG的编码方式实现,它不以任何其他帧做参考,仅仅进行帧内的空域冗余压缩。
I帧的编码过程简单
数据量大
由于I帧图像是不参考其他图像帧,只利用本帧的信息进行编码(即无运动预测,采用自身相关性), 因此数据量大。
随机存取
由于图像序列间无相关性,因此可随机进入图像序列进行编码。
I帧编码原理
P帧是由一个过去的I帧或P帧采用运动补偿的帧间预测进行更有效编码的方法。
预测图像P使用两种类型的参数来表示:
P帧的特点是其本身是前I帧或P帧的前向预测结果,也是产生下一个P帧的基准参考图像。
P帧的压缩算法原理
由于同时使用”过去” 和 “未来”信息, 故称为双向预测帧。
GOP类型:是指GOP中, I, B, P帧的构成情况, 如, 是否含有B、P帧以及B、P帧的发布情况, 如:
GOP尺寸: 是指多少个帧之间会出现一个I帧。
例如:
- 传统的视频编码方式是将整个视频信号作为一个内容整体进行处理,其本身不可再分割,而这与人类对视觉信息的识别习惯是不同的。
- MPEG-1和MPEG-2不能将一个视频信息完整地从视频信号中提取出来了。比如,将加有电视台台标和字幕的视频恢复成无台标、无字幕的视频。
- 解决方法:
- 编码时, 将不同的视频信息截体,即视频对象VO(Video Objects)区分对待。
- 即分别独立的决心编码与传输,将图像序列中的每一帧,看成是由不同的VO加上活动背景所组成。
- VO可以是人、车、动物等。
- VOP(Video Object Plane)视频对象平面
- 是视频对象VO在某一时刻的采样,VOP是MPEG-4视频编码的核心概念。
- VOP的编码主要由两个部分
- 一个形状编码
- 一个是纹理和运动信息编码