音视频编解码技术基础

一、名词解释

视频编码两大标准

  • MPEG标准MPEG制定:MPEG-1、MPEG-2等。
  • ITU-T标准由VCEG制定:H261、H262等。

硬编码、软编码

  • 硬编码:利用DSP来代替CPU进行编码,类似做外包。
  • 软编码:CPU自己进行编码。
    在编解码过程中,硬编码的效率要远高于软编码,并且减少CPU的功耗。

直播、点播

  • 直播:推流拉流流服务器,三者却已不可的实时播放。
  • 点播:点播首先是不需要推流这个过程。因为视频可能已经在流服务器流,根本不需要进行推送到服务器这一个过程。

视频帧

视频的基础单位,一张静态图片就是一帧。

关键帧

该类型帧可以之间转为可视且有效的图片,而非需要其他帧解码。

关键帧间隔(GOP)

关键帧与关键帧的间隔,就是一个GOP组。

帧速率(fps)

每秒播放帧的速度,单位是帧秒多少帧(fps),速率越高,视频越流畅。

视频码率

比特率,每秒传送的比特数。单位为bps,比特率越高,传送数据速度越快。
1Mbit = 128KB
1Mbit = 0.125MB

推荐取值

视频码率不推荐直接换算,只能是一个参考值。
推荐公示:N x width x height(N取值1~10)

  • 16 kbps :可视电话质量(使用者可以接受的”说话的头”照片的最低要求)
  • 128~384 kbps : 商业导向的视频会议系统质量
  • 1 Mbps :VHS质量
  • 1.25 Mbps :VCD质量(使用MPEG1压缩)
  • 5 Mbps :DVD质量(使用MPEG2压缩)
  • 8~15 Mbps :高清晰度电视(HDTV) 质量(使用H.264压缩)
  • 29.4 Mbps :HD DVD质量
  • 40 Mbps : 蓝光光碟(Blu-ray Disc) 质量(使用MPEG2、H.264或VC-1压缩)
  • 440/880 Mbps : SonyHDCAM SR质量(SQ/HQ)

帧尺寸

帧的宽高。

像素比

真的长宽比。

画面尺寸

实际显示画面的宽高尺寸。

画面比例

实际显示画面的宽高比值(16:9)。

画面深度

色彩深度,对于普通的RGB视频,8bit最常见。

alpha通道

用来存储透明信息的图像通道。

音频帧

一定数目的采样点数的集合。不同于视频帧,音频帧则需要看采样率的大小。
如果采样率为44100Hz,表示每秒采样为44100个点,ACC一帧播放时间为:1024 x 100000 / 44100 = 22.32ms

声道

单声道、2声道等。

声轨

一段视频里包含的不同的独立的声音轨道。

采样位数(量化精度)

将模拟信号分成多个等级(一个采样点用了多个位),精度越高,振幅越接近原音乐。
CD标准为16Bit,DVD标准为24Bit。

采样率

每秒钟音频采样点的个数。

音频码率

比特率,每秒传送的比特数。单位为bps,比特率越高,传送数据速度越快。
不同于视频码率,音频码率还需要计算声道数:采样率 x 采样位数 x 声道数

推荐取值

音频码率可以之间换算

  • 32 kbps :MW(AM) 质量
  • 96 kbps :FM质量
  • 128~160 kbps :相当好的质量,有时有明显差别
  • 192 kbps : 优良质量,偶尔有差别
  • 224~320 kbps : 高质量
  • 800 bps : 能够分辨的语音所需最低码率(需使用专用的FS-1015语音编解码器)
  • 8 kbps :电话质量(使用语音编码)
  • 8~500 kbps :Ogg Vorbis和MPEG1 Player1/2/3中使用的有损音频模式
  • 500 kbps~1.4 Mbps :44.1KHz的无损音频,解码器为FLAC Audio,WavPack或Monkey’s Audio
  • 1411.2~2822.4 Kbps :脉冲编码调制(PCM)声音格式CD光碟的数字音频
  • 5644.8 kbps :SACD使用的Direct Stream Digital格式

二、问题分析

比特率影响

  • 降低比特率:降低比特率导致丢失像素点值,这样会使丢失的像素点向周围的像素点取类似的值。在逐渐降低比特率后,视频的锐度上升(锐度越高画面线条和边界线越明显),降低更多的比特率后,导致丢失的像素点越来越多,这样锐度逐渐下降,开始模糊。
  • 视频文件会逐渐增大,但是可能并不会增加视频清晰度。