影响视觉质量的因素

数字视频信号处理过程中的信息丢失而导致的视觉误差(visual artifacts)通常会降低可感知的视觉质量。除了之前提到的视觉误差之外,还有其它的重要因素会影响视觉质量,接下来会一一介绍。

Sensor noise and pre-filtering(传感器噪声&预过滤)

传感器噪声是在图像捕获过程中产生的、影响视觉质量的、非预期的副产物。噪声不仅会在视觉上影响用户体验,而且噪声的存在也会影响后续的图像处理,从而导致或加剧误差的产生。例如,预过滤通常在捕获图像之后、编码之前完成。在预过滤阶段,可能出现混叠效应(aliasing artifacts)或振铃效应(ringing artifacts)。因此,即使接下来采用无损编码技术,也会出现这些视觉误差。

Characteristics of video(视频特征)

视觉质量会受到数字视频本身特性的影响,这些特征包括:位深,分辨率,帧率和帧的复杂度。

通常,一般的视频帧采用8位的位深来表示像素的每个通道的数据,而更高质的视频则采用为10~16位的位深。由于格式不同,高清(HD)视频帧的大小是标清(SD)视频帧的4~6倍。超高清(UHD)视频的分辨率比标清视频高24~27倍,因此超高清视频的质量最高。

帧率是另一个重要因素。虽然HVS可以感知10 fps的慢动作,也可以感知24 fps的平滑运动,但是更高的帧率意味着更平滑的运动。尤其是是对于快速移动的物体而言,更高的帧率能够使其看起来更流畅。例如,运动中的羽毛球可能在30 fps时是模糊的,但在120 fps时会较为清晰。更快的运动需要更高的帧率才能得到较高质量的视频。例如,蜂鸟的机翼运动在30 fps甚至120 fps时都会变得模糊,可能需要1000 fps才能清晰地看到这种快速运动。更高的帧率也用于产生特殊的慢动作效果。可以用帧的细节量或者空间业务量来度量帧的复杂性。低复杂度和低细节的帧中的误差一般比更高复杂度的帧更明显。

视频的空间信息(spatial information,SI,细节)和时间信息(temporal information,TI,运动)是视频的关键参数。SI和TI对于确定视频可能达到的压缩量中起到重要作用。同时,对于确定在固定速度的数字传输服务信道传输信息时导致的信息折损等级,SI和TI也具有至关重要的作用。

Amount of compression(压缩量)

压缩一般通过对视觉质量的折中来实现。因此,对于压缩的数字视频而言,压缩量是一个很重要的指标。一般而言,压缩度越高,视频的质量则越低。对于低码率的视频而言,压缩失真(compression artifacts)更为明显,并且会降低用户体验。同时,基于可用比特数的限制,图像的不同块和不同图像会采用不同的量化。此时,压缩质量也会因为帧的复杂性的不同而不同。另外,尽管色度亚采样的压缩技术会利用HVS的特性,但是4:4:4的图像格式比4:2:0的图像格式具有更好的视觉质量。

Methods of compression(压缩方法)

无损压缩保留了视频信号中的所有信息,因此不会导致质量下降。有损压缩则通过在视觉质量和压缩量之间进行仔细权衡来控制质量损失。在有损压缩中,压缩模式的选择也会影响质量。在诸如无线网络这种容易抖动的环境中,帧内模式可以用作错误的恢复点,但是需要使用更多的比特数。

Multiple passes of processing(多次处理)

在不需要实时处理的离线视频应用中,视频信号可能经历多次通过。分析第一遍的统计数据,可以调整参数以用于后续传递。这些技术通常在最终产生的信号中产生更高的质量。然而,由于各种处理造成的误差仍可能导致一些质量损失。

Multiple generations of compression(多代压缩)

视频应用可以采用多代压缩。在多代压缩中,先将压缩视频信号解压缩,然后用不同的参数再次进行压缩。由于每代使用不同的量化图,可能导致质量下降。通常,在第二代之后,视觉质量会急剧恶化。为了避免这种质量损失,量化参数的稳健设计是必要的。

Post-production(后期制作)

后期制作中涉及的视频特效和视频剪辑可能会使编码视频序列的不同部分具有不同的质量等级。

Last updated