Digital_Video_Concepts
  • 前言
    • 前言
  • 数字视频简介
    • 数字视频简介
    • 相关概念
    • 视频压缩
    • 权衡分析
    • 新型视频应用
    • 总结
  • 视频压缩技术
    • 数字视频压缩技术
    • 网络限制和压缩
    • 人类视觉系统
      • HVS模型
      • HVS的应用
    • 压缩技术概述
      • 数据结构和概念
      • 色度亚采样
      • 降低冗余
      • 熵编码
    • 压缩技术: 成本-收益分析
      • 变换编码技术
      • 预测编码技术
      • 其他编码技术
      • 率失真理论
    • 总结
  • 视频编码标准
    • 视频编码标准
    • 视频编码的国际标准概述
      • JPEG
      • H.261
      • MPEG-1
      • MPEG-2
      • H.263
      • MPEG-4 (Part 2)
      • AVC
      • HEVC
      • 视频质量的国际标准
    • 其他工业标准概述
      • VC-1
      • VP8
      • VP9
    • 总结
  • 视频质量度量
    • 视频质量指标
    • 压缩损失,伪像,视觉质量
      • 压缩损失:量化噪声
      • 常见的伪影
      • 影响视觉质量的因素
    • 视频质量的评估方法和指标
      • 主观视频质量评估
      • 客观视频质量评估和指标
        • 基于误差灵敏度的方法
        • 峰值信噪比
        • 基于结构相似性的方法
        • 基于信息保真度的方法
        • 时空方法
        • 基于显著性的方法
        • 网络感知方法
        • 基于噪声的质量指标
        • 客观编码效率指标
        • 基于ITU-T标准的客观的质量度量方法
    • 视频质量测量
      • 主观测量
      • 客观测量及其应用
    • 调参
      • 影响视频质量的参数
      • 参数之间的权衡
    • 总结
  • 视频编码性能
    • 视频编码性能
    • CPU速度和限制
    • 提升性能的动机
    • 对性能的考虑
      • 资源利用率最大化
      • 专用资源
      • 调整视频参数
        • 决定编码速度的因素
          • 系统配置
          • 工作负载的性质
          • 编码工具和参数
            • 独立数据单元
            • GOP结构
            • 码率控制
            • 多帧参考
            • 率失真的拉格朗日优化
            • 隔行扫描的帧/场模式
            • 自适应去块滤波器
          • 视频复杂度和格式
          • 基于GPU加速的优化
    • 性能优化方法
      • 算法优化
        • 快速算法
          • 快速变换算法
          • 快速帧内预测算法
          • 快速运动估计算法
          • 快速模式决策算法
          • 快速熵编码算法
        • 并行化方法
          • 数据分区
          • 任务并行化
          • 流水线技术
          • 数据并行化
          • 指令并行化
          • 多线程技术
          • 向量化技术
      • 编译器和代码优化
        • 编译器优化
        • 代码优化
      • 超频
      • 性能瓶颈
    • 性能度量和调整
      • 性能思考
      • 性能指标
      • 性能分析工具
    • 总结
  • 视频应用的耗电量
    • 视频应用的耗电量
    • 功耗及其限制
    • 媒体应用的工作负载
      • 媒体应用用途
    • 面向电量设计
    • 电源管理的思考
      • ACPI和电源管理
      • 操作系统电源管理
        • Linux电源管理
        • Windows电源管理
      • 处理器电源管理
      • Voltage-Frequency曲线
    • 电源优化
      • 架构级别优化
      • 算法级别优化
      • 系统整体级别优化
      • 应用级别优化
    • 电源度量
      • 度量方法论
      • 电源度量的思考
    • 测量电源的工具
      • DC电源测量系统
      • 电源测量的软件工具
    • 总结
  • 低功耗平台上的视频应用的功耗
    • 低功耗平台上的视频应用的功耗
    • 低功耗设备的重要事项
    • 低功耗平台上典型的媒体应用
      • 视频播放
      • 视频录制
      • 视频分发
      • 视频电话(会议)
    • 低功耗系统的状态
      • 简单ACPI模型的缺点
      • 待机状态
      • 低功耗状态的组合
    • 低功耗平台的电源管理
      • 电源管理的专用硬件
      • 显示器电源管理
    • 低功耗平台的思考
      • 软件设计
      • 体系结构的思考
    • 低功耗平台的电量优化
      • 快速执行然后关闭
      • Activity调度
      • 减少唤醒次数
      • 突发模式
      • 完善CPU和GPU的并行化
      • 显存带宽优化
      • 显示功耗优化
      • 存储功耗优化
    • 低功耗的度量
      • 电源的处理器信号
      • 媒体应用的功耗指标
    • 总结
  • 性能,电量以及质量的权衡
    • 性能,电量以及质量的权衡
    • 权衡分析的思考
      • 权衡分析的类型
      • 参数调整的效果
      • 优化策略
    • 权衡性能和功耗
      • Case Study
    • 权衡性能和质量
      • Case Study I
      • Case Study II
    • 权衡功耗和质量
      • Case Study
    • 总结
  • 结语
    • 结语
    • 重点和结论
    • 对未来的思考
Powered by GitBook
On this page
  • 信号和采样
  • 常用术语
  • 幅型比(aspect ratio)
  • DAR(display aspect ratio)
  • PAR(pixel aspect ratio)
  • SAR(storage aspect ratio)
  • 基色(primary colors)
  • 亮度(Luma)
  • 色度(chroma)
  • 色品(chromaticity)

Was this helpful?

  1. 视频压缩技术
  2. 压缩技术概述

数据结构和概念

Previous压缩技术概述Next色度亚采样

Last updated 5 years ago

Was this helpful?

数字视频信号通常被表征为一种计算机数据形式。视频信号传感器通常输出三种颜色信号——红色,绿色和蓝色,这就是经常说的RGB颜色。RGB三种信号分别转换为数字形式并存储为图像元素(像素)阵列。和模拟视频信号不同,RGB信息不需要模拟视频信号中必须存在的消隐或同步脉冲。水平和垂直分布的像素阵列称为图像(image)或位图(bitmap),在视频领域称其为视频帧。时间序列上帧的集合则构成了完整的视频信号。位图的相关参数有5个:内存中的起始地址,每行的像素数,每帧的行数,间距值,每个像素的位数。 在以下讨论中,图像(image)和帧(frame)表述的是一个意思。

信号和采样

A/D(analog to digital)转换就是讲模拟信号转换为离散信号,A/D转换主要通过采样(sampling)实现。 采样就是按照一定时间间隔Δt\Delta tΔt在模拟信号xa(t)x_a(t)xa​(t)上逐点采取其瞬时值。

对于任意的T>0T>0T>0,如果x(n)=xa(nT)x(n)=x_a(nT)x(n)=xa​(nT),则x(n)x(n)x(n)就是模拟信号xa(t)x_a(t)xa​(t)的采样信号,其中TTT成为采样周期,2π/T2\pi/T2π/T为采样频率或采样率。

图2-4展示了信号xa(t)x_a(t)xa​(t)的空域表示极其对应的采样信号x(n)x(n)x(n)。

图2-4. 模拟型号的空域表示及其采样

利用傅里叶变换可以将信号的空域表示转换成频域表示,信号的频域表示以2π/T2\pi/T2π/T的均匀间隔描述模拟信号的频率Xa(jΩ)X_a{(j\Omega)}Xa​(jΩ),信号的振幅为1T\frac{1}{T}T1​的倍数。如图2-5所示。

图2-5. 模拟带限信号(analog bandlimited signal)采样的傅里叶变换

对于信号Xa(t)X_a(t)Xa​(t)的变换版本Xa(jΩ)X_a{(j\Omega)}Xa​(jΩ)而言,如果在Xa(jΩ)X_a{(j\Omega)}Xa​(jΩ)上存在重叠,则会因为提取的信号中有相邻副本的残余而导致发生混叠现象。如果不存在混叠,就可以利用采样信息x(n)x(n)x(n)对信号xa(t)x_a(t)xa​(t)进行还原。对于频率为[−πT,πT][-\frac{\pi}{T}, \frac{\pi}{T}][−Tπ​,Tπ​]的限带信号(band limited signal),2πT\frac{2\pi}{T}T2π​或者更高的采样率会避免混叠,此时的采样信号不会丢失有用的信息。1928年,美国电信工程师奈奎斯特首先提出该采样定理,因此称为奈奎斯特采样定理。1933年,苏联工程师科捷利尼科夫首次用公式严格地表述这一定理,因此在苏联文献中称为科捷利尼科夫采样定理。1948年信息论的创始人香农对这一定理加以明确地说明并正式作为定理引用,因此在许多文献中又称为香农采样定理。

奈奎斯特采样定理可以用于一维或多维信号的采样。 当然,可以通过使用更少的样本来实现信号的压缩,但是在采样频率小于信号最大频率的两倍的情况下,将会出现令人讨厌的混叠伪影。

常用术语

在数字视频中经常使用的几个术语我们需要了解一下。

幅型比(aspect ratio)

几何图形在不同维度上的尺寸的比例,例如,图像的幅型比是指图像的宽度和高度的比例。

DAR(display aspect ratio)

计算机显示器的宽高比。DAR的常见值为4:3和16:9,其中16:9的DAR为宽屏显示器的宽高比。

PAR(pixel aspect ratio)

像素宽高比。如果把像素想象成一个长方形,PAR即为这个长方形的长与宽的比。当长宽比为1时,这时的像素我们成为方形像素。最常用的PAR为方形像素(square pixel)。实际上还存在其他的PAR,例如12:11,16:11,但是这些很少使用。由于历史原因,PAR在视频行业中的作用非常重要。 随着数字显示技术、数字广播技术和数字视频压缩技术的发展,PAR一直是解决视频帧差异的最常用方法。如今,如上的三种技术均主要使用方形像素。

SAR(storage aspect ratio)

对图像采集时,横向采集与纵向采集构成的点阵中横向点数与纵向点数的比值。比如VGA图像640/480 = 4:3,D-1 PAL图像720/576 = 5:4。SAR∗PAR=DARSAR * PAR = DARSAR∗PAR=DAR

基色(primary colors)

因为其它颜色可以从基色的线性组合获取,例如RGB颜色模型的基色为红色、绿色和蓝色,CMYK模型的基色为青色、品红色、黄色和黑色。色彩模型中的基色是颜色空间的基本组成部分。色彩空间中的所有颜色的全集称为色域(color gamut)。标准RGB(sRGB)是计算机最常用的色彩空间。国际电信联盟(ITU)已经给出了用于标清(SD),高清(HD)和超高清(UHD)电视的色彩基色的建议。如上的建议分别包含在ITU-R BT.601、ITU-R BT.709和ITU-R BT.2020定义的数字演播室标准中。sRGB使用ITU-R BT.709建议中定义的基色。

亮度(Luma)

图像的明亮(brightness)程度,通常用于表示图像的黑白信息。虽然色彩学中的照度(luminance)和视频工程中的亮度(luma)有一些细微的差别,但是在讨论视频的时候,亮度和照度表示的是一个概念。实际上,照度(luminance)由正比于光功率的线性RGB的加权组合构成,该加权和不是计算而来,而是单位面积内光能量的表示。而亮度(luma)是非线性传递函数单独应用到每个线状光的RGB分量后(RGB分量转换为R′G′B′R'G'B'R′G′B′,′'′用来表示非线性变换),再经过非线性伽马函数(y=xγ,γ=0.45y=x^{\gamma}, \gamma=0.45y=xγ,γ=0.45)校正R′G′B′R'G'B'R′G′B′分量后的加权和构成。需要伽玛函数来补偿感知视觉的特性,以便在感知上将噪声均匀地分布在从黑色到白色的色调范围内,同时使用更多位来表示对人眼更敏感的颜色信息。没有学过色彩学的电视工程师经常误将亮度(Y′Y'Y′,luma)说成照度(lumanance),并表示为YYY,这导致了很多的混乱。虽然在视频中,我们可以模糊这两者的细微差别,但是在用的时候务必需要清楚其差别。

色度(chroma)

亮度通常都会和色度(chroma)一起描述。色度主要用来表示光的色彩信息。由于人的实力对颜色信息的感知能力比亮度感知能力要弱很多,因此对于色度信息而言,经常会采用亚采样的方式。色度亚采样会在不丢失敏感的色度信息的前提下以较低分辨率处理和存储色度信息。在分量视频(component video)中,传递色彩信息的3个分量都是分别传送的。在传送的过程中,并不直接发送R′G′B′R'G'B'R′G′B′信息,取而代之的是传送三个衍生的分量——亮度信息(Y′Y'Y′)和两个色差信息:B′−Y′B'-Y'B′−Y′和R′−Y′R'-Y'R′−Y′。。在模拟视频中,分别用UUU和VVV来表示如上的色差信息。而在数字视频中,我们分别用CBC_BCB​和CRC_RCR​来表示如上的色差信息。实际上,UUU和VVV仅仅用在模拟视频中,但是这中表述也经常会被误用在数字视频中。

色品(chromaticity)

色品用来描述色彩信号的特性,而色度(chroma)用来描述信号之间的色差信息。一般而言区分色品和色度的概念是一件很容易的事情。实践中,我们仅仅利用色品信息(不考虑照度信息)来客观度量色彩信息的质量。色品的特征在于色相(hue)和饱和度(saturation)。色相用于说明颜色是“红色”,“绿色”等。色相以单色调的色轮中的度数来度量。颜色信号的饱和度则是它与灰色的差异程度。图2-6展示了ITU-R BT.709和ITU-R BT.2020建议书中定义的色品图。从图中可以看出,因为不同标准的差异性,利用ITU-R BT.2020色彩表示的视频信号不能直接在BT.709色彩的设备上显示。为了如实的重建真实的色彩,需要对不同标准的基色进行适当的转换。

图2-6. ITU-R BT.601, BT.709, BT.2020 定义的色品坐标及其基色坐标,D65代表白色

可以用如下的公式将R′G′B′R'G'B'R′G′B′样本转换为Y′CBCRY'C_BC_RY′CB​CR​样本。

Y′=KrR′+KgG′+KbB′CB=B′−Y′2(1−Kb)CR=R′−Y′2(1−Kr)\begin{array}{} Y'=K_rR' + K_gG' + K_bB' \\ C_B=\frac{B'-Y'}{2(1-K_b)} \\ C_R=\frac{R'-Y'}{2(1-K_r)} \\ \end{array}Y′=Kr​R′+Kg​G′+Kb​B′CB​=2(1−Kb​)B′−Y′​CR​=2(1−Kr​)R′−Y′​​

表2-2中列举了ITU-R的不同建议中定义的Kr,Kg,KbK_r,K_g,K_bKr​,Kg​,Kb​。

表2-2. Constants of R'G'B' Coefficients to Form Luma and Chroma Components

标准

ITU-R BT.2020

0.2627

0.6780

0.0593

ITU-R BT.709

0.2126

0.7152

0.0722

ITU-R BT.601

0.2990

0.5870

0.1140

值得注意的是,如上的ITU-R建议还定义了用于表示从黑色到白色之间的可见范围的位深(bit depths)。具体可以参见ITU-R的相关建议:ITU-R BT.2020,ITU-R BT.709,ITU-R BT.601。

KrK_rKr​
KgK_gKg​
KbK_bKb​