Digital_Video_Concepts
  • 前言
    • 前言
  • 数字视频简介
    • 数字视频简介
    • 相关概念
    • 视频压缩
    • 权衡分析
    • 新型视频应用
    • 总结
  • 视频压缩技术
    • 数字视频压缩技术
    • 网络限制和压缩
    • 人类视觉系统
      • HVS模型
      • HVS的应用
    • 压缩技术概述
      • 数据结构和概念
      • 色度亚采样
      • 降低冗余
      • 熵编码
    • 压缩技术: 成本-收益分析
      • 变换编码技术
      • 预测编码技术
      • 其他编码技术
      • 率失真理论
    • 总结
  • 视频编码标准
    • 视频编码标准
    • 视频编码的国际标准概述
      • JPEG
      • H.261
      • MPEG-1
      • MPEG-2
      • H.263
      • MPEG-4 (Part 2)
      • AVC
      • HEVC
      • 视频质量的国际标准
    • 其他工业标准概述
      • VC-1
      • VP8
      • VP9
    • 总结
  • 视频质量度量
    • 视频质量指标
    • 压缩损失,伪像,视觉质量
      • 压缩损失:量化噪声
      • 常见的伪影
      • 影响视觉质量的因素
    • 视频质量的评估方法和指标
      • 主观视频质量评估
      • 客观视频质量评估和指标
        • 基于误差灵敏度的方法
        • 峰值信噪比
        • 基于结构相似性的方法
        • 基于信息保真度的方法
        • 时空方法
        • 基于显著性的方法
        • 网络感知方法
        • 基于噪声的质量指标
        • 客观编码效率指标
        • 基于ITU-T标准的客观的质量度量方法
    • 视频质量测量
      • 主观测量
      • 客观测量及其应用
    • 调参
      • 影响视频质量的参数
      • 参数之间的权衡
    • 总结
  • 视频编码性能
    • 视频编码性能
    • CPU速度和限制
    • 提升性能的动机
    • 对性能的考虑
      • 资源利用率最大化
      • 专用资源
      • 调整视频参数
        • 决定编码速度的因素
          • 系统配置
          • 工作负载的性质
          • 编码工具和参数
            • 独立数据单元
            • GOP结构
            • 码率控制
            • 多帧参考
            • 率失真的拉格朗日优化
            • 隔行扫描的帧/场模式
            • 自适应去块滤波器
          • 视频复杂度和格式
          • 基于GPU加速的优化
    • 性能优化方法
      • 算法优化
        • 快速算法
          • 快速变换算法
          • 快速帧内预测算法
          • 快速运动估计算法
          • 快速模式决策算法
          • 快速熵编码算法
        • 并行化方法
          • 数据分区
          • 任务并行化
          • 流水线技术
          • 数据并行化
          • 指令并行化
          • 多线程技术
          • 向量化技术
      • 编译器和代码优化
        • 编译器优化
        • 代码优化
      • 超频
      • 性能瓶颈
    • 性能度量和调整
      • 性能思考
      • 性能指标
      • 性能分析工具
    • 总结
  • 视频应用的耗电量
    • 视频应用的耗电量
    • 功耗及其限制
    • 媒体应用的工作负载
      • 媒体应用用途
    • 面向电量设计
    • 电源管理的思考
      • ACPI和电源管理
      • 操作系统电源管理
        • Linux电源管理
        • Windows电源管理
      • 处理器电源管理
      • Voltage-Frequency曲线
    • 电源优化
      • 架构级别优化
      • 算法级别优化
      • 系统整体级别优化
      • 应用级别优化
    • 电源度量
      • 度量方法论
      • 电源度量的思考
    • 测量电源的工具
      • DC电源测量系统
      • 电源测量的软件工具
    • 总结
  • 低功耗平台上的视频应用的功耗
    • 低功耗平台上的视频应用的功耗
    • 低功耗设备的重要事项
    • 低功耗平台上典型的媒体应用
      • 视频播放
      • 视频录制
      • 视频分发
      • 视频电话(会议)
    • 低功耗系统的状态
      • 简单ACPI模型的缺点
      • 待机状态
      • 低功耗状态的组合
    • 低功耗平台的电源管理
      • 电源管理的专用硬件
      • 显示器电源管理
    • 低功耗平台的思考
      • 软件设计
      • 体系结构的思考
    • 低功耗平台的电量优化
      • 快速执行然后关闭
      • Activity调度
      • 减少唤醒次数
      • 突发模式
      • 完善CPU和GPU的并行化
      • 显存带宽优化
      • 显示功耗优化
      • 存储功耗优化
    • 低功耗的度量
      • 电源的处理器信号
      • 媒体应用的功耗指标
    • 总结
  • 性能,电量以及质量的权衡
    • 性能,电量以及质量的权衡
    • 权衡分析的思考
      • 权衡分析的类型
      • 参数调整的效果
      • 优化策略
    • 权衡性能和功耗
      • Case Study
    • 权衡性能和质量
      • Case Study I
      • Case Study II
    • 权衡功耗和质量
      • Case Study
    • 总结
  • 结语
    • 结语
    • 重点和结论
    • 对未来的思考
Powered by GitBook
On this page

Was this helpful?

  1. 视频编码性能

CPU速度和限制

Previous视频编码性能Next提升性能的动机

Last updated 5 years ago

Was this helpful?

以下是CPU时钟速度无法无限增加的主要原因:

  • 高频电路的功耗随着频率的增加而增加,对随着而产生的热量的散热将会在某一点变得不可能。英特尔CTO Pat Gelsinger在2001年曾经预测:“十年后,微处理器将以10 GHz~30 GHz的频率运行。”然而如果是这样的话,“这些芯片将产生与核反应堆一样多的热量。”高频电路的散热是常规冷却技术的基本问题。无论从经济角度还是从工程角度来看,无限增加频率都是不可行的。

  • 诸如时钟门控和功率门控之类的现代节能技术不适用于高频电路。时钟门控中,在每个状态之前插入一个clock-enable,这样,如果数据保持不变,则不会为该状态计时。这样可以避免在写同一位时存在的大量的充电/放电而带来的浪费。但是,如上的操作会给关键时钟路径带来额外的延迟,这不适用于高频设计。在功率门控中,大型晶体管充当处理器各种功能块的电压源,当某些功能模块没有使用时则可能会关闭该功能块。但是,由于功率门控晶体管中的额外压降,其开关速度会降低。因此,该技术也不适合高频设计。

  • 晶体管的速度已达到平稳状态。尽管晶体管变得越来越小,但它们却没有变得更快。为了理解原因,让我们考虑一下电子设备的以下事实:较薄的栅极电介质会导致跨晶体管通道的电场增强,从而使其开关速度更快。晶体管栅极面积的减小意味着可以将栅极做得更薄,而无需增加为了控制节点充电而创建电场所需的负载电容。但是,在45 nm制造技术下,栅极电介质的厚度已经约为0.9 nm,约为单个SiO2SiO_2SiO2​分子的大小。用相同的材料将它制成任何更薄的材料是根本不可能的。凭借22 nm技术,英特尔利用创新的三门(tri-gate)技术来克服这一限制。此外,改变栅极电介质和连接材料有助于提高晶体管速度,但会导致解决方案比较昂贵。基本上,在20世纪80年代和90年代,晶体管尺寸的每一次缩小都会导致更快的晶体管,但是现在晶体管尺寸的缩小已经非常困难。

  • 晶体管不再是影响处理器速度的主要因素。连接晶体管的导线正成为最重要的延迟因素。随着晶体管变小,连接线变细,从而导线的电阻变高,进而使得电路的电流更低。考虑到较小的晶体管能够驱动较小的电流这一事实,很容易看出,电路路径延迟仅部分取决于晶体管的开关速度。为了克服这个问题,在芯片设计期间尝试将时钟和数据信号路由到相似的路径上,从而为这两个信号获得大约相同的传播时间。这对于需要大量数据、控制信号的任务(例如固定功能视频编解码器引擎)较为有效。但是,通用微处理器的设计很复杂,交互作用不规则,数据传输到多个位置,而这些位置并不总是紧跟时钟。不仅有反馈路径和循环,而且还有大量控制集中的资源,例如调度,分支预测,寄存器文件等。可以使用多个内核并行执行此类任务,但是当处理器频率提高时,需要使用更细的线。