Digital_Video_Concepts
  • 前言
    • 前言
  • 数字视频简介
    • 数字视频简介
    • 相关概念
    • 视频压缩
    • 权衡分析
    • 新型视频应用
    • 总结
  • 视频压缩技术
    • 数字视频压缩技术
    • 网络限制和压缩
    • 人类视觉系统
      • HVS模型
      • HVS的应用
    • 压缩技术概述
      • 数据结构和概念
      • 色度亚采样
      • 降低冗余
      • 熵编码
    • 压缩技术: 成本-收益分析
      • 变换编码技术
      • 预测编码技术
      • 其他编码技术
      • 率失真理论
    • 总结
  • 视频编码标准
    • 视频编码标准
    • 视频编码的国际标准概述
      • JPEG
      • H.261
      • MPEG-1
      • MPEG-2
      • H.263
      • MPEG-4 (Part 2)
      • AVC
      • HEVC
      • 视频质量的国际标准
    • 其他工业标准概述
      • VC-1
      • VP8
      • VP9
    • 总结
  • 视频质量度量
    • 视频质量指标
    • 压缩损失,伪像,视觉质量
      • 压缩损失:量化噪声
      • 常见的伪影
      • 影响视觉质量的因素
    • 视频质量的评估方法和指标
      • 主观视频质量评估
      • 客观视频质量评估和指标
        • 基于误差灵敏度的方法
        • 峰值信噪比
        • 基于结构相似性的方法
        • 基于信息保真度的方法
        • 时空方法
        • 基于显著性的方法
        • 网络感知方法
        • 基于噪声的质量指标
        • 客观编码效率指标
        • 基于ITU-T标准的客观的质量度量方法
    • 视频质量测量
      • 主观测量
      • 客观测量及其应用
    • 调参
      • 影响视频质量的参数
      • 参数之间的权衡
    • 总结
  • 视频编码性能
    • 视频编码性能
    • CPU速度和限制
    • 提升性能的动机
    • 对性能的考虑
      • 资源利用率最大化
      • 专用资源
      • 调整视频参数
        • 决定编码速度的因素
          • 系统配置
          • 工作负载的性质
          • 编码工具和参数
            • 独立数据单元
            • GOP结构
            • 码率控制
            • 多帧参考
            • 率失真的拉格朗日优化
            • 隔行扫描的帧/场模式
            • 自适应去块滤波器
          • 视频复杂度和格式
          • 基于GPU加速的优化
    • 性能优化方法
      • 算法优化
        • 快速算法
          • 快速变换算法
          • 快速帧内预测算法
          • 快速运动估计算法
          • 快速模式决策算法
          • 快速熵编码算法
        • 并行化方法
          • 数据分区
          • 任务并行化
          • 流水线技术
          • 数据并行化
          • 指令并行化
          • 多线程技术
          • 向量化技术
      • 编译器和代码优化
        • 编译器优化
        • 代码优化
      • 超频
      • 性能瓶颈
    • 性能度量和调整
      • 性能思考
      • 性能指标
      • 性能分析工具
    • 总结
  • 视频应用的耗电量
    • 视频应用的耗电量
    • 功耗及其限制
    • 媒体应用的工作负载
      • 媒体应用用途
    • 面向电量设计
    • 电源管理的思考
      • ACPI和电源管理
      • 操作系统电源管理
        • Linux电源管理
        • Windows电源管理
      • 处理器电源管理
      • Voltage-Frequency曲线
    • 电源优化
      • 架构级别优化
      • 算法级别优化
      • 系统整体级别优化
      • 应用级别优化
    • 电源度量
      • 度量方法论
      • 电源度量的思考
    • 测量电源的工具
      • DC电源测量系统
      • 电源测量的软件工具
    • 总结
  • 低功耗平台上的视频应用的功耗
    • 低功耗平台上的视频应用的功耗
    • 低功耗设备的重要事项
    • 低功耗平台上典型的媒体应用
      • 视频播放
      • 视频录制
      • 视频分发
      • 视频电话(会议)
    • 低功耗系统的状态
      • 简单ACPI模型的缺点
      • 待机状态
      • 低功耗状态的组合
    • 低功耗平台的电源管理
      • 电源管理的专用硬件
      • 显示器电源管理
    • 低功耗平台的思考
      • 软件设计
      • 体系结构的思考
    • 低功耗平台的电量优化
      • 快速执行然后关闭
      • Activity调度
      • 减少唤醒次数
      • 突发模式
      • 完善CPU和GPU的并行化
      • 显存带宽优化
      • 显示功耗优化
      • 存储功耗优化
    • 低功耗的度量
      • 电源的处理器信号
      • 媒体应用的功耗指标
    • 总结
  • 性能,电量以及质量的权衡
    • 性能,电量以及质量的权衡
    • 权衡分析的思考
      • 权衡分析的类型
      • 参数调整的效果
      • 优化策略
    • 权衡性能和功耗
      • Case Study
    • 权衡性能和质量
      • Case Study I
      • Case Study II
    • 权衡功耗和质量
      • Case Study
    • 总结
  • 结语
    • 结语
    • 重点和结论
    • 对未来的思考
Powered by GitBook
On this page
  • 任务并行
  • 寄存器,缓存和内存利用率
  • 优化磁盘访问
  • 指令流水线

Was this helpful?

  1. 视频编码性能
  2. 对性能的考虑

资源利用率最大化

应用程序,服务,驱动程序和操作系统会竞争重要的系统资源:包括处理器时间,内存,硬盘,网络带宽和电池电量。而这些系统资源意味着的资金的投入,从这个层面讲,为了发挥资金的最大效能,必须在尽可能短的时间内最大限度地利用可用的系统资源。从而实现,以最小功耗获得最大性能。为此,通常会采用以下技术。

任务并行

许多任务彼此之间相互独立,不存在资源的相互等待,因此可以并行运行。任务并行化能够使CPU得到充分利用。通常而言,任务流水线也可以在任务执行期间保持资源繁忙,从而实现资源利用率的最大化。

寄存器,缓存和内存利用率

存储器是分层次的,离CPU越近的存储器,速度越快,每字节的成本越高,同时容量也因此越小。

寄存器速度最快,离CPU最近,成本最高,所以个数容量有限。其次是高速缓存(缓存也是分级,有L1,L2等缓存),再次是主存(普通内存),再次是本地磁盘。

对于性能而言,优化内存层级的使用是一个重要的因素。

寄存器的操作(register transfer operations)由CPU控制并以CPU的处理速度完成。高速缓存通常为静态随机存取存储器(SRAM),并且由存储器管理单元(MMU)控制。在系统级程序中需要仔细使用多级缓存,从而平衡数据的访问延迟和数据容量。

内存一般为动态RAM(DRAM),内存的容量比缓存大得多,但数据访问速度比缓存低。采用命中率来表示相邻级别的存储器之间的数据传输性能:在某个存储器中找到信息的概率。存储器的访问频率和有效访问时间取决于程序行为和对存储器设计的选择。通常,对程序跟踪的全面分析可以产生优化的机会。

优化磁盘访问

视频编码过程会处理大量的数据。因此,与处理过程本身相比,磁盘的I/O速度、内存延迟、内存带宽等因素经常会成为性能瓶颈。很多文献提供了许多关于磁盘访问的优化技术。RAID(edundant arrays of inexpensive disks,廉价磁盘冗余阵列)是一种常见的数据存储虚拟化技术。RAID可以控制数据的访问,并可权衡磁盘的可靠性,可用性,性能和容量。

指令流水线

目前,CPU的架构有:复杂指令计算集(CISC)处理器,精简指令计算集(RISC)处理器,超长指令字集(VLIW)处理器,矢量超级计算机等。对于不同的CPU架构,每个指令的执行周期会因其对应的时钟频率的不同不同。但是,仍然需要需要认真对待指令流水线和流水线同步,从而要实现最少的无操作(NOP)和流水线停顿,进而优化资源利用率。

Previous对性能的考虑Next专用资源

Last updated 5 years ago

Was this helpful?