MPEG-4编码标准是目前最新的国际编码标准规范?熏本文就其主要的内容作了简单的概述?熏并在此基础上,着重介绍了具有特色的音频对象的编码和视频对象的编码。

  1 多媒体传输集成框架

  多媒体传输集成框架(DMIF)主要解决交互网络中、广播环境下以及磁盘中多媒体应用的操作问题,通过传输多路合成比特信息,建立客户端和服务器端的握手和传输。与过去不同的是,由于MPEG-4码流中,包括许多的AV对象,一般而言,这些AV对象都有各自的缓冲器,而不仅仅是视频缓冲器和音频缓冲器。

  2 语法描述

  MPEG-4定义了一个句法描述语言来描述AV对象比特流表示和场景描述信息。这个句法描述语言是对C++的扩展,不仅易于表达其AV对象特性,而且也易于软件仿真实现与模型验证。与MPEG-4相比,MPEG-1和MPEG-2则采用一种类C语言的描述,MPEG-4描述语言反映了面向对象技术来描述对象。

  3 音频对象的编码

  视频音频的压缩编码自然仍是MPEG-4的核心所在。不过,与以前的MPEG-1、MPEG-2不同的是:MPEG-4不仅支持自然的声音(如语音和音乐),而且支持基于描述语言的合成声音,支持音频的对象特征。即一个场景中,同时有人声和背景音乐,它们也许是独立编码的音频对象。

  3.1 自然声音编码

  MPEG-4研究比较了现有的各种音频编码算法,支持2~64K的自然声音编码。如8 kHz采样频率的2~4 kbit/s的语音编码,以及8或16 kHz采样频率4~16 kbit/s的音频编码,一般采用参数编码;6~24 kbit/s的语音编码,一般采用码激励线性预测(CELP)编码技术;16 kbit/s以上码率的编码,则可采用时频(T/F)变换编码技术。这些技术实质上借鉴了已有的音频编码标准,如G.723、G.728以及MPEG-1和MPEG-2等。图1是MPGE4的可伸缩自然音频编码器示意图,包括了3种编码技术。

500)this.style.width=500;" onclick=javascript:window.open(this.src); src="http://info.broadcast.hc360.com/images/tech/04122001.jpg" οnlοad="javascript:if(this.width>500)this.style.width=500;">

  3.2 合成声音

  在合成声音编码当中,MPEG-4引入了2个极有吸引力的编码技术:文本到语音编码和乐谱驱动合成编码技术。这为网络上低比特率下交互的带有语音的游戏铺平了道路。事实上,合成声音编码技术即是一种基于知识库的参数编码。特别值得一提的是MPEG-4的乐谱驱动合成技术,在该技术中,解码器是由一种特殊的合成语言——结构化的音频管弦乐团语言(SAOL)驱动的。其中的“管弦乐团”是由不同的“乐器”组成的。当解码器不具有某一“乐器”时,MPEG-4还允许解码器从编码器下载该“乐器”到解码器,以便正确恢复合成声音。可见,MPEG-4不是提供一组角MIDI音乐标准中的“乐器”,而是提供了一个可随时扩充的“管弦乐团”,因此,其可“演奏”乐谱自然更加丰富多彩。

  4 视觉对象的编码

  同样,MPEG-4也支持对自然和合成的视觉对象编码。合成的视觉对象如2D、3D动画,人的面部表情动画等,这些合成图像单独编码,不仅可有效压缩,而且还便于操作。

  对自然视觉对象的编码,仍是MPEG-4的重点。相对于静止图像,MPEG-4采用零树小波算法(Zerotree WAVelet algorithm)以提供高压缩比,同时还提供多达11级的空间分辨率和质量的可伸缩性。

  对于运动视频对象的编码,MPEG-4采用了如图2所示的编码框图,以支持图像的编码。

500)this.style.width=500;" onclick=javascript:window.open(this.src); src="http://info.broadcast.hc360.com/images/tech/04122002.jpg" οnlοad="javascript:if(this.width>500)this.style.width=500;">

  可见,MPEG-4为了支持基于对象的编码,引入了形状编码模块。为了支持高效压缩,MPEG-4仍然采用了MPEG-1、MPEG-2中的变换、预测混合编码框架。

  对于一般的任意形状的视频对象,MPEG-4编码后的码流结构见图3。

500)this.style.width=500;" onclick=javascript:window.open(this.src); src="http://info.broadcast.hc360.com/images/tech/04122003.jpg" οnlοad="javascript:if(this.width>500)this.style.width=500;">

  对于实时的极低比特率的应用,如可视电话,MPEG-4视频编码采用极低比特率视频(VLBV)核进行编码,类似于ITU的H.263直接对矩形视频编码,而不采用形状编码模块。编码后的码流结构见图4

500)this.style.width=500;" onclick=javascript:window.open(this.src); src="http://info.broadcast.hc360.com/images/tech/04122004.jpg" οnlοad="javascript:if(this.width>500)this.style.width=500;">

  可见,MPEG-4采取了向前兼容H.263,同时,也提供了一些高层特性,如基于内容的编码。其扩充的方式见图5。

500)this.style.width=500;" onclick=javascript:window.open(this.src); src="http://info.broadcast.hc360.com/images/tech/04122005.jpg" οnlοad="javascript:if(this.width>500)this.style.width=500;">

  MPEG-4支持有误码信道传输下的鲁棒性,提供了更好的同步和误码恢复机制。

  5 场景描述

  场景描述主要用于描述以上单个的AV对象如何在一个具体AV场景坐标下的组织与同步等问题。同时还有AV对象和AV场景的知识产权保护等问题。

  6 MPEG-4展望

  MPEG-4的应用将是广泛而深远的。这一新的标准将至少可以应用于以下场合:

  a) 实时多媒体监控;

  b) 极低比特率下的移动多媒体通信;

  c) 基于内容存储和检索多媒体系统;

  d) Internet/Intranet上的视频流与可视游戏;

  e) 基于面部表情模拟的虚拟会议;

  f) DVD上的交互多媒体应用;

  g) 基于计算机网络的可视化合作实验室场景应用;

  h) 演播室和电视的节目制作。

MEPG-4标准的主要技术概览及编码(转)相关推荐

  1. 转:Linux网络IO并行化技术概览

    转:http://codinginet.com/articles/view/201605-linux_net_parallel?simple=1&from=timeline&isapp ...

  2. 《考取HCIA证书看我就够了》第五篇:[HCIA-IoT]物联网技术之感知层技术概览

    系列文章目录 <考取HCIA证书,看我就够了> 1.华为职业认证体系及HCIA介绍 2.[HCIA-IoT]物联网起源与发展 3.[HCIA-IoT]物联网技术之网络层技术概览 4.[HC ...

  3. 移动网站性能优化:网页加载技术概览

    移动网站性能优化:网页加载技术概览 2013/08/27 | 分类: IT技术 | 0 条评论 | 标签: WEB开发, 性能优化, 移动 分享到: 47 本文由 伯乐在线 - 伯乐在线读者 翻译自  ...

  4. 知识图谱入门 (一) 知识图谱与语义技术概览

    欢迎大家关注我的博客 http://pelhans.com/ ,所有文章都会第一时间发布在那里哦~ 知识图谱与语义技术概览.主要介绍知识表示.知识抽取.知识存储.知识融合.知识推理.知识众包.语义搜索 ...

  5. LoRa和LoRaWAN技术概览

    1. 引言 本文的目的是给出一个LoRa和LoraWAN技术的引导性的技术概览.低功耗广域网络(LPWAN)支持预计有数亿数量级的IoT设备中的绝大多数.LoRaWAN在设计时以自底向上的方式优化了L ...

  6. ABAP开发工具及技术概览

    ABAP开发工具及技术概览 overview:  1.REPORT(报表) :报表程序的主要作用是从数据库中抓取数据通过整理陈列出来,给企业高层或具有相关需求的人员查看.如无特殊需求,此类程序一般不需 ...

  7. 模型可解释性技术概览

    XAI系列二:模型可解释性技术概览 传统网络安全威胁分析依赖专家知识及基本的数据分析,然而随着攻击技术的复杂化.安全数据接入的多元化,高性能人工智能技术越来越多的应用到威胁分析中,试图解放安全行业的生 ...

  8. 为什么大型科技公司更会发生人员流失 标准 ceo 软件 技术 图 阅读2479 原文:Why Good People Leave Large Tech Companies 作者:steve

    为什么大型科技公司更会发生人员流失 标准 ceo 软件 技术 图 阅读2479  原文:Why Good People Leave Large Tech Companies  作者:steve bla ...

  9. 微软高性能计算服务器pdf,微软高性能计算HPCserver2008技术概览.pdf

    微软高性能计算HPCserver2008技术概览 在 11 月最新公布的第三十次全球超级计算机排行榜上,微软系统只占据了区区 6 套, 远不及 Linux 的 381 套.但作为软件行业的巨头,微软自 ...

最新文章

  1. 浅谈UWB(超宽带)室内定位技术(转载)
  2. 通过交叉验证(Cross Validation)KFold绘制ROC曲线并选出最优模型进行模型评估、测试、包含分类指标、校准曲线、混淆矩阵等
  3. Redis的数据类型以及每种数据类型的使用场景
  4. access数据库删除两个日期之间 的数据 SQL语句
  5. SQL查询入门(中篇)
  6. Java-Jdbc,JDBC连接Oracle11g实例:
  7. 29.日志路由组件(2)
  8. 【产品经验谈】详解Axure中的默认元件库
  9. 音乐播放小程序demo
  10. 怎样在计算机桌面上安装驱动器,怎么用韩博士驱动助理安装电脑驱动
  11. 【思想感悟】站在巨人的肩膀上
  12. 电脑设置定时关机的5种方法
  13. mysql实战22 | MySQL有哪些“饮鸩止渴”提高性能的方法?
  14. 使用 SHAP库 对模型预测作解释
  15. Android_插值器
  16. python 扯线木偶_年轻的50个细节
  17. 找到出问题的地方了啊
  18. 两道小学生的题----1000: 梦里的难题、1002: 拳皇
  19. 互联网入侵教育培训业 在线教育优势弊端在哪?
  20. 西门子PLC伺服大型20轴程序modbus通讯RS232通讯MES通讯气缸,通讯

热门文章

  1. #51CTO学院四周年#我在51cto学院中成长的故事
  2. 中国邮政湖北分公司校招 计算机类
  3. StringBuilder类型
  4. 微信第三方平台集成公众号发送模板消息
  5. 咖啡馆如何进行商圈分析确定选址地点
  6. biginteger 原理_Java中的BigInteger
  7. JavaScript 数组删除元素 避坑
  8. IOS--UILabel 用法详解
  9. linux添加ssh白名单,Linux设置ssh黑/白名单
  10. 荣耀4c显示无服务器,荣耀畅玩4C标准版存储紧张?教你不花钱,无限扩展