skip to Main Content

新闻

欲了解有关MPEG-H Audio的最新信息,请访问音频博客网站:

https://www.audioblog.iis.fraunhofer.com/cn/tag/mpeg-h-cn

常见问题解答

MPEG-H Audio是一种全新的下一代音频技术,让声音从用户上方和周围发出,可提供更真实的效果。凭借其独特的个性化功能,MPEG-H Audio赋予用户极大的选择权,使其能够主动参与到内容中来并根据自己的喜好进行调整。在任何设备上,MPEG-H Audio系统都能带来最佳声音体验。

MPEG-H Audio是一个完整的音频解决方案,远不止是一个编解码器。与传统音频编解码器相比,MPEG-H Audio主要具有以下几大优势:

1)沉浸声:MPEG-H Audio通过在用户上方和下方添加高度声源,以便传送三维沉浸式音频(3D音频)。MPEG-H Audio专为灵活的扬声器信号而设计,包括传统布局,如立体声、5.1、7.1以及3D配置,即5.1+4H、7.1+4H或22.2,甚至包括尚未定义的布局。在MPEG-H Audio中,沉浸声能够以通道、对象或二者结合的形式进行传输。

2)交互式和个性化声音:MPEG-H Audio支持用户与内容进行互动,并创造个性化的音频体验。高级交互选项的范围下至简单调整,如根据其他音频元素调节对白音量,上至高级场景,在这些场景中,用户可以选择音频元素并根据喜好调节其音量和/或位置,但会在内容创作者限定的功能范围内实现。

3)通用传输:MPEG-H提供了灵活性,支持通过不同的分发平台(如地面广播、卫星、宽带或移动网络)将相同的比特流传送到各种环境(如客厅、家庭影院或嘈杂移动环境)下的不同类型设备(如电视机、AVR、条形音箱、机顶盒、平板电脑以及支持360度全景视频的虚拟现实设备)。

MPEG-H Audio是由ISO/IEC动态影像专家小组(MPEG)制定的国际标准,该组织在MP3和AAC编解码器系列的音频编码方面有着长期贡献。MPEG-H Audio标准(即ISO/IEC 23008-3)指出,在广播和流媒体行业,低复杂度(LC)和基本档次(BL)这两个相关的配置文件至关重要,它们支持沉浸式3D音频内容的解码和渲染,同时支持高级个性化功能。音频对象可以单独使用,也可以与通道结合使用,以有效传递和再现沉浸声。使用这些音频对象可以在还放过程中通过调整对象的增益或位置来实现节目的交互性或个性化。点击此处获取关于MPEG-H Audio标准的详细信息。

MPEG-H Audio是一个完整的音频解决方案。它不使用其他音频编解码器,其编解码功能是基于前几代MPEG音频编解码器(如AAC编解码器系列)实现的。

MPEG-H Audio通过将沉浸声、高级个性化选项和高效传输、通用传输结合起来,丰富了音频体验,以满足当今消费者的需求。

事实证明,MPEG-H Audio系统是体育赛事转播和流媒体服务领域最先进的音频解决方案,它使用户在客厅里即能感受到真实体育场馆的氛围,并根据自己的喜好进行设置,比如只听自己支持的球队球迷的欢呼声,或者只是专心听解说。点击此处此处获取更多详情

与体育赛事类似,现场音乐会的流媒体是MPEG-H Audio的另一大用例。服务提供商希望用沉浸声和互动选项来改善服务体验。点击此处此处获取更多详情

MPEG-H Audio系统的高级辅助功能对于老年人和视力或听力受损的用户来说是必不可少的。凭借其对白增强和高级音频描述服务,MPEG-H Audio让用户获得广播电视音频变得更容易。

MPEG-H已被多个广播、流媒体和虚拟现实标准采用。这些标准已在本页末尾处列出。

MPEG-H Audio为索尼推出的音乐格式360 Reality Audio提供支持。Amazon Music HD、Deezer、nugs.net、Sony Select和TIDAL的首批360 Reality Audio沉浸式音乐流媒体服务已于2019年秋季推出,目前有超过3000首歌曲可供选择。支持360RA计划的主流唱片公司包括索尼音乐娱乐、环球音乐和华纳音乐。

MPEG-H Audio系统被韩国用作其全球首个地面超高清电视服务的唯一音频系统。该系统于2017年5月启动,自此KBS、MBC和SBS的商业服务24小时全天候播出。

越来越多的设备开始支持MPEG-H Audio,如森海塞尔 Ambeo条形音箱、亚马逊Echo Studio智能音箱或谷歌ChromeCast Ultra 4K,以及韩国三星和LG超高清电视机。

由于MPEG-H Audio在信号配置方面具有灵活性,这个问题没有简单的答案,因为比特率取决于信号(通道信号或对象信号)的数量。随着配置中信号数量的增加,编解码器的效率提高,由此产生的总比特率会小于单个编码信号比特率的总和。

下表列出了一些常见通道配置的比特率,分别有通道信号和对象信号的组合,从立体声和5.1环绕声开始到几种3D配置(用“H”表示,意为高度通道),以及3D通道配置和不同数量对象信号的组合。

除了最后一种配置“22.2”可以达到“4级”,其他所有示例都使用了不超过16个信号,这些信号在MPEG-H Audio标准中为“3级”。

比特率(单位:千比特每秒) 良好 极好 透明
2.0 48 64 96
5.1 128 192 256
5.1+2H 160 256 320
5.1+4H 192 320 448
7.1+4H/5.1+4H + 2 对象 256 – 288 384 – 420 512 – 576
7.1+4H + 3 Objects/5.1+4H + 5 对象 352 – 384 480 – 576 640 – 768
22.2 512 768 1024

范围基于MUSHRA推荐ITU-R BS. 1534-3

目前使用AAC/HE-AAC立体声或环绕声的广播服务,只需在多路复用中添加一个额外的MPEG-H Audio流,就可以利用MPEG-H Audio的高级功能来改善服务体验。所有支持MPEG-H Audio的音频和视频广播编码器都可以创建包含AAC流和MPEG-H Audio流的多路复用。前者可由传统接收器解码,后者将由新型接收器解码。

支持MPEG-H Audio的设备本身会提供“用户界面”,显示MPEG-H流支持的所有交互选项。基于内容创作者的意图,对于每个MPEG-H流,用户界面可能会为不同的用户呈现不同的互动选项,用户可通过界面自由打造个性化的内容。

MPEG-H Audio场景包括音频内容本身和附加元数据。这种元数据是在制作过程中创建的,包含了所有必要的信息,以便在用户选定的任意再现布局中呈现音频内容,并确保在所有平台上都能提供最佳音频体验。

MPEG-H Audio经过精心设计,可改善广播电视、流媒体和沉浸式音乐应用的体验。为了确保SDI环境中元数据在任何制作步骤中的完整性,元数据由“控制轨”传输。控制轨是一个“类似于时间码”的音频信号,可视为一个常规的音频通道。这可以确保元数据与其对应的音频和视频信号保持同步。控制轨具有较强的鲁棒性,能够承受A/D和D/A转换、音量变化、采样率转换或逐帧编辑。控制轨在传输数据时不会强制音频设备进入数据模式或非音频模式。

MPEG-H Master能够携带MPEG-H音频场景中所有的音频内容和生产元数据。MPEG-H Master可以是带有符合MPEG-H配置文件(MPEG-H BWF / ADM)的ADM元数据的广播Wave格式文件,也可以是包含了MPEG-H控制轨中的元数据信息的MPEG-H生产格式(MPF)文件。

MPEG-H控制轨是一种独特的解决方案,基于目前SDI的基础架构提供与音频和视频数据对齐的元数据。控制轨作为一个“类似于时间码”的PCM音频信号,可以在一个额外的SDI或WAV文件通道上传输。它可以像任何其他音频信号一样在视频编辑器中进行编辑。

控制轨允许与音频内容紧密耦合的元数据在SDI、MADI或AoIP等任何支持PCM数据传输的介质上进行传输。控制轨可以和任何其他音频信号以同样的方式处理,且能承受采样率转换或音量变化。控制轨中包含的元数据与音频和视频数据对齐,因此,现场或后期制作中的任何配置更改都可以应用于每个视频帧的边界。

MPEG-H制作格式(MPEG-H Production Format,简称MPF)是一种多通道PCM音频文件,包含MPEG-H Audio场景的所有音频内容和制作元数据。元数据以控制轨的形式存储,控制轨是一种类似于时间码的PCM音频信号,也是多通道wave文件中的音频轨道之一。

基于ITU-R BS.2076的音频定义模型(ADM)定义了一种开放的元数据格式,用于在基于文件的工作流程中制作、交换和归档下一代音频(NGA)内容。该模型全面的元数据语法能够描述多种类型的音频内容,包括用于实现沉浸式和交互式音频体验的通道、对象和场景等内容。ITU-R BS.2125中指定了音频定义模型的串行表示(S-ADM),它将原始ADM进行分段,用于诸如广播和流媒体应用的实时制作等线性工作流。

MPEG-H ADM Profile定义了对ITU-R BS.2076和ITU-R BS.2125的限制,使其能够与ISO/IEC 23008-3中定义的MPEG-H Audio既定下一代音频内容制作和分发系统实现互操作性。

免费提供的Fraunhofer ADM Info Tool是一个软件实用程序,支持创建符合配置文件的ADM元数据。该软件的一致性检查框架会根据从MPEG-H ADM Profile中导出的一套详尽检查清单来运行输入的ADM元数据,收集所有一致性问题的详细报告,并提供这些问题的解决方法。

Fraunhofer通过MPEG-H转换工具提供了简单的一键式解决方案,帮助您将杜比全景声BWF/ADM文件转换为MPEG-H制作格式。该工具可供评估协议中规定的合作伙伴使用。欲了解更多信息,请联系Fraunhofer。

Fraunhofer IIS将MPEG-H制作工具打包成MPEG-H创作套件的形式提供。该套件包括MPEG-H创作插件(MHAPi)3.5版本和独立的MPEG-H创作工具(MHAT)3.5版本。

点击此处进行注册,即可下载MPEG-H创作套件。

制作MPEG-H的其他可选工具包括用于后期制作的New Audio Technology Spatial Audio Designer和Blackmagic DaVinci Resolve Studio,以及用于MPEG-H Audio现场制作的Linear Acoustic AMS和Jünger MMA。

MPEG-H创作套件(MAS是一套能让MPEG-H Audio内容制作更加简单、快速、直观且功能强大的工具。这套工具支持最新发布的MPEG-H ADM Profile,以及通过耳机进行沉浸式音频再现的双耳监听。

您可以使用MPEG-H创作插件(MHAPi在支持VST3或AAX的数字音频工作站(DAW)中创建基于对象或通道的MPEG-H Audio音频。您可以将沉浸式和交互式MPEG-H Audio场景导出为MPF文件或MPEG-H BWF/ADM文件,这两种格式的文件包含音频和元数据,可以由支持MPEG-H的通道进行分发。

MPEG-H创作工具(MHAT)是一款适用于Mac和Windows的全新软件工具,用于为现有音频材料创造MPEG-H元数据。MPEG-H创作工具支持不需要数字音频工作站的简单的MPEG-H创作。您可以定义特定的MPEG-H参数,对配置进行即时监听,并将您创作的混音导出为MPF或MPEG-H BWF/ADM文件,亦或是导出为XML文件中的模板。

基于对象的制作需要元数据创作步骤,用于基于对象的交互性和可访问性功能的实现以及响度的测量。要概括出一个适用于所有类型制作环境和制作要求的简单回答是不现实的,但可以归纳出从适合最常见内容类型的简单、自动或基于预设的创作开始,到适用于高级应用场景的综合创作流程的这样一系列典型的工作流程。点击此处了解更多信息

MPEG-H Audio系统的设计使内容创作者可以定义多种预设和探索新的创意选项。广播电视商可以使用能够指定对象增益和位置的创作工具来准备混音(包括节目的默认或主混音),以创建预设混音选择,并以一个简洁菜单的形式呈现给用户。用户甚至可以通过“高级MPEG-H Audio交互菜单”获得更多对节目中音频元素的控制。所有提供给用户的交互功能都由广播商在元数据生成过程中严格定义。这个生成元数据的过程被称为“创作”,体现了MPEG-H Audio内容制作与传统音频制作最重要的区别。

根据制作场景的不同,有多种交付方案可供选择。后期制作时,可以使用MPEG-H创作套件的工具将音频和元数据导出为以下格式:

MPEG-H BWF/ADMMPEG-H BWF/ADM(全称为Broadcast Wave Format with embedded Audio Definition Model metadata)格式的文件是多通道wave文件,包含MPEG-H Audio场景的所有音频和元数据。导出的BWF/ADM文件符合MPEG-H ADM Profile。导出过程会进行响度测量并将其嵌入到导出的文件中。

MPFMPF(全称为MPEG-H Production Format)文件是一个多通道wave文件,包含MPEG-H Audio场景的所有音频和元数据。元数据存储在控制轨中,控制轨是多通道wave文件中的一个音频轨道,包含一个调制信号,该信号对采样率转换或音量变化具有很强的适应性。导出过程会进行响度测量并将其嵌入到导出的文件中。

XML这个导出选项专为使用MPEG-H场景定义作为XML表示的特殊应用而设计。XML导出的是一个包含精选音频的多通道波形文件。

欲了解更多信息,请观看我们的 Vimeo视频或YouTube视频

对于MPEG-H现场制作,创作和监控单元(AMAU)实时导出音频信号和控制轨。控制轨允许与音频内容紧密耦合的元数据在SDI、MADI或AoIP等任何支持PCM数据传输的介质上进行传输。控制轨可以和任何其他音频信号以同样的方式处理,且能承受采样率转换或音量变化。

欲了解更多信息,请观看视频

 

可以,MPEG-H创作套件支持根据MPEG-H ADM Profile将音频和元数据导出为BWF/ADM格式。

扬声器的配置取决于预期制作的要求。点击此处查看关于扬声器的摆放、录音室设计和制作流程的建议。

有,该选项在MPEG-H创作套件3.5版本中可用。

MPEG-H Audio支持使用一组预定义的下混配置对典型常见的扬声器布局进行下混。此外还提供定制化的下混选项,您可以为每个布局配置特定内容的下混。

有,MPEG-H创作套件随附了一套适用于Nuendo、Pro Tools、Reaper和Sequoia的模板会话。

首先,向您推荐我们的系列教程视频,它能帮助您使用MPEG-H创作插件进行MPEG-H创作。

在YouTube上观看

在Vimeo上观看

如果您仍有疑问,欢迎随时通过以下方式联系我们的MPEG-H工具专家productiontools-techsupport@iis.fraunhofer.de

可以,创作工具支持将音频和元数据导出为MPF、MPEG-H BWF/ADM和XML格式。

下载

标准和规范

ISO/IEC 23008-3: “Information technology — High efficiency coding and media delivery in heterogeneous environments — Part 3: 3D audio”

Link

—–

ATSC: A/342 Part 3:2017, MPEG-H System

Link

Digital Video Broadcasting (DVB): ETSI TS 101 154, Specification for the use of Video and Audio Coding in Broadcasting and Broadband Applications

Link

TTA (TTAK-KO-07.0127R3): Transmission and Reception for Terrestrial UHDTV Broadcasting Service

Link

ABNT NBR 15602-2, Digital terrestrial television – Video coding, audio coding and multiplexing Part 2: Audio coding, Amendment 1

Link

—-

SCTE: SCTE 242-3, Next Generation Audio Coding Constraints for Cable Systems: Part 3 – ­ MPEG-H Audio Coding Constraints

Link

UHD Forum: Ultra HD Forum Guidelines

Link

International Telecommunications Union (ITU) Recommendation ITU-R BS.1196-7 (01/2019), Audio coding for digital broadcasting

Link

ISO/IEC 23000-19:2020, Information technology — Multimedia application format (MPEG-A) — Part 19: Common media application format (CMAF) for segmented media

Link

CTA: CTA-5001, Web Application Video Ecosystem – Content Specification

Link

DASH-IF: Guidelines for Implementation: DASH-IF Interoperability Point for ATSC 3.0

Link

HbbTV: HbbTV 2.0.2 Specification (ETSI TS 102 796): Hybrid Broadcast Broadband TV

Link

3GPP: ETSI TS 126 118 v15.0.0 (2018-10) 5G: 3GPP Virtual reality profiles for streaming applications (3GPP TS 26.118 version 15.0.0 Release 15)

Link

VR-IF: VR Industry Forum Guidelines

Link

ISO/IEC 23090-2:2019, Information technology — Coded representation of immersive media — Part 2: Omnidirectional media format

Link

Digital Video Broadcasting (DVB): ETSI EN 300 468, Specification for Service Information (SI) in DVB systems

Link

Digital Video Broadcasting (DVB): MPEG-DASH Profile for Transport of ISO BMFF Based DVB Services over IP Based Networks

Link

SCTE: SCTE 243-3, Next Generation Audio Coding Constraints for Cable Systems: Part 3 ­ – Carriage of MPEG-H Audio

Link

Back To Top