skip to Main Content

ニュース

MPEG-H Audioに関する最新情報は、こちらのオーディオブログ・ウェブサイトをご覧ください。https://www.audioblog.iis.fraunhofer.com/tag/mpeg-h

FAQ

MPEG-H Audioは、リスナーの上からだけでなく周囲からも音による臨場感を提供する新しい次世代のオーディオ技術です。独自のパーソナライズ機能を備えたMPEG-H Audioは、視聴者が積極的にコンテンツに関わり、自分好みに合わせられる優れた柔軟性を提供します。MPEG-Hオーディオシステムは、機器を問わず、最良のサウンド体験をお届けします。

MPEG-H Audioは、完璧なオーディオソリューションであり、単なるコーデックをはるかに超えているものです。とりわけ、従来のオーディオコーデックに比べ以下の大きな利点があります。

1) 没入型サウンド: MPEG-H Audioでは、リスナーの上下層に音源を追加することで、3次元の没入型オーディオ(3D-audio)を伝送することができます。MPEG-H Audioは、ステレオ、5.1、7.1などの従来のレイアウトに加え、3次元構成として5.1+4H、7.1+4H、または22.2、さらにまだ決められていないレイアウトなど、スピーカー信号を自由自在に演出するために設計されています。MPEG-H Audio内では、没入型サウンドがチャンネルだけ、オブジェクトだけ、その両方の組み合わせとして運ばれます。

2) インタラクティブな自分好みのサウンド: MPEG-H Audioでは、リスナーがコンテンツに関わり、自分好みのオーディオ体験を創り出すことができます。高度な双方向オプションは、単純な調整、たとえば、他のオーディオ要素に応じてダイアログレベルを上げ下げすることから、コンテンツ制作者が決めた制限下ではあるものの、リスナーの好みに応じてオーディオ要素のレベルだけ、位置だけ、あるいはその両方を選択、調整することができる高度なシナリオまで多岐にわたります。

3) ユニバーサルな配信: MPEG-Hは、さまざまな配信プラットフォーム(例 地上波放送、衛星放送、ブロードバンド放送、モバイルネットワーク)を通じて、さまざまな環境(たとえば、リビングルーム、ホームシアター、騒々しい移動環境など)であらゆる種類の機器(テレビ、AVR、サウンドバー、セット・トップ・ボックス、タブレット、360度カメラ付バーチャル・リアリティー(VR)ギアなど)に同じビットストリームを自由自在にお届けします。

MPEG-H Audioは、ISO/IEC 動画専門家集団(Moving Picture Experts Group:MPEG)が開発した国際規格です。同組織は、mp3とAACコーデック・ファミリーの標準策定などオーディオ符号化に長きにわたり携わっています。MPEG-H Audio規格 (ISO/IEC 23008-3)は、2つの関連プロファイル、低複雑性(LC)とベースライン (BL)を規定しています。この2つは、放送ストリーミング産業にとってなくてはならないものであり、没入型3Dオーディオコンテンツのデコーディングとレンダリングに加え、高度なパーソナライズ機能も可能にするものです。オーディオオブジェクトは、効率的な配信と没入型サウンドの再生のために単独で用いることも、チャンネルと組み合わせて用いることもできます。こうしたオーディオオブジェクトを使用することで、再生中にオブジェクトの増大や位置の調整を行い、番組の双方向性とパーソナライズができるようになります。MPEG-H Audio規格に関する詳細は、こちらをご覧ください。

MPEG-H Audioは、完全なオーディオソリューションですので、他のオーディオコーデックを使用しません。そのコーデック機能は、AACコーデック・ファミリーなどMPEGオーディオコーデックのこれまでの世代の進化の上に築き上げられたものです。

MPEG-H Audioは、現代の消費者ニーズを満たす高効率ビットレートでユニバーサルな配信による没入型サウンドと高度なパーソナライズ機能を組み合わせることによって、オーディオ体験を豊かなものにしています。

MPEG-Hオーディオシステムは、スポーツイベントでの放送ストリーミングサービスの向上、つまり視聴者が自宅リビングでスポーツアリーナの熱気を体験し、たとえば、応援するチームのサポーターの声援だけを聞いたり、解説だけに絞ったりなど、視聴者にとってより重要な内容を決めることができるようにすることで、最先端のオーディオソリューションであることが証明されています。詳しくは、こちらの記事別の記事をご覧ください。

スポーツイベントと同様に、ライブコンサートのストリーミングももうひとつの主要な使用事例です。サービス提供者は、没入型サウンド機能と双方向機能を持たせることでサービス向上を図ろうと意欲的に取り組んでいます。詳しくは、こちらの記事別の記事をご覧ください。

MPEG-Hオーディオシステムの高度なユーザー補助機能は、高齢者と視覚や聴覚が不自由な視聴者にとって絶対に必要なものです。MPEG-H Audioのダイアログの強化および高度音声解説サービスによって、放送音声を、視聴者全員が利用しやすいものにします。

MPEG-Hは、いくつもの放送、ストリーミング、バーチャル・リアリティー(VR)の規格で採用されました。本ページの末尾に一覧表を掲載しております。

MPEG-H Audioは、ソニー株式会社が開始した音楽フォーマット360 Reality Audio(サンロクマル・リアリティオーディオ)(360RA)の原動力となっています。2019年秋に最初の360RA没入型音楽ストリーミングサービスが、Amazon Music HD、Deezer、nugs.net、Sony Select 、TIDALで開始され、現在3000曲以上が視聴可能です。360RAイニシアティブを後援する主要レーベルには、ソニー・ミュージックエンタテインメント、ユニバーサルミュージック、ワーナーミュージックなどがあります。

MPEG-H TV Audio Systemは、韓国で世界初の地上波超高解像度(UHD)テレビ放送の唯一のオーディオシステムとして使われています。2017年5月の開始以降、KBS、MBC、SBSの放送局から24時間365日放送されています。

MPEG-H Audioをサポートしている製品は増え続けています。たとえば、ゼンハイザー社製AMBEOサウンドバー、Amazon社製Echo Studioスマートスピーカー、Google社製ChromeCast Ultra 4Kに加え、韓国のサムソン社、LG.社の超高解像度(UHD)テレビなどが挙げられます。

信号構成については、MPEG-H Audioの柔軟性が高いことから、ビットレートは信号(チャンネル信号またはオブジェクト信号)の数によって決まるので、その質問の答えは簡単ではありません。構成内に信号の数が増えるにつれ、コーデックの効率性が高くなり、その結果として生じる全体のビットレートは、単体でエンコードされた信号の合計よりも小さくなります。

以下の表では、いくつかの共通チャンネル構成に対するビットレートをそれぞれ表記しています。たとえば、チャンネル信号とオブジェクト信号の組み合わせには、ステレオに5.1サラウンドを組み合わせたものから、いくつもの3D構成(Hはハイト・スピーカー・チャンネルの略称として示される)、3Dチャンネル構成とさまざまな数のオブジェクト信号の組み合わせなどがあります。

下記の例は、MPEG-H Audio規格で「レベル3」に相当する合計16以内の信号を使用しています。ただし、最後の構成の「22.2」は、「レベル4」に相当します。

ビットレート (kbit/s) 良好 最高 トランスペアレント(透過)
2.0 48 64 96
5.1 128 192 256
5.1+2H 160 256 320
5.1+4H 192 320 448
7.1+4H/5.1+4H + 2 Objects 256 – 288 384 – 420 512 – 576
7.1+4H + 3 Objects/5.1+4H + 5 Objects 352 – 384 480 – 576 640 – 768
22.2 512 768 1024

等級はMUSHRA勧告 ITU-R BS. 1534-3に準じます。

AAC/HE-AAC ステレオまたはサラウンドオーディオを利用する既存の放送サービスは、補足的なMPEG-H Audioストリームをマルチプレックスに追加するだけで、MPEG-H Audioの高度な機能により強化することができます。MPEG-H Audioをサポートするすべてのオーディオ映像放送エンコーダーは、AACストリームだけでなくMPEG-H Audioストリームも含むマルチプレックスをつくることができます。前者は、従来のレシーバーで、後者はそれ以降のレシーバーでデコードすることができます。

MPEG-H Audio対応機器は、MPEG-Hストリームによって対応可能な双方向オプションをすべて表示する「ユーザーインターフェース」を元から提供しています。各MPEG-Hストリームに対して、コンテンツ制作者の狙いどおりに、さまざまな双方向オプションが自宅にいる視聴者に提示され、ユーザーインターフェースを通じて自由にコンテンツを自分好みに変更することができます。

MPEG-H Audioシーンは、オーディオコンテンツそのものと、補足的なメタデータで構成されています。このメタデータは、制作中につくられ、オーディオコンテンツを任意の再生レイアウトで表現し、どのプラットフォームでも最高のオーディオ体験ができるようにするための必要なすべての情報を含んでいます。

MPEG-H Audioは、放送、ストリーミング、没入型音楽への適用を高度化するために入念に設計されています。SDI環境の各制作段階で確実に統合させるために、メタデータは、「コントロール・トラック」として転送されます。このコントロール・トラックは、「タイムコードのような」音声信号であり、通常の音声チャンネルとして扱われます。これによって、メタデータは、対応する音声映像信号と同期します。コントロール・トラックには、A/D変換とD/A変換、レベル変化、サンプリング周波数変換、フレーム編集を実行する堅牢性があります。コントロール・トラックを通すため、オーディオ機器をデータモードや非音声モードに設定する必要はありません。

MPEG-H Masterは、MPEG-H Audioシーンに関する非圧縮オーディオコンテンツと制作メタデータをすべて運びます。MPEG-H Masterは、MPEG-Hプロファイルに準拠した音響定義モデル・メタデータを運搬する放送WAVEフォーマットファイル(MPEG-H BWF/ADM)、またはMPEG-H コントロール・トラック内でメタデータを運搬するMPEG-H制作フォーマット(MPF)ファイルのいずれかです。

MPEG-Hコントロール・トラックは、既存のSDIインフラを通じてオーディオ映像データに一致したメタデータを届けるための独自のソリューションです。コントロール・トラックは、追加のSDIやWAVEファイルのチャンネルで運ばれる「タイムコードのような」PCM音声信号です。他の音声信号と同様に映像エディタで編集できます。

SDI、MADI、AoIPなどのPCMデータの移送を提供する媒介によって、オーディオコンテンツとしっかりと結びついたメタデータを移送することができます。コントロール・トラックは、他の音声信号のように扱われ、サンプリング周波数変換やレベル変化に対して堅牢です。コントロール・トラックに含まれるメタデータは、音声映像データと一致しているため、生放送やポストプロダクション編集制作で生じる構成変更にも、映像フレームごとに適用できます。

MPEG-H制作フォーマット (MPF)は、MPEG-H Audioシーンに関するすべてのオーディオコンテンツと制作メタデータを含むマルチチャンネルPCM音声ファイルのことです。メタデータは、タイムコードのようなPCM音声信号であり、マルチチャンネルwaveファイル内のオーディオトラックのひとつであるコントロール・トラックとして保存されます。

ITU-R BS.2076で規定されている音響定義モデル(ADM)は、ファイルベースのワークフローにおける次世代オーディオ (NGA)コンテンツの制作、やりとり、アーカイブのための公開メタデータフォーマットを定めています。広範囲にわたるメタデータ構文により、没入感とインタラクティブな音声体験に必要なチャンネル、オブジェクト、シーンごとの表現など多種の音声コンテンツを記述することができます。一連の音響定義モデルの表現 (S-ADM)は、ITU-R BS.2125で規定されており、放送とストリーミングに使用できるリアルタイム制作などリニア・ワークフロー用として元のADMのセグメント化を定義します。

MPEG-H ADMプロファイルは、ISO/IEC 23008-3で定義されたMPEG-H Audioを対象に設けられた次世代オーディオコンテンツ制作配信システムと相互運用可能なITU-R BS.2076およびITU-R BS.2125に関する制約を定めています。

無償で入手可能なフラウンホーファー ADMインフォツールは、プロファイルに適合するADMメタデータの生成をサポートする実用ソフトウェアです。その適合性チェックの枠組みは、入力ADMメタデータに対し、MPEG-H ADMプロファイルから派生した網羅的なチェックセットを実行し、発生した適合性の問題の詳細なレポートを収集し、それらを解決する方法に関する情報を提供します。

フラウンホーファーは、MPEG-H 変換ツールによって、既存のDolby Atmos BWF/ADMファイルをMPEG-H制作フォーマットに変換する簡単なワンクリックソリューションを提供しています。そのツールは、MPEG-H オーサリングスイート (MAS)の一部として利用できます。

フラウンホーファー IISは、MPEG-H オーサリングスイートとセットで制作ツールを提供しています。スイートは、MPEG-Hオーサリング・プラグイン (MHAPi)、独立型MPEG-Hオーサリング・ツール (MHAT)、MPEG-H 変換ツール (MCO)で構成されます。

MPEG-H オーサリングスイートをダウンロードするには、こちらにご登録ください。

MPEG-H制作の他の手段として、ポストプロダクション編集ワークフロー用にはNew Audio Technology社製Spatial Audio DesignerおよびBlackmagic Design社製DaVinci Resolve Studioが、MPEG-H Audioによるライブ制作用にはLinear Acoustic社製AMSと Jünger社製MMAハードウェアがあります。

MPEG-H オーサリングスイート (MAS)は、MPEG-H Audioコンテンツの制作をより簡単に、早く、直感的で強力にしてくれるツール一式です。最近公開されたMPEG-H ADMプロファイル に加え、ヘッドホンでの没入型オーディオ再生のためのバイノーラルのモニタリングをサポートします。

MPEG-H オーサリング・プラグイン (MHAPi)は、VST3やAAX対応のデジタル・オーディオ・ワークステーション (DAW)内のオブジェクトベースあるいはチャンネルベースのMPEG-H Audio制作の全段階で使います。没入型でインタラクティブなMPEG-Hオーディオシーンを、オーディオとメタデータを含むMPEG-H制作フォーマット (MPF)またはMPEG-H BWF/ADMのいずれかに出力し、MPEG-H対応チャネル経由で配信できるようにします。

MPEG-H オーサリング・ツール (MHAT)は、既存の音声素材でMPEG-Hメタデータを作りやすくするためのMacおよびWindows用の新規ソフトウェアツールです。MHATは、デジタル・オーディオ・ワークステーション (DAW)を必要とせずに簡単にMPEG-Hオーサリングを行うことができます。具体的なMPEG-Hパラメーターを定め、すぐに構成を聴き、オーサリング済みのミックスをMPEG-H制作フォーマット (MPF)、MPEG-H BWF/ADMとして、あるいはXMLファイルのテンプレート形式で出力することができます。

MPEG-H 変換ツール (MCO)は、MPEG-H準拠コンテンツマスターの変換に使用できるMacおよびWindows用のソフトウェアツールです。MCOは、MPEG-H Audioエコシステムへのインターフェースとして機能し、MPEG-H制作フォーマット (MPF)およびBWF/ADMファイルの読み込みと出力機能をサポートします。

MPEG-H 制作フォーマットプレイヤー (MPF-Player)は、オーサリング済みMPEG-Hメタデータと付属する音声ミックスのみ、または映像と一緒に、品質をチェックするためのMacおよびWindows用のソフトウェアツールです。

オブジェクトベースの制作に必要なのは、オブジェクトベースの双方向性とユーザー補助機能だけでなく、ラウドネス測定のためのメタデータ・オーサリング・ステップです。すべての制作環境と制作条件を満たすひとつの回答はありませんが、ほとんどの共通のコンテンツの種類に合う簡単で自動的なプリセットによるオーサリングでスタートする典型的なワークフローから、高度なアプリケーション用の包括的なオーサリングワークフローまで広範囲にわたります。詳しくは、こちらをご覧ください。

MPEG-Hオーディオシステムは、コンテンツ制作者が複数のプリセットを定義し、新しい独創的選択肢を模索することができるように設計されています。放送事業者は、ユーザーに簡単なメニューで提示できるプリセット・ミックスの選択肢をつくるために、オブジェクトの増大や位置設定のまとまりを指定するオーサリング・ツールを使って(番組の初期設定や主要ミックスなどを含む)ミックスを準備することができます。番組のオーディオ要素をより一層制御することも可能ですし、上級者は「MPEG-H Audio先進的双方向メニュー」を有効にすることもできます。ユーザーに提供されるすべての双方向機能は、メタデータの作成時に放送事業者が厳密に定義します。このメタデータ生成プロセスは、「オーサリング」と呼ばれ、従来の制作に比べMPEG-H Audioコンテンツ制作において最も重要な違いとなります。

制作シナリオに応じて、複数のソリューションがあります。ポストプロダクション編集制作の場合は、MPEG-H オーサリングスイートのツールを使って、オーディオとメタデータを次の状態で出力することができます。

MPEG­-H BWF/ADM: MPEG-­H BWF/ADM ファイル(組み込み音響定義モデル・メタデータを運搬する放送waveフォーマットの略称)は、MPEG-­Hシーンに関する全オーディオ・メタデータを含むマルチチャンネルwaveファイルです。出力されるBWF/ADMファイルは、MPEG­-H ADMプロファイルに準拠しています。ラウドネスは、出力時に測定され、出力ファイルに組み込まれます。

MPF: MPFファイル(MPEG­-H Production Formatの略称)は、MPEG-­Hシーンに関する全オーディオ・メタデータを含むマルチチャンネルwaveファイルです。メタデータは、マルチチャンネルwaveファイルの音声トラックのひとつで、サンプリング周波数変換やレベル変化に対して強い変調信号を含む「コントロール・トラック」に保存されます。ラウドネスは、出力時に測定され、出力ファイルに組み込まれます。

XML: この出力プションは、MPEG­-Hシーンの定義をXML表現で利用する特別なアプリケーションを想定しています。XMLには、オーディオ・エッセンスを含むマルチチャンネルwaveファイルが付随します。

詳しくは、Vimeoの動画またはYoutubeの動画をご視聴ください。

MPEG-Hライブ制作については、オーサリング・モニタリング・ユニット(AMAU)が、音声信号とコントロール・トラックをリアルタイムで出力します。SDI、MADI、AoIPなどのPCMデータの移送を提供する媒介によって、オーディオコンテンツとしっかりと結びついたメタデータを移送することができます。コントロール・トラックは、他の音声信号のように扱われ、サンプリング周波数変換やレベル変化に対して堅牢です。

詳しくは、こちらの動画をご視聴ください。

はい。MPEG-H オーサリングスイートは、MPEG-H ADMプロファイル (MPEG-H BWF/ADM)に準拠したBWF/ADM としてオーディオおよびメタデータの出力をサポートします。

プロファイルは、こちらからダウンロードできます。

MPEG-H Audioは、ステレオ、5.1、7.1などの従来のレイアウトに加え、5.1+4H、7.1+4Hのようなハイトチャンネルのある3次元オーディオ構成、あるいは22.2かさらにまだ決められていないレイアウトなど低中高層チャンネルのある構成レイアウトなど、スピーカーを自由自在に演出するために設計されています。

スピーカーの構成は、対象となる制作条件次第です。スピーカーの設置場所、スタジオ設計、制作ワークフローに関するお勧めは、こちらをご覧ください。

スピーカーが適切に接続、調整されているかどうかを検証するために、チャンネル識別、リップシンク、レベルチェックなどのMPEG-H試験用信号を提供していますのでご利用ください。

はい。このオプションは、MPEG-H オーサリングスイートのバージョン3.5 でご利用いただけます。

MPEG-H Audioは、典型的なスピーカーの共通レイアウトに対して、あらかじめ定めたダウンミックス構成一式を用いてダウンミックスをサポートします。さらに、レイアウトごとに設定可能なコンテンツ専用ダウンミキシングができる、カスタマイズ可能なダウンミックスオプションも備えています。

はい。この機能は、MPEG-H オーサリング・プラグイン バージョン3.0以降とMPEG-H オーサリングスイートにおいてダイナミック・ゲイン機能を用いて行うことができます。

はい。MPEG-H オーサリングスイートは、Nuendo、Pro Tools、Reaper、Sequoia用に模擬セッション一式をご用意しています。

まず、MPEG-Hオーサリング・プラグインを使ってMPEG-H オーサリングを始めるための講座動画一式をご覧いただくことをお勧めします。

YouTubeで視聴する

Vimeoで視聴する

さらに質問がある場合は、MPEG-Hツール専門家までご連絡ください。
連絡先はこちら:
productiontools-techsupport@iis.fraunhofer.de

ダウンロード

規格および仕様

ISO/IEC 23008-3: “Information technology — High efficiency coding and media delivery in heterogeneous environments — Part 3: 3D audio” Link

ATSC: A/342 Part 3:2017, MPEG-H System Link

Digital Video Broadcasting (DVB): ETSI TS 101 154, Specification for the use of Video and Audio Coding in Broadcasting and Broadband Applications Link

TTA (TTAK-KO-07.0127R3): Transmission and Reception for Terrestrial UHDTV Broadcasting Service Link

ABNT NBR 15602-2, Digital terrestrial television – Video coding, audio coding and multiplexing Part 2: Audio coding, Amendment 1 Link

SCTE: SCTE 242-3, Next Generation Audio Coding Constraints for Cable Systems: Part 3 – ­ MPEG-H Audio Coding Constraints Link

UHD Forum: Ultra HD Forum Guidelines Link

International Telecommunications Union (ITU) Recommendation ITU-R BS.1196-7 (01/2019), Audio coding for digital broadcasting Link

ISO/IEC 23000-19:2020, Information technology — Multimedia application format (MPEG-A) — Part 19: Common media application format (CMAF) for segmented media Link

CTA: CTA-5001, Web Application Video Ecosystem – Content Specification Link

DASH-IF: Guidelines for Implementation: DASH-IF Interoperability Point for ATSC 3.0 Link

HbbTV: HbbTV 2.0.2 Specification (ETSI TS 102 796): Hybrid Broadcast Broadband TV Link

3GPP: ETSI TS 126 118 v15.0.0 (2018-10) 5G: 3GPP Virtual reality profiles for streaming applications (3GPP TS 26.118 version 15.0.0 Release 15) Link

VR-IF: VR Industry Forum Guidelines Link

ISO/IEC 23090-2:2019, Information technology — Coded representation of immersive media — Part 2: Omnidirectional media format Link

Digital Video Broadcasting (DVB): ETSI EN 300 468, Specification for Service Information (SI) in DVB systems Link

Digital Video Broadcasting (DVB): MPEG-DASH Profile for Transport of ISO BMFF Based DVB Services over IP Based Networks Link

SCTE: SCTE 243-3, Next Generation Audio Coding Constraints for Cable Systems: Part 3 ­ – Carriage of MPEG-H Audio Link

White Papers and Technical Reports

https://www.iis.fraunhofer.de/de/ff/amm/dl/whitepapers.html

MPEG-H ADM Profile 1.0.0, April 2020, Requirements and Recommendations: https://www.iis.fraunhofer.de/en/ff/amm/dl/whitepapers/adm-profile.html

Scientific Papers (open access)

Bleidt et al (2017): https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7874294

Herre et al (205): https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7056445

Grewe et al: https://www.researchgate.net/publication/329637758_Field_Tests_for_Immersive_and_Interactive_Broadcast_Audio_Production_using_MPEG-H_3D_Audio

Meltzer, Murtaza (2018): https://www.researchgate.net/publication/329631801_First_Experiences_with_the_MPEG-H_TV_Audio_System_in_Broadcast

Füg, Kuntz (2015): https://pub.dega-akustik.de/DAGA_2015/data/articles/000515.pdf

Paulus, et al (2019): https://www.aes.org/tmpFiles/elib/20200909/20489.pdf

Presentations (open access)

Bleidt: https://www.iis.fraunhofer.de/content/dam/iis/de/doc/ame/AES-LA-Webinar-April2020-release.pdf

Plogsties: https://www.itu.int/en/ITU-R/study-groups/workshops/2015-TFAB/PublishingImages/Pages/default/Presentation%202-1.pdf

Carrera: https://www.set.org.br/wp-content/uploads/2017/08/Alfonso-Carrera-SET17-MPEGH.pdf

Back To Top