skip to Main Content

ÚLTIMAS NOTÍCIAS

Áudio MPEG-H para TV 3.0

O Áudio MPEG-H é o único sistema de áudio obrigatório para serviço de transmissão de TV 3.0 da próxima geração no Brasil.

O Fórum Brasileiro SBTVD finalizou recentemente a fase de avaliação técnica do Projeto TV 3.0 para a definição do sistema de televisão de próxima geração no Brasil. Ele incluiu uma avaliação técnica detalhada de todas as tecnologias propostas. Como resultado, o sistema de Áudio MPEG-H foi selecionado como o único codec de áudio obrigatório para o futuro sistema de transmissão de TV brasileiro.

 

MPEG-H na Rede Amazônia

Grupo Rede Amazônica coopera com a Fraunhofer para lançar Áudio MPEG-H em seu canal de transmissão Amazon Sat.

O Grupo Rede Amazônica é a primeira emissora da América Latina a oferecer serviço de Áudio MPEG-H 24 horas por dia / 7 dias por semana em um de seus canais de transmissão terrestre.

 

MAIS NOVIDADES

Para informações atualizadas sobre o MPEG-H Audio visite o Audioblog-Website: https://www.audioblog.iis.fraunhofer.com/tag/mpeg-h

VÍDEOS E WEBINARS

Assista aos nossos Webinars e Tutoriais para a SET eXPerience e aprenda a combinar os recursos de áudio mais avançados do mercado com excelentes imagens HDR nos workflows existentes.

Apresentando o Áudio MPEG-H

Aprenda tudo sobre como usar o Áudio MPEG-H em vários ambientes e como se beneficiar de seus recursos incomparáveis.

Áudio MPEG-H na prática

Nesta série, exploramos a aplicação do Áudio MPEG-H em um ambiente de transmissão. Os usuários apresentam várias perspectivas de seu trabalho diário com a tecnologia.

Como fazer …

Esta série apresenta aos criadores de conteúdo dicas de como usar o áudio MPEG-H com diversas ferramentas.

FAQ

MPEG-H é uma tecnologia de áudio de próxima geração que oferece mais realismo por meio de alto-falantes superiores e ao redor do ouvinte. Com recursos únicos de personalização, o MPEG-H Audio oferece aos ouvintes grande flexibilidade para se envolver ativamente com o conteúdo e adaptá-lo às suas próprias preferências. Independentemente do dispositivo, o sistema MPEG-H Audio oferece a melhor experiência de som possível.

O MPEG-H é uma solução de áudio completa e muito mais do que apenas um codec. Entre outras coisas, oferece as seguintes vantagens quando comparado a outros codecs:

1) Som Imersivo: O MPEG-H Audio permite a transmissão de áudio imersivo tridimensional (áudio 3D) adicionando fontes de som em camadas acima e abaixo da posição do ouvinte. O MPEG-H foi projetado especificamente para sinalização flexível de alto-falantes, incluindo layouts tradicionais, como estéreo, 5.1, 7.1, bem como configurações 3D, isto é, 5.1 + 4H, 7.1 + 4H ou 22.2 ou até mesmo layouts a serem definidos. Com o MPEG-H Audio, o som imersivo pode ser transmitido como canais, objetos ou uma combinação de ambos.

2) Som Interativo e Personalizado: O MPEG-H Audio permite que o ouvinte interaja com o conteúdo e crie experiências de áudio personalizadas. As opções de interatividade avançada variam de ajustes simples, por exemplo, aumentando ou diminuindo o nível de diálogo em relação a outros elementos de áudio, até a cenários avançados em que os elementos de áudio podem ser selecionados e ajustados em nível e / ou posição segundo as preferências do ouvinte e sob os limites criados pelo criador do conteúdo.

3) Delivery Universal: O MPEG-H oferece flexibilidade ao fornecer o mesmo fluxo de bits por meio de diferentes plataformas de distribuição (por exemplo, terrestre, satélite, banda larga ou redes móveis) para todos os tipos de dispositivos (aparelho de TV, AVR, soundbar, decodificador, tablet, óculos de realidade virtual com vídeo de 360 graus) em vários ambientes, por exemplo, sala de estar, home theater ou ambientes externos e barulhentos.

MPEG-H Audio é um padrão internacional desenvolvido pelo ISO/IEC Moving Picture Experts Group (MPEG). Uma organização que tem uma longa história na codificação de áudio como MP3 e a família de codecs AAC. O padrão de áudio MPEG-H (ISO/IEC 23008-3) especifica dois perfis relevantes – Baixa Complexidade (LC) e Linha de base (BL) – essenciais para a indústria de transmissão e streaming, que permitem a decodificação e renderização de conteúdo de áudio 3D imersivo enquanto habilita recursos de personalização avançados. Objetos de áudio podem ser usados sozinhos ou em combinação com canais para delivery e reprodução eficientes de som imersivo. O uso de objetos de áudio permite a interatividade ou personalização de um programa, ajustando o ganho ou a posição dos objetos durante a reprodução. Saiba mais sobre o padrão de MPEG-H Audio aqui

O MPEG-H é uma solução de áudio completa. Ele não necessita de outros codecs de áudio, sua funcionalidade de codec se baseia nos desenvolvimentos de gerações anteriores de codecs de áudio MPEG, como a família de codecs AAC.

O MPEG-H enriquece a experiência de áudio ao combinar som imersivo com opções avançadas de personalização com taxa de bits eficiente, delivery universal para atender às atuais necessidades dos consumidores. O MPEG-H Audio provou ser a solução de áudio mais avançada para aprimorar os serviços de transmissão e streaming para eventos esportivos, permitindo que o público experimente a emoção de estar na arena esportiva em sua sala de estar, decidindo o que é mais importante para si, por exemplo, se prefere ouvir apenas a torcida de seu time favorito ou focar nos comentaristas. Leia mais aqui e aqui

Assim como nos eventos esportivos, a transmissão de shows ao vivo é outro caso de uso importante em que os provedores de conteúdo estão ansiosos para aprimorar seus serviços com opções de interatividade e som imersivo. Leia mais aqui e aqui

Os recursos avançados de acessibilidade do sistema MPEG-H Audio são essenciais para o público idoso, com deficiência visual ou auditiva. Com seu aprimoramento de diálogo e serviços de descrição de áudio avançados, o MPEG-H torna a transmissão de áudio mais acessível para todos os espectadores.

O MPEG-H foi adotado em vários padrões de transmissão, streaming e realidade virtual. Uma lista pode ser encontrada no final desta página.

O formato musical 360 Reality Audio, iniciado pela Sony, é baseado no MPEG-H. Os primeiros serviços de streaming de música imersiva do 360 Reality Audio da Amazon Music HD, Deezer, nugs.net, Sony Select e TIDAL foram lançados no outono de 2019 com atualmente mais de 3.000 músicas disponíveis. As principais gravadoras que apoiam a iniciativa 360RA incluem a Sony Music Entertainment, Universal Music e Warner Music.

O sistema MPEG-H Audio é usado como o único sistema de áudio no primeiro serviço de TV UHD terrestre do mundo na Coreia do Sul. O lançamento do sistema foi em maio de 2017 e desde então, os serviços comerciais da KBS, MBC e SBS estão no ar 24 horas por dia, 7 dias por semana.

Um número crescente de dispositivos é compatível com MPEG-H Audio, como a soundbar Sennheiser Ambeo, o alto-falante smart Amazon Echo Studio ou o Google ChromeCast Ultra 4K, bem como aparelhos de TV da Samsung e LG para o serviço de TV UHD na Coreia do Sul.

Por causa da flexibilidade do MPEG-H Audio quando se trata de configurações de sinal, não há uma resposta simples para essa pergunta, pois a taxa de bits depende do número de sinais (sinais de canal ou sinais de objeto). Com um número crescente de sinais em uma configuração, a eficiência do codec aumenta e a taxa de bits total resultante é menor do que a soma dos sinais codificados individualmente.

A tabela a seguir indica as taxas de bits para algumas configurações de canal comuns em relação a uma combinação de sinais de canal e objeto, começando com estéreo e surround 5.1 para várias configurações 3D (indicadas por “H” para os canais de altura) e combinações de configurações de canal 3D e diferentes números de sinais de objeto.

Todos os exemplos dados usam um número total de 16 ou menos sinais que são cobertos pelo “Nível 3” no padrão de áudio MPEG-H, exceto para a última configuração, “22.2”, que é coberta pelo “Nível 4”.

Bit rates em kbit/s para Bom Excelente Transparente
2.0 48 64 96
5.1 128 192 256
5.1+2H 160 256 320
5.1+4H 192 320 448
7.1+4H/5.1+4H + 2 Objects 256 – 288 384 – 420 512 – 576
7.1+4H + 3 Objects/5.1+4H + 5 Objects 352 – 384 480 – 576 640 – 768
22.2 512 768 1024

Escala de acordo com a recomendação MUSHRA ITU-R BS. 1534-3

Os serviços de transmissão existentes que usam estéreo AAC / HE-AAC ou áudio surround podem ser aprimorados com os recursos avançados de áudio MPEG-H simplesmente somando um fluxo de áudio MPEG-H adicional no multiplex. Todos os codificadores de transmissão de áudio e vídeo que suportam áudio MPEG-H podem criar um multiplex contendo o fluxo AAC, bem como o fluxo de áudio MPEG-H. O primeiro pode ser decodificado por receptores legados e o último será decodificado por receptores mais novos.

Os dispositivos habilitados para MPEG-H Audio oferecem originalmente uma “Interface do Usuário” que exibe todas as opções de interatividade habilitadas por um streaming MPEG-H. Com base nas intenções do criador do conteúdo, para cada streaming MPEG-H, diferentes opções de interatividade podem ser oferecidas aos ouvintes em casa e, por meio da interface do usuário, eles têm a liberdade de personalizar seu conteúdo.

Uma cena de MPEG-H Audio compreende o próprio conteúdo de áudio junto com metadados adicionais. Esses metadados são criados durante a produção e contêm todas as informações necessárias para renderizar o conteúdo de áudio em layouts de reprodução arbitrários e para garantir a melhor experiência de áudio em qualquer plataforma.

O MPEG-H Audio foi cuidadosamente projetado para aprimorar as aplicações transmissão, streaming e música imersiva. Para garantir a integridade dos metadados em um ambiente baseado em SDI em qualquer etapa da produção, os metadados são entregues no “Canal de Controle” (Control Track). O Canal de Controle é um sinal de áudio “semelhante a um Timecode” e pode ser tratada como um canal de áudio regular. Isso garante a sincronização dos metadados com seus sinais de áudio e vídeo correspondentes. O sinal do Canal de Controle é robusto o suficiente para sobreviver a conversões A/D e D/A, mudanças de nível, conversões de taxa de amostragem ou edição por quadro. O Canal de Controle não força o equipamento de áudio a ser colocado no modo de dados ou no modo sem áudio para pass through.

Uma Master MPEG-H carrega todo o conteúdo de áudio e metadados sem compressão contidos em uma cena de MPEG-H Audio.

Uma Master MPEG-H pode ser um arquivo de formato Broadcast Wave contendo os metadados do modelo de definição de áudio compatível com o perfil MPEG-H (MPEG-H BWF / ADM) ou um arquivo MPEG-H Production Format (MPF) contendo os metadados dentro de um Control Track MPEG -H.

O Canal de Controle é uma solução única para fornecer os metadados alinhados com os dados de áudio e vídeo por meio de infraestruturas baseadas em SDI existentes. O Canal de Controle é um sinal de áudio PCM “semelhante ao Timecode” que pode ser transportado em um canal de arquivo SDI ou WAV extra. Ela pode ser editada um editor de vídeo como qualquer outro sinal de áudio.

Ele possibilita o transporte dos metadados fortemente acoplados ao conteúdo de áudio em qualquer meio, oferecendo transporte de dados PCM, como SDI, MADI ou AoIP. O Canal de Controle pode ser tratado como qualquer outro sinal de áudio e é resistente contra conversões de rate ou alterações de nível. Os metadados contidos no Canal de Controle são alinhados aos dados de áudio e vídeo, portanto, qualquer alteração de configuração ao vivo ou pós-produção pode ser aplicada em cada frame de vídeo.

O MPEG-H Production Format (MPF) é um arquivo de áudio PCM multicanal que contém todo o conteúdo de áudio e metadados de produção da cena de áudio MPEG-H. Os metadados são armazenados como um Canal de Controle, que é um sinal de áudio PCM semelhante ao timecode e uma das faixas de áudio no arquivo wave multicanal.

O Audio Definition Model (ADM) de acordo com ITU-R BS.2076 define um formato de metadados aberto para produção, troca e arquivamento de conteúdo de áudio de próxima geração (NGA) em workflows baseados em arquivo. Sua sintaxe de metadados abrangente permite descrever muitos tipos de conteúdo de áudio, incluindo representações baseadas em canais, objetos e cenas para experiências de áudio imersivas e interativas. Uma representação serial do Audio Definition Model (S-ADM) está especificada na ITU-R BS.2125 e define uma segmentação do ADM original para a utilização em fluxos de trabalho lineares tais como transmissão em tempo real e aplicativos de streaming.

O MPEG-H ADM Profile define restrições em ITU-R BS.2076 e ITU-R BS.2125 que permitem a interoperabilidade com sistemas de produção e distribuição de conteúdo NGA estabelecidos para MPEG-H Audio conforme definido em ISO/IEC 23008-3.

A Fraunhofer ADM Info Tool, disponível gratuitamente, é um utilitário de software que fornece suporte na criação de metadados ADM em conformidade com o perfil. Sua estrutura de verificação de conformidade executa metadados ADM de entrada em um conjunto exaustivo de verificações derivadas do Perfil MPEG-H ADM, reunindo relatórios detalhados de quaisquer problemas de conformidade encontrados e fornecendo informações sobre como resolvê-los.

Com a ferramenta de conversão MPEG-H, a Fraunhofer oferece uma solução simples com um clique para converter arquivos Dolby Atmos BWF/ ADM existentes no formato de produção MPEG-H. A ferramenta está disponível para parceiros sob acordo de avaliação. Entre em contato com o Fraunhofer para obter mais informações.

O Fraunhofer IIS oferece ferramentas de produção, agrupadas no MPEG-H Authoring Suite. O Suite consiste no MPEG-H Authoring Plug-in (MHAPi), na MPEG-H Conversion Tool (MCO) e na MPEG-H Authoring Tool (MHAT).

Registre-se aqui para fazer o download do MPEG-H Authoring Suite

Outras opções para a produção de MPEG-H incluem o New Audio Technology Spatial Audio Designer e Blackmagic DaVinci Resolve Studio para workflows de pós-produção, bem como o Linear Acoustic AMS e o Jünger MMA Hardware para produção ao vivo com MPEG-H Audio.

O MPEG-H Authoring Suite (MAS) é um conjunto de ferramentas que tornam a produção de conteúdo em MPEG-H Audio mais simples, rápida, intuitiva e eficiente. Eles suportam o perfil MPEG-H ADM publicado recentemente, bem como monitoração binaural para reprodução de áudio imersivo em fones de ouvido.

O MPEG-H Authoring Plug-in (MHAPi) o conduz por todas as etapas de criação de produções de MPEG-H Audio baseadas em objeto ou canais dentro de uma estação de trabalho de áudio digital (DAW) habilitada para VST3 ou AAX. Você poderá exportar suas cenas de MPEG-H Audio imersivas e interativas para MPEG-H Production Format (MPF) ou MPEG-H BWF/ADM, contendo áudio e metadados e pronto para distribuição através de canais habilitados para MPEG-H.

A MPEG-H Authoring Tool (MHAT) é uma nova ferramenta de software para Mac e Windows que ajuda a criar metadados MPEG-H com áudio pré-existente. O MHAT permite a criação facilitada de MPEG-H sem a necessidade de uma estação de trabalho de áudio digital (DAW). Você pode definir parâmetros MPEG-H específicos, ouvir instantaneamente suas configurações e exportar suas mixagens criadas como Formato de Produção MPEG-H (MPF), MPEG-H BWF / ADM ou como modelo de exportação em um arquivo XML.

A MPEG-H Conversion Tool (MCO) é uma ferramenta de software para Mac e Windows que pode ser usada para converter masters de conteúdos compatíveis com MPEG-H. O MCO serve como interface para o ecossistema de áudio MPEG-H e possibilita a importação e exportação de arquivos MPEG-H Production Format (MPF) e BWF / ADM.

O MPEG-H Production Format Player (MPF Player) é uma ferramenta de software para Mac e Windows para checar a qualidade dos metadados MPEG-H já criados e a mixagem de áudio que o acompanha, com ou sem o vídeo correspondente.

A produção baseada em objeto requer uma etapa de criação de metadados para os recursos de interatividade e acessibilidade baseados em objeto, bem como para medição de Loudness. Não há uma resposta única que se adapte a todos os tipos de ambientes de produção e requisitos de produção, mas uma variedade de fluxos de trabalho típicos, começando com uma autoração simples, automatizada ou predefinida, que se encaixa nos tipos de conteúdo mais comuns, até workflows de autoração abrangentes para aplicações mais avançadas. Clique aqui para mais informações

O MPEG-H Audio System foi projetado de forma que os criadores de conteúdo possam definir vários presets e explorar novas opções criativas. Uma emissora pode preparar mixagens (incluindo a mixagem padrão ou principal do programa) usando ferramentas de autoração que especificam um conjunto de configurações de ganho e posição para objetos para criar seleções de mixagem predefinidas que podem ser apresentadas em um menu simples para o usuário. Assim, é possível que os ouvintes mais entusiastas tenham ainda mais controle dos elementos de áudio em um programa, ativando o menu avançado de interatividade de MPEG-H Audio. Todos os recursos de interatividade oferecidos ao usuário são estritamente definidos pela emissora durante a criação dos metadados. Este processo de geração de metadados é chamado de “autoração”, sendo a diferença mais importante na produção de conteúdo de MPEG-H Audio em comparação com uma produção antiga (legacy).

Existem muitas soluções dependendo do cenário de produção. Usando as ferramentas do MPEG-H Authoring Suite em pós-produções, áudio e metadados podem ser exportados como:

MPEG-H BWF/ADM: um arquivo MPEG-H BWF/ADM (abreviação de Broadcast Wave Format com metadados de Audio Definition Model incorporados) é um arquivo wave multicanal que contém todo o áudio e metadados para a cena MPEG-H. O arquivo BWF / ADM exportado é compatível com o perfil MPEG-H ADM. A sonoridade será medida durante a exportação e será incorporada ao arquivo exportado.

MPF: Um arquivo MPF (abreviação de MPEG-H Production Format) é um arquivo wave multicanal que contém todo o áudio e metadados para a cena MPEG-H. Os metadados são armazenados no Canal de Controle, que é uma das faixas de áudio no arquivo wave multicanal e contém um sinal modulado que é robusto contra conversões de taxa de amostragem ou mudanças de nível. A intensidade será medida durante a exportação e será incorporada ao arquivo exportado.

XML: esta opção de exportação destina-se a aplicativos especiais que fazem uso de definições de cena MPEG-H como representação XML. O XML é acompanhado por um arquivo wave multicanal contendo a essência do áudio.

Para mais informações veja este vídeo no Vimeo ou este vídeo no Youtube

Para produções ao vivo MPEG-H, as unidades de autoração e monitoramento (AMAU) exportam os sinais de áudio e do Canal de Controle em tempo real. Ela permite o transporte dos metadados fortemente acoplados ao conteúdo de áudio em qualquer meio, oferecendo transporte de dados PCM, como SDI, MADI ou AoIP. O Canal de Controle pode ser tratada como qualquer outro sinal de áudio e é robusta contra conversões de taxa de amostragem ou alterações de nível.

Para mais informações assista a este vídeo

Sim, o MPEG-H Authoring Suite suporta a exportação de áudio e metadados como BWF/ADM de acordo com o MPEG-H ADM Profile (MPEG-H BWF/ADM).

A configuração do alto-falante depende dos requisitos da produção pretendida. Recomendações para posicionamento de alto-falantes, design de estúdio e workflows de produções podem ser encontradas aqui.

O MPEG-H Audio foi projetado especificamente para uma renderização flexível de alto-falantes, incluindo layouts tradicionais como estéreo, 5.1 e 7.1, bem como configurações de áudio 3D com canais superiores, como 5.1 + 4H e 7.1 + 4H, ou configurações com altura, meio e canais de camada inferior, por exemplo 22.2, ou mesmo layouts ainda a serem definidos.

A configuração dos alto-falantes depende dos requisitos da produção pretendida.

As recomendações para posicionamento de alto-falantes, design de estúdio e fluxos de trabalho de produções podem ser encontradas aqui.

Oferecemos sinais de teste MPEG-H incluindo identificação de canal, sincronização labial e verificações de nível para checar se os alto-falantes estão conectados e ajustados corretamente.

Sim, esta opção está disponível na versão 3.5 do MPEG-H Authoring Suite.

Áudio MPEG-H suporta downmix para configurações de alto-falantes comuns e típicos com um conjunto de configurações de downmix predefinidas. Além disso, ele vem com opções de downmix personalizáveis, permitindo um downmix específico de conteúdo ajustável para cada configuração de monitoração.

Sim, esta funcionalidade pode ser habilitada usando o recurso Dynamic Gains no MPEG-H Authoring Plug-in versão 3.0 e superior e no MPEG-H Authoring Suite.

Sim, o MPEG-H Authoring Suite vem com um conjunto de modelos (templates) de sessões para Nuendo, Pro Tools, Reaper e Sequoia.

Como primeira etapa, recomendamos nossa série de vídeos tutoriais para ajudá-lo a começar a autoração MPEG-H usando nosso Plug-in de autoração.

Assistir no youtube

Assistir no Vimeo

Se você tiver mais perguntas, pode sempre entrar em contato com nossos especialistas em ferramentas MPEG-H via:

productiontools-techsupport@iis.fraunhofer.de

Download

PADRÕES E ESPECIFICAÇÕES

ISO/IEC 23008-3: “Information technology — High efficiency coding and media delivery in heterogeneous environments — Part 3: 3D audio” Link

ATSC: A/342 Part 3:2017, MPEG-H System Link

Digital Video Broadcasting (DVB): ETSI TS 101 154, Specification for the use of Video and Audio Coding in Broadcasting and Broadband Applications Link

TTA (TTAK-KO-07.0127R3): Transmission and Reception for Terrestrial UHDTV Broadcasting Service Link

ABNT NBR 15602-2, Digital terrestrial television – Video coding, audio coding and multiplexing Part 2: Audio coding, Amendment 1 Link

SCTE: SCTE 242-3, Next Generation Audio Coding Constraints for Cable Systems: Part 3 – ­ MPEG-H Audio Coding Constraints Link

UHD Forum: Ultra HD Forum Guidelines Link

International Telecommunications Union (ITU) Recommendation ITU-R BS.1196-7 (01/2019), Audio coding for digital broadcasting Link

ISO/IEC 23000-19:2020, Information technology — Multimedia application format (MPEG-A) — Part 19: Common media application format (CMAF) for segmented media Link

CTA: CTA-5001, Web Application Video Ecosystem – Content Specification Link

DASH-IF: Guidelines for Implementation: DASH-IF Interoperability Point for ATSC 3.0 Link

HbbTV: HbbTV 2.0.2 Specification (ETSI TS 102 796): Hybrid Broadcast Broadband TV Link

3GPP: ETSI TS 126 118 v15.0.0 (2018-10) 5G: 3GPP Virtual reality profiles for streaming applications (3GPP TS 26.118 version 15.0.0 Release 15) Link

VR-IF: VR Industry Forum Guidelines Link

ISO/IEC 23090-2:2019, Information technology — Coded representation of immersive media — Part 2: Omnidirectional media format Link

Digital Video Broadcasting (DVB): ETSI EN 300 468, Specification for Service Information (SI) in DVB systems Link

Digital Video Broadcasting (DVB): MPEG-DASH Profile for Transport of ISO BMFF Based DVB Services over IP Based Networks Link

SCTE: SCTE 243-3, Next Generation Audio Coding Constraints for Cable Systems: Part 3 ­ – Carriage of MPEG-H Audio Link

Back To Top