작성: 토마스 크레이머(Thomas Kramer) 메인콘셉트(MainConcept) 사업개발전략 부사장, 아드리안 무르타자(Adrian Murtaza) 프라운호퍼 IIS 기술표준 선임
MPEG-H 오디오는 2014년 프라운호퍼에 IIS에서 최초로 선보인 이후 꾸준히 각광받으며 각종 소비자 기기에 탑재되었습니다. 특히 최근 SBTVD 포럼의 감독 하에 독립적인 시험기관에서 실시된 상세평가에서 가장 진화한 오디오 시스템으로 선정된 이후에는 더욱 큰 주목을 받고 있습니다.
MPEG-H 오디오는 2017년 한국의 ATSC 3.0 기반 지상파 방송에서 도입되었고, 브라질에서는 2019년 지상파 HD 방송서비스의 개선을 위해 채택되었습니다. 2023년에는 글로보(Globo), 레데 아마조니카(Rede Amazonica), TV 쿨투라(TV Cultura) 등의 방송사에서 MPEG-H 오디오를 정규 방송에 도입하기도 했습니다. MPEG-H 오디오는 2025년에 공개될 브라질의 차세대 3.0 방송의 유일한 필수 오디오 시스템이며, 이 밖에도 DVB, ATSC 3.0, 3GPP 등 여러 국제표준에 반영되어 있는 기술입니다.
그렇다면 MPEG-H 오디오의 객체 기반 시스템이 이목을 끄는 이유는 무엇일까요? 방송업계는 콘텐츠 소비 패턴의 변화에 따라 빠르게 진화하고 있습니다. MPEG-H 오디오는 다양한 기능을 선보이며 이러한 진화를 주도하고 있습니다. MPEG-H 포맷의 인기에 영향을 미치는 요인은 다음과 같습니다.
인터랙티브 포맷이 대세인 실시간 스포츠 중계
글로벌 컨설팅 회사인 알트만 솔론(Altman Solon)의 설문조사에 따르면, 지난 몇 년간 스포츠 경기 시청이 전 세계적으로 크게 증가했다고 합니다. 응답자의 57%는 2020년에 비해 스포츠 경기 시청 시간이 늘었다고 답변했습니다. 스포츠 경기를 소비하는 방식도 눈에 띄게 달라졌습니다. 스포츠 생중계를 시청한다고 답변한 응답자 수가 가장 많았지만, 젊은 시청자 층에서는 경기 전체 보다는 SNS에서 경기 하이라이트만을 찾아보는 경향이 두드러졌습니다.
스포츠 콘텐츠 사업자에게는 생중계를 시청하도록 젊은 시청자의 마음을 돌려놓을 방법을 찾는 것이 관건입니다. 그 중 하나는 실감형 시청 경험을 선사하는 것입니다. 앞서 언급된 설문조사에서는 응답자의 30%가 가상현실 기술을 기반으로 실제 경기장 내에 있는 듯한 생중계 콘텐츠를 시청할 의향이 있다고 답변했습니다. 한편, 경영 컨설팅 기업 딜로이트(Deloitte)가 실시한 설문조사에서는 시청자가 주문형 비디오 구독 서비스(SVOD)에서 스포츠 경기 시청 시 더 다양한 기능을 원하는 것으로 나타났습니다. 응답자의 35%는 실시간 통계분석자료를, 34%는 다양한 카메라 각도를 원한다고 답변했습니다. 한편, 54%는 미래에는 스포츠 콘텐츠 소비 방식이 더욱 실감화될 것으로 내다보았습니다.
이러한 설문조사 결과에서 알 수 있듯이, 고음질 음향 없이 영상만으로는 진정한 실감형 경험을 전달하기 어렵습니다. MPEG-H 오디오의 경우, 실감형 오디오를 한 단계 발전시킨 맞춤형 실감 오디오를 선사합니다. 객체 기반 방식 덕분에 시청자는 개인의 취향에 맞게 방송사가 제공하는 옵션 중 하나를 선택할 수 있습니다. 예를 들어, 해설 음량을 낮추거나 해설을 끄는 대신 관중석의 함성 같은 배경음 음량을 높여 실제 경기장에 있는 듯한 현장감을 즐길 수 있습니다. 헤드폰을 사용할 경우, 시청자 머리의 움직임을 감지하여 사운드를 발생지점에 고정시켜 한결 자연스러운 청취 경험을 선사합니다.
실감형 생중계의 어려움
생중계는 신경 써야 할 부분이 많고, 특히 실감형 방송 제작 시에는 더욱 그렇습니다. 콘텐츠 사업자는 복수의 영상 및 오디오 피드를 포착하여 그래픽과 해설을 더해 전 세계에 실시간으로 중계해야 합니다. 동시에 대역폭 제한, 지연, 음질 같은 문제도 고려해야 합니다. 스포츠 생중계 시 시청자를 위해 알맞은 사운드를 포착하되 경기장 내 다른 사운드에 묻히지 않도록 하는 것은 상당히 어려운 기술입니다. 자칫하면 안방 시청자들에게 실망스러운 경험을 안겨줄 수 있기 때문입니다.
MPEG-H 오디오는 정확한 음원을 포착하고 관련 메타데이터로 객체를 생성함으로써 시청자가 자신이 듣고 싶은 사운드에 맞춰 오디오 밸런스를 조절할 수 있도록 하는 진정한 맞춤형 실감 경험을 제공합니다. 이 외에도 고효율 압축 기술을 사용하여 제한된 대역폭 내에서 고음질을 유지하며 모든 오디오 객체를 전송시킬 수 있습니다.
클라우드 기반의 미디어 워크플로우
클라우드 기반의 미디어 워크플로우는 초반에는 그 필요성 때문에 인기를 끌었습니다. 클라우드 이전이 제공하는 여러 이점을 고려할 때, 이러한 인기는 한동안 지속될 것으로 보입니다. 미디어 워크플로우가 클라우드화됨에 따라, 방송사와 콘텐츠 사업자는 품질을 최우선시하면서 클라우드 내에서 원활하게 작업할 수 있는 방법을 고민하고 있습니다.
MPEG-H 오디오는 콘텐츠 사업자가 음질의 손상 없이 오디오와 관련 메타데이터를 클라우드에 효율적으로 전송할 수 있도록 도와줍니다. 이를 가능하게 하는 것이 바로 생중계 현장에서 사용되는 MPEG-H 중계용 인코더입니다. 중계용 인코더는 MPEG-H 제작 포맷(MPF)을 인코딩한 후 Zixi나 SRT 등의 프로토콜을 사용하여 클라우드로 전송합니다. 인제스트된 MPF는 메인콘셉트 라이브 인코더(MainConcept Live Encoder) 같은 스트리밍 인코더로 보내져 처리됩니다.
맞춤형 실감 오디오의 미래
콘텐츠 시청 경험은 점점 실감화되고 인터랙티브해지고 있습니다. 이제 실감형 영상만으로는 부족한 시대입니다. 콘텐츠 사업자는 실감나는 영상뿐 아니라 그에 준하는 음향을 제공하고, 시청자가 콘텐츠와 상호작용할 수 있는 방법을 모색해야 합니다. 맞춤형 실감 경험은 가상현실과 스포츠 생중계를 필두로 음악, 영화 등 여러 장르로 확대될 것입니다. 이러한 움직임을 주도할 기술이 바로 MPEG-H 오디오입니다.
올해 초 메인콘셉트의 라이브 인코더와 FFmpeg 플러그인에 MPEG-H 오디오 지원 기능이 추가되며 다양한 기기를 위해 맞춤형 실감 오디오가 담긴 콘텐츠의 인코딩, 중계, 스트리밍이 가능해졌습니다. 스포츠나 콘서트의 생중계 사업자에게는 희소식이 아닐 수 없습니다.
8월 8일부터 10일까지 개최되는 상파울루 방송박람회 SET Expo 44번 부스에서 MPEG-H 오디오에 대해 더욱 자세히 알아보세요