В октябре Alliance for Open Media (AOM) запатентовал новую технологию объемного звука с открытым исходным кодом под названием Immersive Audio Model and Formats (IAMF). Она была разработана центром исследований Samsung Research совместно с компанией Google и призвана составить конкуренцию популярной Dolby Atmos.
Объемный звук, в отличие от стереофонического, позволяет добиться большей глубины и реалистичности аудиосопровождения, что особенно актуально при просмотре визуального контента. Окружающие нас фоновые шумы, например, шаги или проезжающий вдалеке автомобиль, на первый взгляд, могут показаться ненужными в аудиотракте, но именно они при правильном воспроизведении помогают нам почувствовать ощущение пространства. Грамотно добавленные к диалогу собеседников шумы и аудиоэффекты способны поместить их речь в соответствующую сюжету обстановку, поэтому этот прием активно применяется при съемке фильмов, в которых актеры крайне редко разговаривают в абсолютной тишине, но для того, чтобы появилось ощущение пространства, необходима система объемного звука и соответствующим образом подготовленный контент.
Именно эту задачу и призвана решить созданная Samsung и Google технология Immersive Audio Model and Formats, ставшая первым в мире стандартом объемного звука с открытым исходным кодом. Подобный формат распространения позволяет свободно интегрировать технологию в свои продукты любым корпоративным или независимым компаниям, что в итоге призвано сформировать экосистему совместимого оборудования для производства и воспроизведения объемного звука. Если стратегия сработает, то Samsung с Google смогут создать единый отраслевой стандарт с бесплатным доступом к использованию для всех желающих.
Ключевыми отличиями IAMF являются: расширенные возможности для размещения звуковых объектов в аудиопространстве, которые позволяют слышать звуки спереди, сзади, по бокам, над или под собой, основанная на искусственном интеллекте и технологии глубокого машинного обучения функция автоматического определения типа воспроизводимых аудиоданных (музыка, речь, 3D-аудиоэффекты) и последующая оптимизация их баланса между собой, помогающая исключить моменты, когда диалог не слышно из-за музыки или голоса актеров становятся чрезмерно громкими для прослушивания, а также функция пользовательского выбора типа аудиоданных, требующих дополнительного акцентирования (например, если диалоги в фильме недостаточно разборчивы, то можно увеличить их громкость, не повышая при этом громкость других звуков).
Комментирует Ухён Нам, специалист команды визуальных технологий в Samsung Research:
«Объемный звук позволяет точно передавать окружающее нас повседневное звуковое сопровождение, чтобы добиться более глубокого погружения в происходящее, при этом некоторые характеристики этого аудиосопровождения могут быть настроены в соответствии с предпочтениями пользователей. Наша новая технология Immersive Audio Model and Formats, разработкой которой мы совместно с Google занимаемся с 2020 года, способна передать пение птиц над головой или шум воды где-то вдалеке позади, что помогает по-новому взглянуть на просмотр контента.
И это далеко не единственная возможность технологии. С ней вы можете лучше услышать диалоги, выбрать оптимальный баланс голосов, музыки и фоновых звуков и многое другое. Тем не менее, для того, чтобы к ней и совместимому контенту получили доступ все пользователи, необходимо, чтобы поддержка технологии была интегрирована в системы аудиопроизводства и звуковоспроизведения, а также в рабочие процессы создателей контента. Для этого мы выпустили IAMF с открытым исходным кодом и уверены, что данная модель распространения поможет ей быстрее стать популярной и активнее развиваться в будущем».