Audio espacial a través de auriculares: cómo la ciencia mete 9 parlantes y un subwoofer dentro de tu cabeza

abril 8, 2024 Aranzulla de Los Pobres

Un Apple iPhone 14 que muestra la aplicación Apple Music con una página de funciones sobre contenido de Spatial Audio, junto a un par de auriculares Apple AirPods Max. — Simon Cohen / Tendencias digitales

El audio espacial está teniendo un momento. Si bien el objetivo de ofrecer una experiencia auditiva más inmersiva, similar a la del 3D, puede haber nacido en las salas de cine, gran parte de la conversación en torno al audio espacial se ha centrado en la música, específicamente, la disponibilidad relativamente nueva de pistas Dolby Atmos Music a través de servicios de transmisión de música.

El atractivo del audio espacial no es ningún misterio. Cuando se combina una de las primeras formas novedosas de escuchar música desde el estéreo, junto con el prodigioso poder de marketing de Apple , muchas personas quieren probarla.

Sin embargo, resulta un misterio si existe una diferencia entre el audio espacial de un servicio de transmisión a otro. Digamos, en Apple Music versus Amazon Music. ¿Y qué pasa con tus auriculares? ¿Afectan el sonido del audio espacial?

Las respuestas son sí y sí, pero quizás no por las razones que crees. Para explicarlo, echemos un vistazo más profundo a lo que sucede detrás de escena cuando escuchas audio espacial con auriculares.

Antes de continuar, aquí tienes una introducción al audio espacial que explica qué es y las distintas formas en que puedes experimentarlo.

Una sala llena de parlantes dentro de tu cabeza

Hombre escuchando altavoces KEF LS50 con los ojos cerrados. — Bill Roberson / Tendencias digitales

Los formatos de audio espacial como Dolby Atmos son extensiones del sonido envolvente multicanal (piense en Dolby Digital), diseñados para una experiencia auditiva en una sala de cine a través de parlantes colocados alrededor de una habitación. Esta sala teórica tiene un frente, una parte trasera, dos lados y un techo.

La música creada en Dolby Atmos comienza con una “cama” de 9.1 canales, generalmente configurada en un diseño 7.1.2 que corresponde a los parlantes frontales (izquierdo, central, derecho), laterales (envolvente izquierdo/derecho), traseros (izquierda/derecha), el techo (altura izquierda/derecha), además de un canal de efectos de baja frecuencia (LFE) enviado a un subwoofer. Además de estos nueve canales, que pueden producir cantidades variables de sonido, Dolby Atmos suma hasta 118 “objetos” sonoros que pueden moverse libremente en cualquier parte del hemisferio cubierto por esos nueve parlantes.

Cuando escuchas audio espacial a través de auriculares, escuchas la misma banda sonora de 9.1 canales y 118 objetos, lo que parece una paradoja. ¿Cómo pueden dos pequeños parlantes colocados en tu cabeza hacer lo mismo que nueve parlantes dispuestos a tu alrededor?

Engañando a tu cerebro

Imagen de THX Spatial Audio de un hombre que parece sorprendido mientras usa auriculares. — Gracias

La respuesta se puede encontrar en la psicoacústica, el campo de la ciencia que estudia cómo el cerebro interpreta y reacciona ante la información sonora. Esto incluye un proceso conocido como localización del sonido: cómo el cerebro utiliza señales audibles para determinar de qué dirección proviene un sonido y qué tan cerca o lejos puede estar la fuente del sonido.

Localizamos el sonido sintetizando el tono y el volumen. Pero la pista más importante es la forma en que el sonido llega a cada uno de nuestros oídos. Somos extremadamente sensibles incluso a las más mínimas diferencias en el momento. Si un sonido llegara a nuestro oído izquierdo sólo un milisegundo antes de que llegue a nuestro oído derecho, nuestro cerebro lo sabría y reaccionaría en consecuencia.

Utilizando modelos psicoacústicos (y un par de auriculares estéreo), podemos simular la dirección y la distancia de los sonidos del mundo real controlando cuidadosamente cómo llegan estos sonidos a cada oído.

Representación binaural

Audio espacial con seguimiento de cabeza de Apple para Apple TV 4K. — Manzana

El proceso de tomar un formato de audio espacial como Dolby Atmos y transformarlo utilizando los principios de la psicoacústica en un conjunto de sonidos que pueden transmitirse a través de auriculares se conoce como renderizado binaural.

Si alguna vez escuchó Dolby Atmos, DTS:X o Sony 360 Reality Audio (360RA) con auriculares, en algún punto de la cadena de reproducción, se utilizó un algoritmo de software de renderizado binaural para crear esa experiencia. Lo mismo ocurre con los videojuegos con bandas sonoras 5.1 o 7.1: estas pueden reproducirse de forma binaural mediante tecnologías como THX Spatial Audio o Immerse Gaming Hive .

Lo interesante de la renderización binaural es que funciona en cualquier par de auriculares estéreo o audífonos. Ya sean cableados o inalámbricos, y ya sea que haya gastado $10 o $1,000, todos los auriculares estéreo son compatibles con audio espacial renderizado binauralmente. Un par de auriculares puede anunciar específicamente que "funcionan con audio espacial", pero eso es como decir que un juego de cuatro neumáticos de automóvil "funciona con carreteras pavimentadas": todos lo hacen.

Audio espacial: ¿está todo fuera de tu cabeza?

Un micrófono binaural de cabeza simulada Neumann KU 100. — La forma de la cabeza humana es tan importante para la percepción espacial que los ingenieros de grabación suelen utilizar micrófonos con forma de cabeza como este Neumann KU 100 para capturar el sonido espacial. Tiene un micrófono en cada oído. neumann

Así que ahora que acabo de explicar que la renderización binaural puede engañar a tu cerebro haciéndole creer que estás escuchando un sistema de sonido completo de 7.1.2 canales utilizando cualquier par de auriculares viejos (en otras palabras, todo está en tu cabeza), voy a contradecirme. Parcialmente.

La forma en que cada uno de nosotros interpreta las señales de localización de sonidos tiene mucho que ver con la forma de nuestra cabeza. En concreto, la forma y colocación de nuestras orejas. La fisiología de nuestra cabeza crea una huella digital única (¿audioprint?) en los sonidos que llegan a nuestros tímpanos: no hay dos iguales. Desde la primera infancia, a medida que nuestro cerebro desarrolla nuestra capacidad para localizar el sonido, utiliza esta huella auditiva como plantilla.

Cuando se describe matemáticamente y se utiliza para filtrar los sonidos entrantes a cada oído, esta huella de audio se conoce como " función de transferencia relacionada con la cabeza " (HRTF).

Los HRTF son la clave

Una ilustración de audio espacial. — Encarnar

Para que la representación binaural suene lo más realista posible, el audio espacial se procesa utilizando un perfil HRTF.

Como probablemente habrás adivinado, todos tenemos perfiles HRTF únicos. En un mundo ideal, escanearíamos en 3D nuestras cabezas y la parte superior del torso y cargaríamos el perfil HRTF resultante en Apple Music o Amazon Music (o cualquier otra aplicación que admita audio espacial). El algoritmo de representación binaural de cada aplicación usaría ese perfil HRTF para crear un conjunto de sonidos que nuestro cerebro interpreta con un alto grado de realismo.

Aún no hemos llegado a ese punto. A falta de HRTF personalizados y cargables, cada aplicación de audio espacial utiliza un HRTF genérico. Como sugiere el nombre, estos HRTF genéricos se compilan a partir de cientos de HRTF individuales para crear una aproximación de cómo los sonidos ingresan a nuestros oídos. Cuanto más se acerque su HRTF personal a este HRTF promedio, más realista sonará el audio espacial.

Los HRTF genéricos también se utilizan para espacializar el contenido estéreo o mejorar el audio espacial con seguimiento de la cabeza. Si su aplicación de música, auriculares inalámbricos o audífonos inalámbricos tienen un modo de sonido espacial, puede usarlo para darle profundidad adicional al sonido estéreo. Y si sus auriculares tienen sensores incorporados para rastrear los movimientos de su cabeza, pueden generar audio espacial rastreado por la cabeza para una experiencia auditiva aún más realista, similar a la de una habitación.

¿Quién tiene el mejor HRTF?

Curiosamente, aunque todos los renderizadores binaurales utilizan un HRTF genérico, no todos utilizan el mismo HRTF genérico. Algunos, como Amazon Music y Tidal, usan un HRTF genérico proporcionado por Dolby (está integrado en el motor de renderizado binaural Dolby Atmos incluido en estas aplicaciones), mientras que Apple Music usa un HRTF genérico patentado desarrollado por Apple.

Por definición, cada HRTF genérico será más adecuado para algunas personas que para otras, de la misma manera que un par de auriculares inalámbricos se adaptará mejor a algunas personas que a otras. Si el HRTF de Apple le suena mejor que el de Dolby dependerá de qué tan cerca los iguale. La única forma de saberlo es probar ambos.

Un paso más cerca de la realidad: HRTF personalizados

Un gráfico 3D que representa un perfil HRTF personalizado de Embody. — Encarnar

Si bien los escaneos anatómicos 3D completos son el santo grial de los HRTF personalizados, algunas empresas han descubierto un paso intermedio que nos brinda una manera fácil de ir más allá de los HRTF genéricos. Apple llama a su versión “audio espacial personalizado”. ” Si tiene un iPhone X o más nuevo (sin incluir los modelos SE), con iOS 16 o posterior, puede usar la cámara selfie TrueDepth incorporada del teléfono para tomar fotografías en 3D de la parte frontal de su cara y de cada oreja. Es la misma tecnología que Apple usa para escanear tu rostro cuando usa FaceID para desbloquear tu teléfono.

Desafortunadamente, el HRTF personalizado que esto crea solo se puede usar junto con ciertos auriculares y audífonos inalámbricos Apple AirPods o Beats; no afectará la forma en que escucha el audio espacial cuando usa otros dispositivos.

Sony hace algo similar dentro de la aplicación Sony Headphones. Si compras un par de auriculares o audífonos Sony compatibles con 360RA, puedes tomar fotografías de cada oído y cargarlas en la aplicación.

Las fotos se evalúan y se utilizan para crear un HRTF personalizado, que se transfiere a aplicaciones de música en su teléfono que transmiten pistas de Sony 360RA. A partir de marzo de 2024, esto incluye Amazon Music, Tidal, Nugs.net y PeerTracks.

Creando un estudio de audio espacial virtual

Captura de pantalla del software Immerse Virtual Studio de Embody. — Simon Cohen / Tendencias digitales/Encarnar

Por muy interesante que sea utilizar la renderización binaural como forma de escuchar audio espacial con auriculares, para muchos músicos y otros creadores se ha convertido en una parte esencial de la creación de audio espacial.

Como se indica en la sección "Una habitación llena de parlantes dentro de tu cabeza", los formatos de audio espacial como Dolby Atmos se crean para escuchar por altavoces. Pero crear un estudio 7.1.2 o superior, completo con los tratamientos acústicos adecuados para erradicar los ecos y otros efectos no deseados, puede costar miles de dólares.

Si eres un artista prometedor o alguien que quiere experimentar con el audio espacial como pasatiempo, esta puede ser una inversión prohibitiva. Pero gracias al renderizado binaural, todo lo que necesitas es un par de auriculares decentes y el software adecuado, y tendrás un estudio virtual directamente en tu computadora.

Un ejemplo de software de estudio virtual es Immerse Virtual Studio Signature Edition de Embody. Funciona con cualquier estación de trabajo de audio digital (DAW), como ProTools, o como una forma independiente de experimentar audio espacial renderizado binauralmente desde una variedad de otras fuentes.

Immerse te permite simular cómo es mezclar audio espacial dentro de algunos de los estudios Dolby Atmos profesionales más prestigiosos, incluido el estudio 7.1.6 de Alan Myerson, donde Hans Zimmer ha masterizado muchas de sus icónicas bandas sonoras de películas, y Lurssen Mastering, un Grammy y un Oscar. -Estudio 7.1.4 ganador.

Una ilustración de un escaneo del oído mediante un teléfono utilizando el software Embody. — Al igual que Apple y Sony, Embody utiliza la cámara de un teléfono inteligente para generar HRTF personalizados. Encarnar

La clave para escuchar estos espacios de grabación como lo haría si estuviera trabajando físicamente dentro de ellos es la combinación del HRTF personalizado de Immerse, que puede crear usando casi cualquier teléfono inteligente, con perfiles de auriculares dedicados para docenas de auriculares inalámbricos y con cable profesionales y de consumo populares. y auriculares.

Estos elementos brindan a los artistas un entorno optimizado para desarrollar contenido de audio espacial. Sin embargo, como se mencionó anteriormente, la mayoría de las personas no tienen entornos optimizados para escuchar audio espacial. El software de Embody le permite cambiar a diferentes renderizadores binaurales, con y sin HRTF personalizados, para que pueda escuchar sus grabaciones como lo harían los oyentes promedio. El software incluye el renderizador binaural patentado de Apple Music y también se puede utilizar para monitorear Dolby binaural con el mismo HRTF genérico utilizado en Tidal y Amazon Music.

Yendo por el oro

En términos generales, cuando un sello musical proporciona una pista en Dolby Atmos a un servicio de transmisión como Apple Music o Tidal, es solo una versión. Esto crea un dilema para los artistas.

Es probable que esa versión se haya masterizado en un estudio físico con una configuración de altavoces Atmos o mediante el uso de un software que virtualice un espacio similar. Sin embargo, como comentamos anteriormente, variables como los HRTF y los renderizadores binaurales específicos utilizados pueden afectar profundamente el sonido de estas pistas cuando las escuchas en diferentes plataformas.

Un artista podría verse tentado a modificar su mezcla para que suene mejor cuando se transmita a través de Amazon Music y se reproduzca binauralmente con un HRTF genérico, especialmente si cree que así es como terminará escuchando la mayoría de su audiencia.

Pero eso comprometería cómo suena en un sistema de sonido Dolby Atmos 7.1.4 completo o incluso en Apple Music con un HRTF personalizado.

Dado que la mayoría de los artistas no tienen el tiempo ni el dinero para volver al estudio y remasterizar sus pistas una vez que han sido lanzadas, deben tomar una decisión: crear una versión optimizada para la mejor experiencia auditiva posible en 7.1.4. y confíe en que, con el tiempo, a medida que empresas como Apple y Amazon mejoren sus renderizaciones binaurales y su compatibilidad con HRTF personalizados, la experiencia con los auriculares simplemente mejorará cada vez más, o creará una versión que no llegue a lo que podría sonar, para crear una mezcla de auriculares optimizada para los oyentes de hoy.

Evidentemente, esta decisión quedará enteramente en manos del artista y/o de su sello. Sin embargo, me preocupa que programas comoel de Apple en materia de audio espacial creen un incentivo para que todos en el negocio de la música apresuren sus mezclas espaciales simplemente para obtener la recompensa financiera prometida.

Aún así, estamos en el comienzo de una era emocionante en el audio. Redefinirá cómo se hace la música y cómo suena cuando la escuchamos, con o sin el uso de auriculares.