¿Cómo reconoce Shazam la música con precisión?
¿Alguna vez te has preguntado cómo 'escucha' Shazam la música que estás tocando y cómo la identifica con tanta precisión? Bueno, no estás solo.
La tecnología que impulsa el servicio de reconocimiento de música es un misterio para muchos, especialmente desde que el servicio se lanzó años antes de que los teléfonos inteligentes y el aprendizaje automático se convirtieran en algo.
En este artículo, veremos cómo funciona Shazam y cómo puede reconocer la música con precisión.
¿Qué es Shazam?
Shazam es una aplicación de reconocimiento de música popular que puedes usar para encontrar información sobre una nueva canción que te encanta pero que no conoces el título o el nombre del artista.
Digamos que estás en una cafetería o caminando por una tienda de la esquina y escuchas una nueva canción que te gustaría tener en tu biblioteca de música. Shazam te ayuda a encontrar la canción con facilidad. Todo lo que necesita hacer es grabar unos segundos de la canción en la aplicación.
La aplicación Shazam utiliza una sofisticada tecnología de reconocimiento de audio para identificar la música que escuchas en cuestión de segundos para que puedas averiguar el nombre del artista y la pista, ver videos e incluso comprar o transmitir la canción en tu dispositivo.
Descargar: Shazam para iOS | Android (gratis)
¿Cómo funciona Shazam?
Shazam utiliza una tecnología patentada desarrollada por Avery Lin-Chun Wang, cofundador de la aplicación y científico principal de datos, para identificar coincidencias con las canciones consultadas en su plataforma. La tecnología crea huellas dactilares para grabaciones de audio, que es la salsa secreta detrás de las asombrosas habilidades de reconocimiento de Shazam.
Shazam crea y almacena huellas digitales de audio que consisten en colecciones de datos numéricos para cada una de las más de 15 mil millones de canciones. Cuando un usuario "Shazam" una canción, Shazam crea rápidamente una huella digital de audio del sonido recibido desde el teléfono inteligente o el micrófono de la PC.
Una vez que ha terminado de crear la huella digital de audio para la grabación, Shazam carga la huella digital de audio (no el audio) a su servidor, donde ejecuta una búsqueda de base de datos para las coincidencias. Si se encuentra una coincidencia, devuelve la información de la canción con opciones sobre dónde transmitirla o comprarla, junto con la información de identificación.
¿Qué es una huella digital de audio?
Una huella digital de audio es un resumen digital condensado de señales de audio. Se utilizan para identificar una muestra de audio o para localizar elementos similares en una base de datos de audio.
La tecnología de huellas digitales de audio de Shazam puede hacer coincidir las piezas de contenido de audio sin etiquetar con las coincidencias correspondientes en su base de datos de audio. Shazam identifica el título de la canción que grabó (un contenido de audio sin etiquetar) haciendo coincidir la huella digital de la canción con la huella digital de las canciones en su base de datos.
Shazam crea huellas digitales únicas para canciones en su base de datos utilizando ciertos puntos de datos identificados con la ayuda de un espectrograma.
¿Qué es un espectrograma?
Un espectrograma es un gráfico tridimensional que se utiliza como representación del sonido. El espectrograma muestra el cambio de frecuencias durante un período y también tiene en cuenta la amplitud o el volumen. La foto de abajo es un ejemplo de una lectura de espectrograma.
En una entrevista de 2003 con Scientific American , Avery Wang reveló que el algoritmo Shazam utiliza puntos de espectrograma que representan notas con la mayor energía para generar huellas digitales de audio.
Al ignorar la mayor parte de la información de una canción y centrarse solo en las pocas notas definitorias, Shazam puede buscar en su base de datos y proporcionar coincidencias precisas para consultas de canciones a una velocidad increíble.
¿Cómo puede Shazam identificar canciones en lugares ruidosos?
Shazam utiliza grabaciones de canciones libres de ruido de fondo y distorsión para crear huellas dactilares para su base de datos. Cuando graba una canción con la aplicación en un lugar ruidoso, crea una huella digital de audio de su grabación al identificar las notas con la mayor energía en la grabación.
Luego busca en su base de datos una coincidencia con las huellas digitales de audio de su grabación, siempre que el nivel de ruido de fondo no sea lo suficientemente alto como para distorsionar los datos utilizados para crear la huella digital de audio.
Tiempos en los que Shazam no puede ayudarte a identificar una canción
Shazam es excelente para hacer coincidir canciones, incluso música oscura que crees que no tiene en su base de datos. Pero, ¿hay momentos en los que Shazam no puede identificar una pista?
Grabación distorsionada
Cuando Shazam una canción en un lugar donde el nivel de ruido de fondo es demasiado alto, el ruido distorsiona los datos del espectrograma. Por eso, la huella digital de audio de su grabación será diferente a la de la canción original.
Cuando eso sucede, Shazam devuelve el diálogo de Canción no conocida porque no puede encontrar una coincidencia para la huella digital de audio.
Música en vivo
Shazam se queda corto en su capacidad para identificar la música de las presentaciones en vivo. Esto se debe a que el audio que graba en presentaciones en vivo a menudo difiere de la versión original de la canción que Shazam usa para crear huellas digitales de audio.
La única forma en que Shazam puede identificar una canción durante una presentación en vivo es si la banda tiene la habilidad suficiente para interpretar la canción exactamente como fue grabada. Buena suerte con la banda que intenta hacer eso ...
Tu grabación de voz
"¿Podría hacer que Shazam reconociera una canción que estaba cantando si fuera un buen cantante?"
En resumen, no.
El algoritmo de Shazam solo puede identificar música pregrabada. Para que Shazam identifique una canción que estás cantando, debes tener la misma voz con los instrumentales al tempo exacto con la grabación original de la canción.
Tu tarareo
Shazam no puede identificar coincidencias para los zumbidos porque su algoritmo usa frecuencias y amplitudes exactas para crear huellas digitales de audio para las canciones en su base de datos.
Cuando tarareas una canción, Shazam crea una huella digital para ella. Pero debido a que un zumbido es solo un intento de resintetizar una canción, el algoritmo no coincidirá con la grabación.
¿Es Shazam la única aplicación de identificación de música?
Shazam fue el primer servicio de identificación de música y actualmente es la aplicación de identificación de canciones más utilizada. Sin embargo, hay otras aplicaciones que puede usar para identificar una canción que suena a su alrededor. Algunos incluso pueden identificar una canción que estás cantando o tarareando.
Tres de las alternativas más populares de Shazam son SoundHound, Musixmatch Lyrics y Genius. Musixmatch y Genius lo ayudan principalmente a identificar las letras de la música que se reproduce a su alrededor, mientras que SoundHound es el competidor más cercano de Shazam.
Puedes usar la aplicación SoundHound para hacer prácticamente todo lo que hace Shazam. Su principal ventaja sobre Shazam es que tiene la funcionalidad adicional de identificar las canciones que canta o tararea.