Una mujer sonriente con auriculares escucha música mientras usa su teléfono móvil en un entorno al aire libre.

Spotify y las matemáticas: así es la fórmula de sus recomendaciones musicales

  • 9 de abril de 2025
  • 7 minutos
  • Blog

¿Quién no ha tenido la sensación de que plataformas como Spotify identifican sus gustos musicales con una precisión casi inquietante? ¿O que parece conocer exactamente el artista o la canción que quiere escuchar en cada momento, que casi todo lo que parece recomendarle tiene sentido?

Para muchos de sus más de 200 millones de usuarios, no hay mejor ejemplo de esto, que “Descubrimiento semanal”, una playlist que se renueva automáticamente cada lunes, ofreciéndoles todas las semanas 30 nuevos temas adaptados a sus preferencias, gustos e incluso, estado de ánimo.

Lo más sorprendente es que, junto a canciones familiares, suele incluir propuestas de artistas completamente nuevos para el oyente, y aun así logra dar en el clavo. Lejos de ser una casualidad o una coincidencia, esta capacidad se sustenta en sofisticados algoritmos matemáticos que aprenden del comportamiento individual y colectivo de millones de personas en todo el mundo. No es magia, son matemáticas.

Personalización musical a gran escala

Actualmente, Spotify cuenta con una base de usuarios enorme (más de 500 millones de usuarios activos) y un catálogo de decenas de millones de canciones. Ante tantísima música disponible, el reto es lograr que cada persona descubra fácilmente canciones que le gustarán.

Ahí entra en juego el sistema de recomendación: una serie de algoritmos de machine learning que personalizan la experiencia musical. Cada vez que se escucha o se guarda una canción, esa información alimenta al algoritmo. De hecho, cada acción (reproducir un tema, marcar "me gusta", añadir a una playlist o incluso pasar una canción tras unos segundos) queda registrada como parte del perfil de cada usuario de esta plataforma.

A partir de aquí y gracias a complejos modelos matemáticos Spotify puede anticipar con bastante precisión qué música le va a gustar a cada usuario, de modo que este pase más tiempo enganchado a su plataforma. Para conseguirlo, combina dos enfoques principales: filtrado colaborativo y filtrado basado en contenido.

Filtrado colaborativo: la sabiduría de la multitud

El filtrado colaborativo es el método clásico de muchos que emplean muchas plataformas de streaming de contenidos (Netflix, Amazon, etc.), y en Spotify forma el corazón de listas personalizadas como Descubrimiento Semanal, que los usuarios reciben en su bandeja de entrada cada viernes.

La idea es sencilla: si otras personas con gustos similares a los de un usuario concreto disfrutan de cierto artista o canción que ese usuario aún no ha escuchado, existe una buena probabilidad de que también le guste. De esta forma, el sistema analiza los hábitos de escucha de todos los usuarios, emparejándolos con “vecinos” con preferencias similares.

Por ejemplo, si el Usuario A y el Usuario B tienen muchas canciones favoritas en común, pero A ha descubierto una banda que B no conoce, el algoritmo puede recomendar esa banda al Usuario B y viceversa.  Para lograr esto a escala masiva, Spotify representa la relación entre usuarios y canciones en una enorme matriz de datos, que en el caso de esta plataforma podría ser una tabla con 200 millones de filas (cada fila es un usuario) y 40 millones de columnas (cada columna es una canción).

Imaginemos una tabla con 200 millones de filas (cada fila es un usuario) y 40 millones de columnas (cada columna una canción) Esta matriz está en su mayoría vacía, ya que ningún usuario puede escuchar todas las canciones, pero el algoritmo la aprovecha mediante técnicas de álgebra lineal. En concreto, Spotify aplica una factorización matricial (una forma de descomponer la matriz) para extraer patrones latentes. El resultado son vectores numéricos que resumen los gustos de cada usuario y las características de cada canción.

Así, a cada usuario le corresponde un "vector de gusto musical" (X) y a cada canción un "vector de características" (Y) en un espacio matemático de dimensiones latentes. Si se compara el vector de un usuario con el de una canción, el grado de similitud indica cuánto podría gustarle esa canción a ese usuario. Con estos vectores de usuario y canción ya calculados, el filtrado colaborativo busca coincidencias: identifica usuarios con vectores cercanos al nuestro (es decir, gustos parecidos) y canciones cuyos vectores estén próximos a los de nuestras canciones favoritas

Así, al recomendar una canción nueva se reduce a encontrar algún tema que esté en la biblioteca de esos usuarios parecidos. En otras palabras, se apoya en la sabiduría de la multitud. Aunque el filtrado colaborativo ha demostrado ser muy eficaz, tiene algunas limitaciones. Suele favorecer lo popular (es más fácil recomendar canciones que ya muchos han escuchado) y tiene problemas con la "novedad": una canción o artista recién lanzado, sin historial de reproducciones, no puede ser recomendado por este método. Para complementar estas carencias, Spotify recurre a estrategias basadas en el contenido mismo de la música.

Filtrado basado en contenido: etiquetas y características sonoras

El enfoque de filtrado basado en contenido consiste en recomendar canciones con atributos similares a las que le gustan a un usuario concreto. En lugar de comparar las bibliotecas de otros usuarios, aquí se examinan las características intrínsecas de cada tema, a partir de una descripción matemática: el contexto textual (lo que se dice o escribe sobre la música) y las propiedades de audio (lo que suena en la grabación).

Para ello parte en primer lugar de un análisis de texto y metadatos: aunque una canción no tiene texto descriptivo por sí misma, hay multitud de texto generado alrededor de la música: reseñas, blogs, noticias, comentarios en redes sociales, etc. A partir de aquí y mediante técnicas de Procesamiento de Lenguaje Natural (PLN), el sistema recopila de Internet las palabras y etiquetas asociadas a artistas y pistas.

Toda esa información se estructura en matrices y vectores de términos, dando a cada canción un perfil semántico propio. Así si el historial del usuario indica que disfruta de canciones descritas como "indie folk acústico", el algoritmo de contenido puede recomendale otras piezas que tengan etiquetas similares, aunque provengan de artistas distintos.

Más allá de las etiquetas textuales, Spotify también analiza directamente los “atributos de audio” de las canciones usando inteligencia artificial. En este sentido, es importante señalar que cada tema musical se puede descomponer en propiedades cuantitativas: tempo (BPM), tonalidad y modo, intensidad o volumen, nivel de energía, “bailabilidad”, positividad (valence), instrumentalidad, etc.

El algoritmo extrae estos rasgos sonoros objetivos de la señal de audio usando modelos de aprendizaje profundo especializados. Para ello Spotify emplea redes neuronales convolucionales (CNNs) que procesan el espectro de audio de forma similar a como una red neuronal "ve" una imagen   Esta red aprende a identificar patrones acústicos, permitiendo comparar canciones por cómo suenan. Por ejemplo, si una canción nueva tiene un tempo, una estructura rítmica y un timbre muy similares a otro tema que nos encanta, el sistema podrá detectarlo.

Así, al desglosar la música en cifras, el filtrado por contenido sonoro puede encontrar canciones que “suenan parecido” a las preferencias del usuario, aunque sean de artistas o géneros poco conocidos. Esto resulta vital para descubrir música nueva que aún no tiene datos de reproducciones. En definitiva, los sistemas de recomendación de Spotify son híbridos: combinan las señales de filtrado colaborativo con las de contenido (texto y audio) para dar en el clavo con los gustos de los usuarios.

No es magia, son matemáticas.

Más información

Grado en Matemáticas Aplicadas a la Ingeniería de Software

5 razones por las que formarte en matemáticas aplicadas a la ingeniería de software. 

El tándem perfecto para tu futuro: matemáticas e ingeniería de software.

Insights relacionados

Dos personas analizando datos en una computadora y un monitor.
Ciencia y Tecnología

Copilot y más: cómo la IA está cambiando la forma de escribir código

9 de julio de 2025

La programación ha cambiado radicalmente en la última década, no solo por la evolución de los lenguajes o los marcos de trabajo, sino por la irrupción de nuevas formas de colaboración y automatización, a partir de la popularización de metodologías agile o el trabajo con contenedores.

Sin embargo, pocas han resultado ser más disruptivas que la aplicación de capacidades de inteligencia artificial a los editores de código. De estos, nada ha tenido más repercusión que la transformación que ha experimentado GitHub.

La imagen muestra un fondo con texto digital en un entorno tecnológico y futurista.
Ciencia y Tecnología

Doce conceptos básicos para entender la Inteligencia Artificial Generativa

27 de junio de 2025

En este contexto conviene sin embargo no olvidar que esta inteligencia ni es “magia”, ni es realmente “inteligente”. Es una tecnología que esconde conceptos técnicos que hay que comprender para utilizarla de manera crítica. En este artículo hemos recopilado doce términos imprescindibles que nos van a permitir desarrollar otra mirada la próxima vez que le hagamos una pregunta a ChatGPT.