Mejora de los sistemas de recomendación de música de filtrado colaborativo: Un enfoque en la caracterización del usuario a partir de factores de comportamiento y contextuales

Abstract

[ES] La popularización de la distribución digital de contenido multimedia, conocido como streaming, permite a cada vez más usuarios el acceso a prácticamente toda la música existente desde cualquier lugar sin la limitación de la capacidad de almacenamiento de los dispositivos. Esa enorme disponibilidad, así como la gran variedad de proveedores de estos servicios hace muy difícil al usuario encontrar música que pueda encajar en sus gustos. De ahí deriva el gran interés actual por el desarrollo de algoritmos de recomendación que ayuden al usuario a filtrar y descubrir la música que se ajusta a sus preferencias a partir de la enorme cantidad de contenido musical disponible en el espacio digital. La mayoría de las plataformas disponen de servicios de búsqueda y algunas de ellas disponen de mecanismos de recomendación y ofrecen listas personalizadas de reproducción (playlists), aunque todavía se requieren muchas mejoras. Los métodos utilizados en los sistemas de recomendación son muy variados, aunque los basados en filtrado colaborativo (FC) se encuentran entre los más extendidos. Las recomendaciones que proporcionan se basan en las valoraciones (ratings) que los usuarios hacen de los ítems a recomendar, que en el caso de los sistemas de recomendación de música son canciones o artistas. Las recomendaciones para un usuario dado se basan en las valoraciones realizadas por otros usuarios con gustos similares a él. Los resultados de este tipo de técnicas son bastante buenos, sin embargo, la dificultad de obtener la evaluación explicita de los ítems por parte de los usuarios hace que el número de valoraciones sea insuficiente, causando problemas de dispersión (sparsity), que impiden o dificultan la aplicación de tales métodos. Por este motivo, en algunas ocasiones se recurre a formas implícitas de obtener dicha información, las cuales son usualmente complejas y no siempre son efectivas. Otros problemas causados por la incorporación de nuevos usuarios o nuevos productos en el sistema son los de arranque en frío (cold start) y primera valoración (first rater) respectivamente. A esto hay que sumar la dificultad para ofrecer recomendaciones fiables a usuarios con gustos inusuales (gray sheep users). Para hacer frente a los problemas anteriores se han propuesto algoritmos basados en el contenido como alternativa a los métodos de CF. Estos métodos pueden utilizarse para recomendar cualquier ítem haciendo uso de sus características, de manera que el usuario recibe recomendaciones de ítems similares a otros por los que ha mostrado interés en el pasado. La mayoría de los sistemas de recomendación actuales utilizan técnicas híbridas destinadas a aprovechar las ventajas de ambos enfoques y evitar sus inconvenientes. Estos métodos hacen uso de atributos de ítems y usuarios, además de información de valoraciones. Este trabajo se centra en la caracterización del usuario con el fin de aumentar el grado de personalización y así mejorar las recomendaciones proporcionadas por los métodos de filtrado colaborativo. Las propuestas que se presentan, aunque pudieran hacerse extensivas a otros dominios de aplicación, se centran en el ámbito de la música debido a que la forma de consumo de la música difiere significativamente de la forma de consumir otros productos y, en consecuencia, algunos aspectos relativos a las recomendaciones también son diferentes. Los diferentes enfoques propuestos para caracterizar al usuario tienen en común el hecho de requerir únicamente la información disponible en las plataformas de música en streaming, sin necesidad de ningún dato adicional como puede ser información demográfica de los usuarios o atributos de los ítems. Además del hecho de no disponer de valoraciones explícitas de los ítems de música y tener que obtenerlos implícitamente a partir de las reproducciones de artistas o canciones por parte de cada usuario. La primera propuesta aborda el problema de la oveja negra mediante la caracterización del usuario en función de la popularidad de la música que escucha, lo que está estrechamente relacionado con la distribución de ley de potencia de la frecuencia de reproducción de los ítems. Este enfoque es aplicable tanto para la recomendación de artistas como de canciones, y en este último caso, las recomendaciones se pueden mejorar teniendo en cuenta la posición de las canciones en las sesiones del usuario. El tiempo es otro factor importante relacionado con el comportamiento y los hábitos del usuario. La propuesta de mejora de los métodos de recomendación en relación con este factor se aborda desde tres perspectivas centradas en el usuario: modelado tanto de la evolución de sus preferencias, como de sus hábitos de escucha en función del tiempo, y uso del tiempo como variable contextual para generar recomendaciones sensibles al contexto. El modelo de evolución de preferencias está incluido en el proceso de obtención de calificaciones implícitas. Otra forma de caracterizar al usuario es a través de su contexto social. Las plataformas de música en streaming no disponen de mucha información de este tipo. Sin embargo, los datos disponibles sobre relaciones de amistad y etiquetado social se pueden utilizar para este propósito. En concreto, esta información se ha utilizado en este trabajo para modelar su grado de influencia, a partir de las propiedades de confianza y homofilia, y su nivel de conocimiento (expertise) respectivamente. Aunque los métodos presentados no están diseñados específicamente para abordar el inconveniente del arranque en frío, algunos de ellos se han probado en este escenario, mostrando que también contribuyen a minimizar ese problema

    Similar works