Search CORE

4 research outputs found

Author
Publication venue: Published by Elsevier B.V.
Publication date
Field of study

Elsevier - Publisher Connector

Design and Implementation of Music Recommendation System Based on Hadoop

Author: Xinwei Li
Yufeng Zhao
Publication venue: 'Exeley, Inc.'
Publication date: 01/01/2018
Field of study

Exeley Inc.

Mejora de los sistemas de recomendación de música de filtrado colaborativo: Un enfoque en la caracterización del usuario a partir de factores de comportamiento y contextuales

Author: Sánchez Moreno Diego
Publication venue
Publication date: 01/01/2020
Field of study

[ES] La popularización de la distribución digital de contenido multimedia, conocido como streaming, permite a cada vez más usuarios el acceso a prácticamente toda la música existente desde cualquier lugar sin la limitación de la capacidad de almacenamiento de los dispositivos. Esa enorme disponibilidad, así como la gran variedad de proveedores de estos servicios hace muy difícil al usuario encontrar música que pueda encajar en sus gustos. De ahí deriva el gran interés actual por el desarrollo de algoritmos de recomendación que ayuden al usuario a filtrar y descubrir la música que se ajusta a sus preferencias a partir de la enorme cantidad de contenido musical disponible en el espacio digital. La mayoría de las plataformas disponen de servicios de búsqueda y algunas de ellas disponen de mecanismos de recomendación y ofrecen listas personalizadas de reproducción (playlists), aunque todavía se requieren muchas mejoras. Los métodos utilizados en los sistemas de recomendación son muy variados, aunque los basados en filtrado colaborativo (FC) se encuentran entre los más extendidos. Las recomendaciones que proporcionan se basan en las valoraciones (ratings) que los usuarios hacen de los ítems a recomendar, que en el caso de los sistemas de recomendación de música son canciones o artistas. Las recomendaciones para un usuario dado se basan en las valoraciones realizadas por otros usuarios con gustos similares a él. Los resultados de este tipo de técnicas son bastante buenos, sin embargo, la dificultad de obtener la evaluación explicita de los ítems por parte de los usuarios hace que el número de valoraciones sea insuficiente, causando problemas de dispersión (sparsity), que impiden o dificultan la aplicación de tales métodos. Por este motivo, en algunas ocasiones se recurre a formas implícitas de obtener dicha información, las cuales son usualmente complejas y no siempre son efectivas. Otros problemas causados por la incorporación de nuevos usuarios o nuevos productos en el sistema son los de arranque en frío (cold start) y primera valoración (first rater) respectivamente. A esto hay que sumar la dificultad para ofrecer recomendaciones fiables a usuarios con gustos inusuales (gray sheep users). Para hacer frente a los problemas anteriores se han propuesto algoritmos basados en el contenido como alternativa a los métodos de CF. Estos métodos pueden utilizarse para recomendar cualquier ítem haciendo uso de sus características, de manera que el usuario recibe recomendaciones de ítems similares a otros por los que ha mostrado interés en el pasado. La mayoría de los sistemas de recomendación actuales utilizan técnicas híbridas destinadas a aprovechar las ventajas de ambos enfoques y evitar sus inconvenientes. Estos métodos hacen uso de atributos de ítems y usuarios, además de información de valoraciones. Este trabajo se centra en la caracterización del usuario con el fin de aumentar el grado de personalización y así mejorar las recomendaciones proporcionadas por los métodos de filtrado colaborativo. Las propuestas que se presentan, aunque pudieran hacerse extensivas a otros dominios de aplicación, se centran en el ámbito de la música debido a que la forma de consumo de la música difiere significativamente de la forma de consumir otros productos y, en consecuencia, algunos aspectos relativos a las recomendaciones también son diferentes. Los diferentes enfoques propuestos para caracterizar al usuario tienen en común el hecho de requerir únicamente la información disponible en las plataformas de música en streaming, sin necesidad de ningún dato adicional como puede ser información demográfica de los usuarios o atributos de los ítems. Además del hecho de no disponer de valoraciones explícitas de los ítems de música y tener que obtenerlos implícitamente a partir de las reproducciones de artistas o canciones por parte de cada usuario. La primera propuesta aborda el problema de la oveja negra mediante la caracterización del usuario en función de la popularidad de la música que escucha, lo que está estrechamente relacionado con la distribución de ley de potencia de la frecuencia de reproducción de los ítems. Este enfoque es aplicable tanto para la recomendación de artistas como de canciones, y en este último caso, las recomendaciones se pueden mejorar teniendo en cuenta la posición de las canciones en las sesiones del usuario. El tiempo es otro factor importante relacionado con el comportamiento y los hábitos del usuario. La propuesta de mejora de los métodos de recomendación en relación con este factor se aborda desde tres perspectivas centradas en el usuario: modelado tanto de la evolución de sus preferencias, como de sus hábitos de escucha en función del tiempo, y uso del tiempo como variable contextual para generar recomendaciones sensibles al contexto. El modelo de evolución de preferencias está incluido en el proceso de obtención de calificaciones implícitas. Otra forma de caracterizar al usuario es a través de su contexto social. Las plataformas de música en streaming no disponen de mucha información de este tipo. Sin embargo, los datos disponibles sobre relaciones de amistad y etiquetado social se pueden utilizar para este propósito. En concreto, esta información se ha utilizado en este trabajo para modelar su grado de influencia, a partir de las propiedades de confianza y homofilia, y su nivel de conocimiento (expertise) respectivamente. Aunque los métodos presentados no están diseñados específicamente para abordar el inconveniente del arranque en frío, algunos de ellos se han probado en este escenario, mostrando que también contribuyen a minimizar ese problema

Gestion del Repositorio Documental de la Universidad de Salamanca

Exploiting music playrate in discovering implicit feedback features for music recommender systems

Author: 유수연
Publication venue: 서울대학교 대학원
Publication date: 01/02/2018
Field of study

학위논문 (석사)-- 서울대학교 대학원 : 융합과학기술대학원 융합과학부, 2018. 2. 이교구.디지털 음원 시장 규모가 커짐에 따라 사용자는 방대한 크기의 디지털 음원 컬렉션에 접근할 수 있게 되었으나, 동시에 그 중에서 자신이 어떤 음악을 원하는지 찾고 선택하는 행위는 더욱 어려워지고 많은 시간을 소모하게 되었다. 이와 같은 이유 때문에 음악 추천 시스템의 중요성이 부각되며 그 성능을 높이기 위한 연구들이 다양한 방법론을 통해 시도되고 있다. 추천 시스템의 목적은 사용자가 소비하지 않은 아이템 중 선호/만족할만한 추천 아이템을 찾는 것에 있으며, 특히 음악 도메인에서는 이를 위해 사용자가 어떤 음악을 어떤 기준으로 얼마나 선호/불호하였는지를 분석하여, 다음으로는 어떤 곡을 듣고 싶어 하는지, 어떤 곡을 들어야 만족도가 높을 것인지를 예측해야 한다. 이와 같은 추천 시스템의 목적으로 미루어 보았을 때 사용자의 선호도는 추천 시스템에 있어서 가장 핵심적인 요소라고 할 수 있으며, 그 동안의 추천 시스템 연구들에서는 사용자의 선호도를 모델링하기 위해 크게 명시적 피드백(explicit feedback) 과 암시적 피드백(implicit feedback) 방식을 사용해왔다. 이 중에서도 특히 암시적 피드백 방식은 사용자로부터 직접 평가를 입력받지 않아도 된다는 점에서 음악 선호도, 혹은 평가를 추정할 때 가장 큰 문제로 대두되는 희소성 문제(sparsity problem)를 보완할 수 있다는 이유로 크게 각광받고 있다. 음악 도메인에서의 암시적 피드백은 사용자의 음악 청취 기록을 통해 수집되며, 음악 추천 시스템에서는 재생/스킵/정지 등의 청취 행위로부터 얻을 수 있는 특성 중에서도 특히 특정 곡을 몇 번 들었는지를 나타내는 재생 횟수(playcount) 가 대부분 사용되고 있다. 이러한 재생 횟수는 감소하지 않는(non-decreasing) 특징으로 인해 사용자의 선호도 감소를 반영하지 못하고, 고정적인 수집 기준을 가지기 때문에 사용자마다 상이할 수 있는 선호도 기준을 반영하지 못하며, 선호도 선상의 상위 극소수를 제외한 나머지 대다수 곡들에 대한 선호도는 구별하지 못한다는 한계점을 지닌다. 본 연구에서는 기존 음악 도메인에서 대표적으로 사용되는 암시적 피드백인 재생 횟수의 한계점을 보완하고 사용자의 음악 선호도를 보다 잘 반영할 수 있도록 하기 위해 기존의 연구와 사용자의 청취 기록 데이터를 기반으로 가중 재생율이라는 개념을 제안하고, 이를 바탕으로 누적 가중 재생율 및 재생횟수-평균 가중 재생율 곱이라는 새로운 암시적 피드백 특성들을 도출한다. 또한 사용자 평가를 통해 제안된 특성이 사용자의 실제 선호도를 잘 반영할 수 있는지와 음악 추천 시스템에 적용되었을 때 성능의 차이가 있는지를 검증한다. 이 후 결과 분석을 통해 본 연구의 한계점과, 음악 선호도 모델링과 음악 추천 과정과의 관계성에 관해 고찰하고, 이를 바탕으로 연구의 결론을 도출한다.제1장 서론 1 제1절 연구 배경 1 제2절 연구 목적 7 제2장 관련 연구 8 제1절 이론적 배경 8 2.1.1 음악 선호도 모델 8 2.1.2 추천 시스템에서의 사용자 피드백 9 2.1.3 음악 추천 시스템의 평가 14 제2절 선행 연구 16 2.2.1 암시적 피드백을 활용한 추천 16 2.2.2 음악 재생율 관련 연구 19 제3장 연구 데이터 및 제안 특성 20 제1절 연구 데이터 21 3.1.1 LFM-1b 데이터셋 21 3.1.2 트랙 지속 시간 데이터 수집 22 제2절 제안 암시적 피드백 특성 24 3.2.1 재생율 및 가중 재생율의 정의 24 3.2.2 제안 특성 1: 누적 가중 재생율 25 3.2.3 제안 특성 2: 재생횟수-평균 가중 재생율 곱 26 제4장 사용자 평가 27 제1절 평가 과정 28 제2절 음악 선호도 모델 평가 30 4.2.1 평가 문항 1 30 4.2.2 평가 문항 2 32 제3절 음악 추천 알고리즘에서의 성능 평가 33 4.3.1 로지스틱 행렬 분해 알고리즘 34 4.3.2 데이터 샘플링 35 4.3.3 음악 추천 리스트 평가 방법 36 제5장 연구 결과 38 제1절 음악 선호도 모델 평가 결과 38 5.1.1 평가 문항 1 결과 38 5.1.2 평가 문항 2 결과 42 제2절 음악 추천 알고리즘에서의 성능 평가 결과 44 5.2.1 추천 곡 리스트 평가 결과 45 5.2.2 개별 추천 곡 평가 결과 47 제3절 결과 정리 및 고찰 54 5.3.1 선호도 모델과 추천 결과와의 관련성 55 5.3.2 음악 컨텐츠 소비 경향 차이에 따른 선호도 모델링 방식 57 제6장 결론 60 제1절 결론 및 연구 의의 60 제2절 연구의 한계 및 향후 연구 62 참고문헌 63Maste

SNU Open Repository and Archive