462 research outputs found
TOPICAL EXPRESSIVITY IN SHORT TEXTS
With each passing minute, online data is growing exponentially. A bulk of such data is generated from short text social media platforms such as Twitter. Such platforms are fundamental in social media knowledge-based applications like recommender systems. Twitter, for example, provides rich real-time streaming information. Extracting knowledge from such short texts without automated support is not feasible due to Twitter\u27s platform streaming nature. Therefore, an automated method for comprehending patterns in such text is a need for many knowledge systems. This paper provides solutions to generate topics from Twitter data. We present several techniques related to topical modelling to identify topics of interest in short texts. Topic modelling is inherently problematic in shorter texts with very sparse vocabulary in addition to the informal language used in their dissemination. Such findings are informative in knowledge extraction for social media-based recommender systems as well as in understanding tweeters over time
Probabilistic collaborative filtering with negative cross entropy
This is the author's version of the work. It is posted here for your personal use. Not for redistribution. The definitive Version of Record was published in RecSys '13 Proceedings of the 7th ACM conference on Recommender systems, http://dx.doi.org/10.1145/2507157.2507191.Relevance-Based Language Models are an effective IR approach which explicitly introduces the concept of relevance in the statistical Language Modelling framework of Information Retrieval. These models have shown to achieve state-of-the-art retrieval performance in the pseudo relevance feedback task. In this paper we propose a novel adaptation of this language modeling approach to rating-based Collaborative Filtering. In a memory-based approach, we apply the model to the formation of user neighbourhoods, and the generation of recommendations based on such neighbourhoods. We report experimental results where our method outperforms other standard memory-based algorithms in terms of ranking precision.This work was funded by Secretaría de Estado de Investigación,
Desarrollo e Innovación from the Spanish Government under projects
TIN2012-33867 and TIN2011-28538-C02
Information retrieval models for recommender systems
Programa Oficial de Doutoramento en Computación . 5009V01[Abstract]
Information retrieval addresses the information needs of users by delivering
relevant pieces of information but requires users to convey their
information needs explicitly. In contrast, recommender systems offer personalized
suggestions of items automatically. Ultimately, both fields help
users cope with information overload by providing them with relevant
items of information.
This thesis aims to explore the connections between information retrieval
and recommender systems. Our objective is to devise recommendation
models inspired in information retrieval techniques. We begin by
borrowing ideas from the information retrieval evaluation literature to analyze
evaluation metrics in recommender systems. Second, we study the
applicability of pseudo-relevance feedback models to different recommendation
tasks. We investigate the conventional top-N recommendation
task, but we also explore the recently formulated user-item group formation
problem and propose a novel task based on the liquidation oflong
tail items. Third, we exploit ad hoc retrieval models to compute neighborhoods
in a collaborative filtering scenario. Fourth, we explore the
opposite direction by adapting an effective recommendation framework
to pseudo-relevance feedback. Finally, we discuss the results and present
our concIusions.
In summary, this doctoral thesis adapts a series of information retrieval
models to recommender systems. Our investigation shows that many
retrieval models can be accommodated to deal with different recommendation
tasks. Moreover, we find that taking the opposite path is also
possible. Exhaustive experimentation confirms that the proposed models
are competitive. Finally, we also perform a theoretical analysis of sorne
models to explain their effectiveness.[Resumen]
La recuperación de información da respuesta a las necesidades de información
de los usuarios proporcionando información relevante, pero
requiere que los usuarios expresen explícitamente sus necesidades de
información. Por el contrario, los sistemas de recomendación ofrecen
sugerencias personalizadas de elementos automáticamente. En última
instancia, ambos campos ayudan a los usuarios a lidiar con la sobrecarga
de información al proporcionarles información relevante.
Esta tesis tiene como propósito explorar las conexiones entre la recuperación
de información y los sistemas de recomendación. Nuestro
objetivo es diseñar modelos de recomendación inspirados en técnicas de
recuperación de información. Comenzamos tomando prestadas ideas de
la literatura de evaluación en recuperación de información para analizar
las métricas de evaluación en los sistemas de recomendación. En segundo
lugar, estudiamos la aplicabilidad de los modelos de retroalimentación de
pseudo-relevancia a diferentes tareas de recomendación. Investigamos
la tarea de recomendar listas ordenadas de elementos, pero también exploramos
el problema recientemente formulado de formación de grupos
usuario-elemento y proponemos una tarea novedosa basada en la liquidación
de los elementos de la larga cola. Tercero, explotamos modelos
de recuperación ad hoc para calcular vecindarios en un escenario de
filtrado colaborativo. En cuarto lugar, exploramos la dirección opuesta
adaptando un método eficaz de recomendación a la retroalimentación de
pseudo-relevancia. Finalmente, discutimos los resultados y presentamos
nuestras conclusiones.
En resumen, esta tesis doctoral adapta varios modelos de recuperación
de información para su uso como sistemas de recomendación. Nuestra
investigación muestra que muchos modelos de recuperación de información
se pueden aplicar para tratar diferentes tareas de recomendación.
Además, comprobamos que tomar el camino contrario también es posible.
Una experimentación exhaustiva confirma que los modelos propuestos
son competitivos. Finalmente, también realizamos un análisis teórico de
algunos modelos para explicar su efectividad.[Resumo]
A recuperación de información dá resposta ás necesidades de información
dos usuarios proporcionando información relevante, pero require
que os usuarios expresen explicitamente as súas necesidades de información.
Pola contra, os sistemas de recomendación ofrecen suxestións
personalizadas de elementos automaticamente. En última instancia, ambos
os campos axudan aos usuarios a lidar coa sobrecarga de información
ao proporcionarlles información relevante.
Esta tese ten como propósito explorar as conexións entre a recuperación
de información e os sistemas de recomendación. O naso obxectivo é deseñar
modelos de recomendación inspirados en técnicas de recuperación
de información. Comezamos tomando prestadas ideas da literatura de
avaliación en recuperación de información para analizar as métricas de
avaliación nos sistemas de recomendación. En segundo lugar, estudamos
a aplicabilidade dos modelos de retroalimentación de seudo-relevancia a
diferentes tarefas de recomendación. Investigamos a tarefa de recomendar
listas ordenadas de elementos, pero tamén exploramos o problema
recentemente formulado de formación de grupos de usuario-elemento e
propoñemos unha tarefa nova baseada na liquidación dos elementos da
longa cola. Terceiro, explotamos modelos de recuperación ad hoc para
calcular veciñanzas nun escenario de filtrado colaborativo. En cuarto
lugar, exploramos a dirección aposta adaptando un método eficaz de
recomendación á retroalimentación de seudo-relevancia. Finalmente,
discutimos os resultados e presentamos as nasas conclusións.
En resumo, esta tese doutoral adapta varios modelos de recuperación
de información para o seu uso como sistemas de recomendación. A nosa
investigación mostra que moitos modelos de recuperación de información
pódense aplicar para tratar diferentes tarefas de recomendación.
Ademais, comprobamos que tomar o camiño contrario tamén é posible.
Unha experimentación exhaustiva confirma que os modelos propostos
son competitivos. Finalmente, tamén realizamos unha análise teórica
dalgúns modelos para explicar a súa efectividade
An analysis of popularity biases in recommender system evaluation and algorithms
Tesis doctoral inédita leída en la Universidad Autónoma de Madrid, Escuela Politécnica Superior, Departamento de Ingeniería Informática. Fecha de Lectura: 03-10-2019Las tecnologías de recomendación han ido progresivamente extendiendo su presencia en las aplicaciones y servicios de uso diario. Los sistemas de recomendación buscan realizar sugerencias individualizadas de productos u opciones que los usuarios puedan encontrar interesantes o útiles. Implícita en el concepto de recomendación está la idea de que las sugerencias más satisfactorias para cada usuario son aquellas que tienen en cuenta sus gustos particulares, por lo que cabría esperar que los algoritmos de recomendación más eficaces sean los más personalizados. Sin embargo, se ha observado recientemente que recomendar simplemente los productos más populares no resulta una estrategia mucho peor que los mejores y más sofisticados algoritmos personalizados, y más aún, que estos tienden a sesgar sus recomendaciones hacia opciones mayoritarias. Por todo ello, es rele-vante entender en qué medida y bajo qué circunstancias es la popularidad una señal real-mente efectiva a la hora de recomendar, y si su aparente efectividad se debe a la existencia de ciertos sesgos en las metodologías de evaluación offline actuales, como todo parece indicar, o no.
En esta tesis abordamos esta cuestión desde un punto de vista plenamente formal, identificando los factores que pueden determinar la respuesta y modelizándolos en térmi-nos de dependencias probabilísticas entre variables aleatorias, tales como la votación, el descubrimiento y la relevancia. De esta forma, caracterizamos situaciones concretas que garantizan que la popularidad sea efectiva o que no lo sea, y establecemos las condiciones bajo las cuales pueden existir contradicciones entre el acierto observado y el real. Las principales conclusiones hacen referencia a escenarios simplificados prototípicos, más allá de los cuales el análisis formal concluye que cualquier resultado es posible. Para profun-dizar en el escenario general sin suposiciones tan simplificadas, estudiamos un caso parti-cular donde el descubrimiento de ítems es consecuencia de la interacción entre usuarios en una red social.
Además, en esta tesis proporcionamos una explicación formal del sesgo de populari-dad que presentan los algoritmos de filtrado colaborativo. Para ello, desarrollamos una versión probabilística del algoritmo de vecinos próximos kNN. Dicha versión evidencia además la condición fundamental que hace que kNN produzca recomendaciones perso-nalizadas y se diferencie de la popularidad pura
TOPIC MODELLING METHODOLOGY: ITS USE IN INFORMATION SYSTEMS AND OTHER MANAGERIAL DISCIPLINES
Over the last decade, quantitative text mining approaches to content analysis have gained increasing traction within information systems research, and related fields, such as business administration. Recently, topic models, which are supposed to provide their user with an overview of themes being dis-cussed in documents, have gained popularity. However, while convenient tools for the creation of this model class exist, the evaluation of topic models poses significant challenges to their users. In this research, we investigate how questions of model validity and trustworthiness of presented analyses are addressed across disciplines. We accomplish this by providing a structured review of methodological approaches across the Financial Times 50 journal ranking. We identify 59 methodological research papers, 24 implementations of topic models, as well as 33 research papers using topic models in In-formation Systems (IS) research, and 29 papers using such models in other managerial disciplines. Results indicate a need for model implementations usable by a wider audience, as well as the need for more implementations of model validation techniques, and the need for a discussion about the theoretical foundations of topic modelling based research
Layered evaluation of interactive adaptive systems : framework and formative methods
Peer reviewedPostprin
- …