5 research outputs found
Social Search: retrieving information in Online Social Platforms -- A Survey
Social Search research deals with studying methodologies exploiting social
information to better satisfy user information needs in Online Social Media
while simplifying the search effort and consequently reducing the time spent
and the computational resources utilized. Starting from previous studies, in
this work, we analyze the current state of the art of the Social Search area,
proposing a new taxonomy and highlighting current limitations and open research
directions. We divide the Social Search area into three subcategories, where
the social aspect plays a pivotal role: Social Question&Answering, Social
Content Search, and Social Collaborative Search. For each subcategory, we
present the key concepts and selected representative approaches in the
literature in greater detail. We found that, up to now, a large body of studies
model users' preferences and their relations by simply combining social
features made available by social platforms. It paves the way for significant
research to exploit more structured information about users' social profiles
and behaviors (as they can be inferred from data available on social platforms)
to optimize their information needs further
Software expert discovery via knowledge domain embeddings in a collaborative network
© 2018 Elsevier B.V. Community Question Answering (CQA) websites can be claimed as the most major venues for knowledge sharing, and the most effective way of exchanging knowledge at present. Considering that massive amount of users are participating online and generating huge amount data, management of knowledge here systematically can be challenging. Expert recommendation is one of the major challenges, as it highlights users in CQA with potential expertise, which may help match unresolved questions with existing high quality answers while at the same time may help external services like human resource systems as another reference to evaluate their candidates. In this paper, we in this work we propose to exploring experts in CQA websites. We take advantage of recent distributed word representation technology to help summarize text chunks, and in a semantic view exploiting the relationships between natural language phrases to extract latent knowledge domains. By domains, the users’ expertise is determined on their historical performance, and a rank can be compute to given recommendation accordingly. In particular, Stack Overflow is chosen as our dataset to test and evaluate our work, where inclusive experiment shows our competence
Mejora de los sistemas de recomendación de música de filtrado colaborativo: Un enfoque en la caracterización del usuario a partir de factores de comportamiento y contextuales
[ES] La popularización de la distribución digital de contenido multimedia, conocido como streaming,
permite a cada vez más usuarios el acceso a prácticamente toda la música existente desde
cualquier lugar sin la limitación de la capacidad de almacenamiento de los dispositivos. Esa
enorme disponibilidad, asà como la gran variedad de proveedores de estos servicios hace muy
difÃcil al usuario encontrar música que pueda encajar en sus gustos. De ahà deriva el gran interés
actual por el desarrollo de algoritmos de recomendación que ayuden al usuario a filtrar y
descubrir la música que se ajusta a sus preferencias a partir de la enorme cantidad de contenido
musical disponible en el espacio digital. La mayorÃa de las plataformas disponen de servicios de
búsqueda y algunas de ellas disponen de mecanismos de recomendación y ofrecen listas
personalizadas de reproducción (playlists), aunque todavÃa se requieren muchas mejoras.
Los métodos utilizados en los sistemas de recomendación son muy variados, aunque los basados
en filtrado colaborativo (FC) se encuentran entre los más extendidos. Las recomendaciones que
proporcionan se basan en las valoraciones (ratings) que los usuarios hacen de los Ãtems a
recomendar, que en el caso de los sistemas de recomendación de música son canciones o
artistas. Las recomendaciones para un usuario dado se basan en las valoraciones realizadas por
otros usuarios con gustos similares a él. Los resultados de este tipo de técnicas son bastante
buenos, sin embargo, la dificultad de obtener la evaluación explicita de los Ãtems por parte de
los usuarios hace que el número de valoraciones sea insuficiente, causando problemas de
dispersión (sparsity), que impiden o dificultan la aplicación de tales métodos. Por este motivo,
en algunas ocasiones se recurre a formas implÃcitas de obtener dicha información, las cuales son
usualmente complejas y no siempre son efectivas. Otros problemas causados por la
incorporación de nuevos usuarios o nuevos productos en el sistema son los de arranque en frÃo
(cold start) y primera valoración (first rater) respectivamente. A esto hay que sumar la dificultad
para ofrecer recomendaciones fiables a usuarios con gustos inusuales (gray sheep users).
Para hacer frente a los problemas anteriores se han propuesto algoritmos basados en el
contenido como alternativa a los métodos de CF. Estos métodos pueden utilizarse para
recomendar cualquier Ãtem haciendo uso de sus caracterÃsticas, de manera que el usuario recibe
recomendaciones de Ãtems similares a otros por los que ha mostrado interés en el pasado. La
mayorÃa de los sistemas de recomendación actuales utilizan técnicas hÃbridas destinadas a
aprovechar las ventajas de ambos enfoques y evitar sus inconvenientes. Estos métodos hacen
uso de atributos de Ãtems y usuarios, además de información de valoraciones.
Este trabajo se centra en la caracterización del usuario con el fin de aumentar el grado de
personalización y asà mejorar las recomendaciones proporcionadas por los métodos de filtrado
colaborativo. Las propuestas que se presentan, aunque pudieran hacerse extensivas a otros
dominios de aplicación, se centran en el ámbito de la música debido a que la forma de consumo
de la música difiere significativamente de la forma de consumir otros productos y, en
consecuencia, algunos aspectos relativos a las recomendaciones también son diferentes.
Los diferentes enfoques propuestos para caracterizar al usuario tienen en común el hecho de
requerir únicamente la información disponible en las plataformas de música en streaming, sin
necesidad de ningún dato adicional como puede ser información demográfica de los usuarios o
atributos de los Ãtems. Además del hecho de no disponer de valoraciones explÃcitas de los Ãtems
de música y tener que obtenerlos implÃcitamente a partir de las reproducciones de artistas o
canciones por parte de cada usuario.
La primera propuesta aborda el problema de la oveja negra mediante la caracterización del
usuario en función de la popularidad de la música que escucha, lo que está estrechamente
relacionado con la distribución de ley de potencia de la frecuencia de reproducción de los Ãtems.
Este enfoque es aplicable tanto para la recomendación de artistas como de canciones, y en este
último caso, las recomendaciones se pueden mejorar teniendo en cuenta la posición de las
canciones en las sesiones del usuario.
El tiempo es otro factor importante relacionado con el comportamiento y los hábitos del
usuario. La propuesta de mejora de los métodos de recomendación en relación con este factor
se aborda desde tres perspectivas centradas en el usuario: modelado tanto de la evolución de
sus preferencias, como de sus hábitos de escucha en función del tiempo, y uso del tiempo como
variable contextual para generar recomendaciones sensibles al contexto. El modelo de
evolución de preferencias está incluido en el proceso de obtención de calificaciones implÃcitas.
Otra forma de caracterizar al usuario es a través de su contexto social. Las plataformas de música
en streaming no disponen de mucha información de este tipo. Sin embargo, los datos
disponibles sobre relaciones de amistad y etiquetado social se pueden utilizar para este
propósito. En concreto, esta información se ha utilizado en este trabajo para modelar su grado
de influencia, a partir de las propiedades de confianza y homofilia, y su nivel de conocimiento
(expertise) respectivamente.
Aunque los métodos presentados no están diseñados especÃficamente para abordar el
inconveniente del arranque en frÃo, algunos de ellos se han probado en este escenario,
mostrando que también contribuyen a minimizar ese problema
Understanding patient experience from online medium
Improving patient experience at hospitals leads to better health outcomes. To improve this, we must first understand and interpret patients' written feedback. Patient-generated texts such as patient reviews found on RateMD, or online health forums found on WebMD are venues where patients post about their experiences. Due to the massive amounts of patient-generated texts that exist online, an automated approach to identifying the topics from patient experience taxonomy is the only realistic option to analyze these texts. However, not only is there a lack of annotated taxonomy on these media, but also word usage is colloquial, making it challenging to apply standardized NLP technique to identify the topics that are present in the patient-generated texts. Furthermore, patients may describe multiple topics in the patient-generated texts which drastically increases the complexity of the task.
In this thesis, we address the challenges in comprehensively and automatically understanding the patient experience from patient-generated texts. We first built a set of rich semantic features to represent the corpus which helps capture meanings that may not typically be captured by the bag-of-words (BOW) model. Unlike the BOW model, semantic feature representation captures the context and in-depth meaning behind each word in the corpus. To the best of our knowledge, no existing work in understanding patient experience from patient-generated texts delves into which semantic features help capture the characteristics of the corpus. Furthermore, patients generally talk about multiple topics when they write in patient-generated texts, and these are frequently interdependent of each other. There are two types of topic interdependencies, those that are semantically similar, and those that are not. We built a constraint-based deep neural network classifier to capture the two types of topic interdependencies and empirically show the classification performance improvement over the baseline approaches.
Past research has also indicated that patient experiences differ depending on patient segments [1-4]. The segments can be based on demographics, for instance, by race, gender, or geographical location. Similarly, the segments can be based on health status, for example, whether or not the patient is taking medication, whether or not the patient has a particular disease, or whether or not the patient is readmitted to the hospital. To better understand patient experiences, we built an automated approach to identify patient segments with a focus on whether the person has stopped taking the medication or not. The technique used to identify the patient segment is general enough that we envision the approach to be applicable to other types of patient segments.
With a comprehensive understanding of patient experiences, we envision an application system where clinicians can directly read the most relevant patient-generated texts that pertain to their interest. The system can capture topics from patient experience taxonomy that is of interest to each clinician or designated expert, and we believe the system is one of many approaches that can ultimately help improve the patient experience