5 research outputs found

    Social Search: retrieving information in Online Social Platforms -- A Survey

    Full text link
    Social Search research deals with studying methodologies exploiting social information to better satisfy user information needs in Online Social Media while simplifying the search effort and consequently reducing the time spent and the computational resources utilized. Starting from previous studies, in this work, we analyze the current state of the art of the Social Search area, proposing a new taxonomy and highlighting current limitations and open research directions. We divide the Social Search area into three subcategories, where the social aspect plays a pivotal role: Social Question&Answering, Social Content Search, and Social Collaborative Search. For each subcategory, we present the key concepts and selected representative approaches in the literature in greater detail. We found that, up to now, a large body of studies model users' preferences and their relations by simply combining social features made available by social platforms. It paves the way for significant research to exploit more structured information about users' social profiles and behaviors (as they can be inferred from data available on social platforms) to optimize their information needs further

    Software expert discovery via knowledge domain embeddings in a collaborative network

    Full text link
    © 2018 Elsevier B.V. Community Question Answering (CQA) websites can be claimed as the most major venues for knowledge sharing, and the most effective way of exchanging knowledge at present. Considering that massive amount of users are participating online and generating huge amount data, management of knowledge here systematically can be challenging. Expert recommendation is one of the major challenges, as it highlights users in CQA with potential expertise, which may help match unresolved questions with existing high quality answers while at the same time may help external services like human resource systems as another reference to evaluate their candidates. In this paper, we in this work we propose to exploring experts in CQA websites. We take advantage of recent distributed word representation technology to help summarize text chunks, and in a semantic view exploiting the relationships between natural language phrases to extract latent knowledge domains. By domains, the users’ expertise is determined on their historical performance, and a rank can be compute to given recommendation accordingly. In particular, Stack Overflow is chosen as our dataset to test and evaluate our work, where inclusive experiment shows our competence

    Mejora de los sistemas de recomendación de música de filtrado colaborativo: Un enfoque en la caracterización del usuario a partir de factores de comportamiento y contextuales

    Get PDF
    [ES] La popularización de la distribución digital de contenido multimedia, conocido como streaming, permite a cada vez más usuarios el acceso a prácticamente toda la música existente desde cualquier lugar sin la limitación de la capacidad de almacenamiento de los dispositivos. Esa enorme disponibilidad, así como la gran variedad de proveedores de estos servicios hace muy difícil al usuario encontrar música que pueda encajar en sus gustos. De ahí deriva el gran interés actual por el desarrollo de algoritmos de recomendación que ayuden al usuario a filtrar y descubrir la música que se ajusta a sus preferencias a partir de la enorme cantidad de contenido musical disponible en el espacio digital. La mayoría de las plataformas disponen de servicios de búsqueda y algunas de ellas disponen de mecanismos de recomendación y ofrecen listas personalizadas de reproducción (playlists), aunque todavía se requieren muchas mejoras. Los métodos utilizados en los sistemas de recomendación son muy variados, aunque los basados en filtrado colaborativo (FC) se encuentran entre los más extendidos. Las recomendaciones que proporcionan se basan en las valoraciones (ratings) que los usuarios hacen de los ítems a recomendar, que en el caso de los sistemas de recomendación de música son canciones o artistas. Las recomendaciones para un usuario dado se basan en las valoraciones realizadas por otros usuarios con gustos similares a él. Los resultados de este tipo de técnicas son bastante buenos, sin embargo, la dificultad de obtener la evaluación explicita de los ítems por parte de los usuarios hace que el número de valoraciones sea insuficiente, causando problemas de dispersión (sparsity), que impiden o dificultan la aplicación de tales métodos. Por este motivo, en algunas ocasiones se recurre a formas implícitas de obtener dicha información, las cuales son usualmente complejas y no siempre son efectivas. Otros problemas causados por la incorporación de nuevos usuarios o nuevos productos en el sistema son los de arranque en frío (cold start) y primera valoración (first rater) respectivamente. A esto hay que sumar la dificultad para ofrecer recomendaciones fiables a usuarios con gustos inusuales (gray sheep users). Para hacer frente a los problemas anteriores se han propuesto algoritmos basados en el contenido como alternativa a los métodos de CF. Estos métodos pueden utilizarse para recomendar cualquier ítem haciendo uso de sus características, de manera que el usuario recibe recomendaciones de ítems similares a otros por los que ha mostrado interés en el pasado. La mayoría de los sistemas de recomendación actuales utilizan técnicas híbridas destinadas a aprovechar las ventajas de ambos enfoques y evitar sus inconvenientes. Estos métodos hacen uso de atributos de ítems y usuarios, además de información de valoraciones. Este trabajo se centra en la caracterización del usuario con el fin de aumentar el grado de personalización y así mejorar las recomendaciones proporcionadas por los métodos de filtrado colaborativo. Las propuestas que se presentan, aunque pudieran hacerse extensivas a otros dominios de aplicación, se centran en el ámbito de la música debido a que la forma de consumo de la música difiere significativamente de la forma de consumir otros productos y, en consecuencia, algunos aspectos relativos a las recomendaciones también son diferentes. Los diferentes enfoques propuestos para caracterizar al usuario tienen en común el hecho de requerir únicamente la información disponible en las plataformas de música en streaming, sin necesidad de ningún dato adicional como puede ser información demográfica de los usuarios o atributos de los ítems. Además del hecho de no disponer de valoraciones explícitas de los ítems de música y tener que obtenerlos implícitamente a partir de las reproducciones de artistas o canciones por parte de cada usuario. La primera propuesta aborda el problema de la oveja negra mediante la caracterización del usuario en función de la popularidad de la música que escucha, lo que está estrechamente relacionado con la distribución de ley de potencia de la frecuencia de reproducción de los ítems. Este enfoque es aplicable tanto para la recomendación de artistas como de canciones, y en este último caso, las recomendaciones se pueden mejorar teniendo en cuenta la posición de las canciones en las sesiones del usuario. El tiempo es otro factor importante relacionado con el comportamiento y los hábitos del usuario. La propuesta de mejora de los métodos de recomendación en relación con este factor se aborda desde tres perspectivas centradas en el usuario: modelado tanto de la evolución de sus preferencias, como de sus hábitos de escucha en función del tiempo, y uso del tiempo como variable contextual para generar recomendaciones sensibles al contexto. El modelo de evolución de preferencias está incluido en el proceso de obtención de calificaciones implícitas. Otra forma de caracterizar al usuario es a través de su contexto social. Las plataformas de música en streaming no disponen de mucha información de este tipo. Sin embargo, los datos disponibles sobre relaciones de amistad y etiquetado social se pueden utilizar para este propósito. En concreto, esta información se ha utilizado en este trabajo para modelar su grado de influencia, a partir de las propiedades de confianza y homofilia, y su nivel de conocimiento (expertise) respectivamente. Aunque los métodos presentados no están diseñados específicamente para abordar el inconveniente del arranque en frío, algunos de ellos se han probado en este escenario, mostrando que también contribuyen a minimizar ese problema

    Understanding patient experience from online medium

    Get PDF
    Improving patient experience at hospitals leads to better health outcomes. To improve this, we must first understand and interpret patients' written feedback. Patient-generated texts such as patient reviews found on RateMD, or online health forums found on WebMD are venues where patients post about their experiences. Due to the massive amounts of patient-generated texts that exist online, an automated approach to identifying the topics from patient experience taxonomy is the only realistic option to analyze these texts. However, not only is there a lack of annotated taxonomy on these media, but also word usage is colloquial, making it challenging to apply standardized NLP technique to identify the topics that are present in the patient-generated texts. Furthermore, patients may describe multiple topics in the patient-generated texts which drastically increases the complexity of the task. In this thesis, we address the challenges in comprehensively and automatically understanding the patient experience from patient-generated texts. We first built a set of rich semantic features to represent the corpus which helps capture meanings that may not typically be captured by the bag-of-words (BOW) model. Unlike the BOW model, semantic feature representation captures the context and in-depth meaning behind each word in the corpus. To the best of our knowledge, no existing work in understanding patient experience from patient-generated texts delves into which semantic features help capture the characteristics of the corpus. Furthermore, patients generally talk about multiple topics when they write in patient-generated texts, and these are frequently interdependent of each other. There are two types of topic interdependencies, those that are semantically similar, and those that are not. We built a constraint-based deep neural network classifier to capture the two types of topic interdependencies and empirically show the classification performance improvement over the baseline approaches. Past research has also indicated that patient experiences differ depending on patient segments [1-4]. The segments can be based on demographics, for instance, by race, gender, or geographical location. Similarly, the segments can be based on health status, for example, whether or not the patient is taking medication, whether or not the patient has a particular disease, or whether or not the patient is readmitted to the hospital. To better understand patient experiences, we built an automated approach to identify patient segments with a focus on whether the person has stopped taking the medication or not. The technique used to identify the patient segment is general enough that we envision the approach to be applicable to other types of patient segments. With a comprehensive understanding of patient experiences, we envision an application system where clinicians can directly read the most relevant patient-generated texts that pertain to their interest. The system can capture topics from patient experience taxonomy that is of interest to each clinician or designated expert, and we believe the system is one of many approaches that can ultimately help improve the patient experience
    corecore