23 research outputs found

    User Intent Prediction in Information-seeking Conversations

    Full text link
    Conversational assistants are being progressively adopted by the general population. However, they are not capable of handling complicated information-seeking tasks that involve multiple turns of information exchange. Due to the limited communication bandwidth in conversational search, it is important for conversational assistants to accurately detect and predict user intent in information-seeking conversations. In this paper, we investigate two aspects of user intent prediction in an information-seeking setting. First, we extract features based on the content, structural, and sentiment characteristics of a given utterance, and use classic machine learning methods to perform user intent prediction. We then conduct an in-depth feature importance analysis to identify key features in this prediction task. We find that structural features contribute most to the prediction performance. Given this finding, we construct neural classifiers to incorporate context information and achieve better performance without feature engineering. Our findings can provide insights into the important factors and effective methods of user intent prediction in information-seeking conversations.Comment: Accepted to CHIIR 201

    Mining question-answer pairs from web forum: a survey of challenges and resolutions

    Get PDF
    Internet forums, which are also known as discussion boards, are popular web applications. Members of the board discuss issues and share ideas to form a community within the board, and as a result generate huge amount of content on different topics on daily basis. Interest in information extraction and knowledge discovery from such sources has been on the increase in the research community. A number of factors are limiting the potentiality of mining knowledge from forums. Lexical chasm or lexical gap that renders some Natural Language Processing techniques (NLP) less effective, Informal tone that creates noisy data, drifting of discussion topic that prevents focused mining and asynchronous issue that makes it difficult to establish post-reply relationship are some of the problems that need to be addressed. This survey introduces these challenges within the framework of question answering. The survey provides description of the problems; cites and explores useful publications to the reader for further examination; provides an overview of resolution strategies and findings relevant to the challenges

    Feature analysis for web forum question post detection

    Get PDF
    A web forum which is also known as discussion board or Internet forum is an online community of users with a common interest. It is a problem-solving platform that engages experts across the globe. Both technical and non-technical problems are resolved on a daily basis within web forums. Research activities in this domain have been concentrated on answer detection with the assumption that the initial post of a thread is a question post. The quality of web forum question posts varies from excellent to mediocre or even spam. Detecting good question posts require utilization of salient features. In this paper, we implement a bag-of-words (BoW) model to mine web forum question posts. We empirically address the following questions in the paper. Can BoW model effectively detect web forum question post? What feature selection method is most appropriate for BoW model in this domain? Is choice of classifier influenced by web forum genre? We used three publicly available datasets of varying technical degrees for the experiments. The experimental results revealed that BoW can perform better than complex techniques that implement higher N-gram with part-of-speech tagging

    Búsqueda de estrategias para la clasificación del contenido en foros técnicos de discusión

    Get PDF
    En lás últimas décadas la disciplina Information Retrieval ha avanzado considerablemente. Esto se debe gran parte a que las organizaciones actuales hacen cada vez más esfuerzos para reutilizar el conocimiento, definiendo estrategias para tener catalogadas y reutilizar soluciones ya probadas. Por el otro lado la evolución de la Web trajo consigo distintas herramientas de trabajo colaborativo. Dentro de dichas herramientas, los foros de discusión son ampliamente utilizados para plantear problemas, expresar sugerencias, así como para intercambiar conocimientos y experiencias. Dentro de un foro de discusión, un usuario de la comunidad puede realizar una pregunta, y el resto de los miembros de dicha comunidad pueden responder proponiendo soluciones al problema planteado. De esta manera, mediante el uso de esta herramienta, se genera un volumen de información bastante importante, que puede ser utilizado como fuente de conocimiento para un sistema de recuperación de información. El objetivo fundamental de nuestro proyecto es definir una herramienta que, a partir de información existente en hilos de discusión de foros técnicos, la clasifique y establezca un orden entre soluciones posibles para problemas recurrentes del área de programación.Eje: Ingeniería de Software.Red de Universidades con Carreras en Informática (RedUNCI

    Estrategias para la clasificación de contenido y usuarios de foros de discusión técnicos

    Get PDF
    Los foros de discusión son utilizados por muchos técnicos informáticos para plantear dudas y pedir sugerencias para resolver algún problema particular. Para ello, formulan una pregunta a partir de la cual se abre un hilo de discusión (thread), en el que suelen participar varios usuarios que analizan el escenario y proponen una o más soluciones al problema en cuestión. De esta manera, los foros se han convertido en plataformas colaborativas donde el conocimiento se explicita a la vez que se comparte. Dado que existen muchos foros sobre las mismas temáticas (lenguajes de programación, aplicaciones específicas, etc.), es posible encontrar en la Web muchos hilos de discusión en diferentes foros que están relacionados al mismo problema. Cuando un técnico informático tiene un problema específico, suele utilizar un motor de búsqueda multipropósito que le devuelve una lista extensa de páginas de varios tipos (blogs, foros, artículos, etc.), luego el técnico necesitar navegar por varias páginas hasta descubrir cuál es la que describe un problema más parecido al que tiene, y encontrar (si existe) una solución que pueda satisfacerle. Para facilitar esta tarea periódica de los técnicos informáticos, nuestro proyecto tiene como objetivo la implementación de una herramienta que recupere la información disponible en hilos de discusión de foros técnicos de manera automática, y que a partir de un análisis basado en un modelo de calidad pertinente, permita clasificar dicha información y entregar a los usuarios un ranking de posiblesEje: Ingeniería del Software.Red de Universidades con Carreras en Informátic

    Análisis de estrategias para clasificación de usuarios y post dentro de un hilo de discusión

    Get PDF
    La Web actual se ha transformado en una plataforma que posibilita el encuentro de ideas y favorece la creación de debates en chat, blogs, foros de discusión, etc. En particular la comunidad informática suele aprovechar los medios disponibles en la Web de soporte grupal, tanto para solucionar problemas como para el aprendizaje de alguna tarea particular. Es por ello que este tipo de herramientas han tenido un gran auge en las últimas décadas, dentro de las cuales los foros de discusión se han convertido en los más utilizados para aprendizaje o como proveedor de soluciones de algún problema específico. Los foros de discusión generan contenido de manera continua lo que produce un gran volumen de información, que puede ser utilizado como fuente de conocimiento para un sistema de Information Retrieval (IR). Las organizaciones actuales hacen cada vez más esfuerzos para reutilizar el conocimiento, definiendo estrategias para tener catalogadas y reutilizar soluciones ya probadas por lo que la disciplina de IR ha avanzado considerablemente. El objetivo fundamental de nuestro proyecto es definir una herramienta que, a partir de información contenida en hilos de foros de discusión técnicos, pueda descargar dicha información de manera automática, la pueda clasificar de acuerdo a temas específicos, así como también poder establecer un ranking de soluciones posibles, teniendo en cuenta además a los usuarios involucrados en dichos foros.Eje: Ingeniería de Software.Red de Universidades con Carreras en Informátic

    Estrategias para la clasificación de contenido y usuarios de foros de discusión técnicos

    Get PDF
    Los foros de discusión son utilizados por muchos técnicos informáticos para plantear dudas y pedir sugerencias para resolver algún problema particular. Para ello, formulan una pregunta a partir de la cual se abre un hilo de discusión (thread), en el que suelen participar varios usuarios que analizan el escenario y proponen una o más soluciones al problema en cuestión. De esta manera, los foros se han convertido en plataformas colaborativas donde el conocimiento se explicita a la vez que se comparte. Dado que existen muchos foros sobre las mismas temáticas (lenguajes de programación, aplicaciones específicas, etc.), es posible encontrar en la Web muchos hilos de discusión en diferentes foros que están relacionados al mismo problema. Cuando un técnico informático tiene un problema específico, suele utilizar un motor de búsqueda multipropósito que le devuelve una lista extensa de páginas de varios tipos (blogs, foros, artículos, etc.), luego el técnico necesitar navegar por varias páginas hasta descubrir cuál es la que describe un problema más parecido al que tiene, y encontrar (si existe) una solución que pueda satisfacerle. Para facilitar esta tarea periódica de los técnicos informáticos, nuestro proyecto tiene como objetivo la implementación de una herramienta que recupere la información disponible en hilos de discusión de foros técnicos de manera automática, y que a partir de un análisis basado en un modelo de calidad pertinente, permita clasificar dicha información y entregar a los usuarios un ranking de posiblesEje: Ingeniería del Software.Red de Universidades con Carreras en Informátic

    Análisis de estrategias para clasificación de usuarios y post dentro de un hilo de discusión

    Get PDF
    La Web actual se ha transformado en una plataforma que posibilita el encuentro de ideas y favorece la creación de debates en chat, blogs, foros de discusión, etc. En particular la comunidad informática suele aprovechar los medios disponibles en la Web de soporte grupal, tanto para solucionar problemas como para el aprendizaje de alguna tarea particular. Es por ello que este tipo de herramientas han tenido un gran auge en las últimas décadas, dentro de las cuales los foros de discusión se han convertido en los más utilizados para aprendizaje o como proveedor de soluciones de algún problema específico. Los foros de discusión generan contenido de manera continua lo que produce un gran volumen de información, que puede ser utilizado como fuente de conocimiento para un sistema de Information Retrieval (IR). Las organizaciones actuales hacen cada vez más esfuerzos para reutilizar el conocimiento, definiendo estrategias para tener catalogadas y reutilizar soluciones ya probadas por lo que la disciplina de IR ha avanzado considerablemente. El objetivo fundamental de nuestro proyecto es definir una herramienta que, a partir de información contenida en hilos de foros de discusión técnicos, pueda descargar dicha información de manera automática, la pueda clasificar de acuerdo a temas específicos, así como también poder establecer un ranking de soluciones posibles, teniendo en cuenta además a los usuarios involucrados en dichos foros.Eje: Ingeniería de Software.Red de Universidades con Carreras en Informátic

    Análisis de estrategias para clasificación de usuarios y post dentro de un hilo de discusión

    Get PDF
    La Web actual se ha transformado en una plataforma que posibilita el encuentro de ideas y favorece la creación de debates en chat, blogs, foros de discusión, etc. En particular la comunidad informática suele aprovechar los medios disponibles en la Web de soporte grupal, tanto para solucionar problemas como para el aprendizaje de alguna tarea particular. Es por ello que este tipo de herramientas han tenido un gran auge en las últimas décadas, dentro de las cuales los foros de discusión se han convertido en los más utilizados para aprendizaje o como proveedor de soluciones de algún problema específico. Los foros de discusión generan contenido de manera continua lo que produce un gran volumen de información, que puede ser utilizado como fuente de conocimiento para un sistema de Information Retrieval (IR). Las organizaciones actuales hacen cada vez más esfuerzos para reutilizar el conocimiento, definiendo estrategias para tener catalogadas y reutilizar soluciones ya probadas por lo que la disciplina de IR ha avanzado considerablemente. El objetivo fundamental de nuestro proyecto es definir una herramienta que, a partir de información contenida en hilos de foros de discusión técnicos, pueda descargar dicha información de manera automática, la pueda clasificar de acuerdo a temas específicos, así como también poder establecer un ranking de soluciones posibles, teniendo en cuenta además a los usuarios involucrados en dichos foros.Eje: Ingeniería de Software.Red de Universidades con Carreras en Informátic
    corecore