11 research outputs found

    Using conditional random fields to extract contexts and answers of questions from online forums

    Get PDF
    Online forum discussions often contain vast amounts of questions that are the focuses of discussions. Extracting contexts and answers together with the questions will yield not only a coherent forum summary but also a valuable QA knowledge base. In this paper, we propose a general framework based on Conditional Random Fields (CRFs) to detect the contexts and answers of questions from forum threads. We improve the basic framework by Skip-chain CRFs and 2D CRFs to better accommodate the features of forums for better performance. Experimental results show that our techniques are very promising.

    Análisis de estrategias para clasificación de usuarios y post dentro de un hilo de discusión

    Get PDF
    La Web actual se ha transformado en una plataforma que posibilita el encuentro de ideas y favorece la creación de debates en chat, blogs, foros de discusión, etc. En particular la comunidad informática suele aprovechar los medios disponibles en la Web de soporte grupal, tanto para solucionar problemas como para el aprendizaje de alguna tarea particular. Es por ello que este tipo de herramientas han tenido un gran auge en las últimas décadas, dentro de las cuales los foros de discusión se han convertido en los más utilizados para aprendizaje o como proveedor de soluciones de algún problema específico. Los foros de discusión generan contenido de manera continua lo que produce un gran volumen de información, que puede ser utilizado como fuente de conocimiento para un sistema de Information Retrieval (IR). Las organizaciones actuales hacen cada vez más esfuerzos para reutilizar el conocimiento, definiendo estrategias para tener catalogadas y reutilizar soluciones ya probadas por lo que la disciplina de IR ha avanzado considerablemente. El objetivo fundamental de nuestro proyecto es definir una herramienta que, a partir de información contenida en hilos de foros de discusión técnicos, pueda descargar dicha información de manera automática, la pueda clasificar de acuerdo a temas específicos, así como también poder establecer un ranking de soluciones posibles, teniendo en cuenta además a los usuarios involucrados en dichos foros.Eje: Ingeniería de Software.Red de Universidades con Carreras en Informátic

    Análisis de estrategias para clasificación de usuarios y post dentro de un hilo de discusión

    Get PDF
    La Web actual se ha transformado en una plataforma que posibilita el encuentro de ideas y favorece la creación de debates en chat, blogs, foros de discusión, etc. En particular la comunidad informática suele aprovechar los medios disponibles en la Web de soporte grupal, tanto para solucionar problemas como para el aprendizaje de alguna tarea particular. Es por ello que este tipo de herramientas han tenido un gran auge en las últimas décadas, dentro de las cuales los foros de discusión se han convertido en los más utilizados para aprendizaje o como proveedor de soluciones de algún problema específico. Los foros de discusión generan contenido de manera continua lo que produce un gran volumen de información, que puede ser utilizado como fuente de conocimiento para un sistema de Information Retrieval (IR). Las organizaciones actuales hacen cada vez más esfuerzos para reutilizar el conocimiento, definiendo estrategias para tener catalogadas y reutilizar soluciones ya probadas por lo que la disciplina de IR ha avanzado considerablemente. El objetivo fundamental de nuestro proyecto es definir una herramienta que, a partir de información contenida en hilos de foros de discusión técnicos, pueda descargar dicha información de manera automática, la pueda clasificar de acuerdo a temas específicos, así como también poder establecer un ranking de soluciones posibles, teniendo en cuenta además a los usuarios involucrados en dichos foros.Eje: Ingeniería de Software.Red de Universidades con Carreras en Informátic

    Análisis de estrategias para clasificación de usuarios y post dentro de un hilo de discusión

    Get PDF
    La Web actual se ha transformado en una plataforma que posibilita el encuentro de ideas y favorece la creación de debates en chat, blogs, foros de discusión, etc. En particular la comunidad informática suele aprovechar los medios disponibles en la Web de soporte grupal, tanto para solucionar problemas como para el aprendizaje de alguna tarea particular. Es por ello que este tipo de herramientas han tenido un gran auge en las últimas décadas, dentro de las cuales los foros de discusión se han convertido en los más utilizados para aprendizaje o como proveedor de soluciones de algún problema específico. Los foros de discusión generan contenido de manera continua lo que produce un gran volumen de información, que puede ser utilizado como fuente de conocimiento para un sistema de Information Retrieval (IR). Las organizaciones actuales hacen cada vez más esfuerzos para reutilizar el conocimiento, definiendo estrategias para tener catalogadas y reutilizar soluciones ya probadas por lo que la disciplina de IR ha avanzado considerablemente. El objetivo fundamental de nuestro proyecto es definir una herramienta que, a partir de información contenida en hilos de foros de discusión técnicos, pueda descargar dicha información de manera automática, la pueda clasificar de acuerdo a temas específicos, así como también poder establecer un ranking de soluciones posibles, teniendo en cuenta además a los usuarios involucrados en dichos foros.Eje: Ingeniería de Software.Red de Universidades con Carreras en Informátic

    An Investigation of Digital Reference Interviews: A Dialogue Act Approach

    Get PDF
    The rapid increase of computer-mediated communications (CMCs) in various forms such as micro-blogging (e.g. Twitter), online chatting (e.g. digital reference) and community- based question-answering services (e.g. Yahoo! Answers) characterizes a recent trend in web technologies, often referred to as the social web. This trend highlights the importance of supporting linguistic interactions in people\u27s online information-seeking activities in daily life - something that the web search engines still lack because of the complexity of this hu- man behavior. The presented research consists of an investigation of the information-seeking behavior of digital reference services through analysis of discourse semantics, called dialogue acts, and experimentation of automatic identification of dialogue acts using machine-learning techniques. The data was an online chat reference transaction archive, provided by the Online Computing Library Center (OCLC). Findings of the discourse analysis include supporting evidence of some of the existing theories of the information-seeking behavior. They also suggest a new way of analyzing the progress of information-seeking interactions using dia- logue act analysis. The machine learning experimentation produced promising results and demonstrated the possibility of practical applications of the DA analysis for further research across disciplines

    Learning to Detect Conversation Focus of Threaded Discussions

    No full text
    In this paper we present a novel feature enriched approach that learns to detect the conversation focus of threaded discussions by combining NLP analysis and IR techniques. Using the graph-based algorithm HITS, we integrate different features such as lexical similarity, poster trustworthiness, and speech act analysis of human conversations with feature oriented link generation functions. It is the first quantitative study to analyze human conversation focus in the context of online discussions that takes into account heterogeneous sources of evidence. Experimental results using a threaded discussion corpus from an undergraduate class show that it achieves significant performance improvements compared with the baseline system.

    2006b. Learning to Detect Conversation Focus of Threaded Discussions

    No full text
    In this paper we present a novel featureenriched approach that learns to detect the conversation focus of threaded discussions by combining NLP analysis and IR techniques. Using the graph-based algorithm HITS, we integrate different features such as lexical similarity, poster trustworthiness, and speech act analysis of human conversations with featureoriented link generation functions. It is the first quantitative study to analyze human conversation focus in the context of online discussions that takes into account heterogeneous sources of evidence. Experimental results using a threaded discussion corpus from an undergraduate class show that it achieves significant performance improvements compared with the baseline system.

    XXI Workshop de Investigadores en Ciencias de la Computación - WICC 2019: libro de actas

    Get PDF
    Trabajos presentados en el XXI Workshop de Investigadores en Ciencias de la Computación (WICC), celebrado en la provincia de San Juan los días 25 y 26 de abril 2019, organizado por la Red de Universidades con Carreras en Informática (RedUNCI) y la Facultad de Ciencias Exactas, Físicas y Naturales de la Universidad Nacional de San Juan.Red de Universidades con Carreras en Informátic

    XXI Workshop de Investigadores en Ciencias de la Computación - WICC 2019: libro de actas

    Get PDF
    Trabajos presentados en el XXI Workshop de Investigadores en Ciencias de la Computación (WICC), celebrado en la provincia de San Juan los días 25 y 26 de abril 2019, organizado por la Red de Universidades con Carreras en Informática (RedUNCI) y la Facultad de Ciencias Exactas, Físicas y Naturales de la Universidad Nacional de San Juan.Red de Universidades con Carreras en Informátic
    corecore