5 research outputs found

    Hypotheses, evidence and relationships: The HypER approach for representing scientific knowledge claims

    Get PDF
    Biological knowledge is increasingly represented as a collection of (entity-relationship-entity) triplets. These are queried, mined, appended to papers, and published. However, this representation ignores the argumentation contained within a paper and the relationships between hypotheses, claims and evidence put forth in the article. In this paper, we propose an alternate view of the research article as a network of 'hypotheses and evidence'. Our knowledge representation focuses on scientific discourse as a rhetorical activity, which leads to a different direction in the development of tools and processes for modeling this discourse. We propose to extract knowledge from the article to allow the construction of a system where a specific scientific claim is connected, through trails of meaningful relationships, to experimental evidence. We discuss some current efforts and future plans in this area

    Cosine Similarity for Article Section Classification: Using Structured Abstracts as a Proxy for an Annotated Corpus

    Get PDF
    During the last decade, the amount of research published in biomedical journals has grown significantly and at an accelerating rate. To fully explore all of this literature, new tools and techniques are needed for both information retrieval and processing. One such tool is the identification and extraction of key claims. In an e ort to work toward claim-extraction, we aim to identify the key areas in the body of the article referred to by text in the abstract. In this project, our work is preliminary to that goal in that we attempt to match specific clauses in the abstract with the section of the article body to which they refer. For our data, we use journal articles from PubMed with structured abstracts. Our technique is based on the cosine-measure of feature vectors using a bag-of-words approach. We refine our technique through the application of five di erent experimental variables: feature-weighting, word and bi-gram based feature-sets, text pre-processing, fixedexpression filtering, and di erent classifier heuristics. We found that the choice of classifier dominates all other considerations, and while their performance with feature-weighting is synergistic, other variables were found to have little or no e ffect

    Content and form in English business abstracts and research articles: a corpus-based genre approach

    Get PDF
    Se han escrito muchos trabajos sobre el resumen y el artículo de investigación, especialmente en los últimos veinte años, aunque pocos dedicados al estudio de estos géneros en el ámbito empresarial, y menos en lo que se refiere a su estructura y a la relación entre ambos. El objetivo principal de este estudio es precisamente incrementar la concienciación y conocimiento de la importancia de escribir buenos resúmenes y artículos de investigación en el ámbito de los negocios y cómo el resumen debe persuadir al lector para que lea el artículo. El artículo de investigación como género ha sido objeto de estudio durante mucho tiempo, siendo reconocido su importante papel en la diseminación del conocimiento científico. Sin embargo, pese a que los resúmenes son una herramienta indispensable para la selección de los artículos, poco se había escrito sobre este género hasta principios del siglo XX, cuando los académicos comenzaron a estudiar no solo su estructura sino también el contenido retórico de los resúmenes. Esta carencia de investigación sobre el resumen es particularmente notable en el área de los negocios. Los artículos y resúmenes seleccionados para el presente estudio basado en la lingüística del corpus provienen de cuatro revistas punteras del área de los negocios. Los textos fueron convertidos en documentos sin formato para su tratamiento informático a través del programa WordSmith Tools (Scott, 2009), lo cual requirió su etiquetado para su interpretación y contabilización, especialmente para los cálculos de la densidad léxica, número de palabras por frase, etc. Con el fin de analizar la estructura y contenido de los resúmenes, se aplicó el modelo de cinco movimientos (‘moves’) propuesto por Weissberg y Buker (1990). Debido a la idiosincrasia estructural de los artículos de los negocios, se empleó varios modelos existentes para el análisis de cada sección del artículo. Finalmente, para el estudio de las dimensiones interactiva e interaccional del metadiscurso, se empleó la propuesta hecha por Hyland (2005) para analizar el mensaje persuasivo de los textos y la implicación de los autores en los mismos. En este estudio se destaca la relación entre el resumen y la sección de la Introducción; ambos deben ser escritos de tal manera que constituyan el ‘mapa de ruta’ del artículo, cada uno con su propia función: el resumen para persuadir y la Introducción para guiar. Asimismo, los resultados obtenidos muestran una perspectiva irregular de la estructura IMRD debido principalmente a dos factores: secciones adicionales entremezcladas y solapamiento de unas con otras. Finalmente, se ofrece una estructura modificada para el artículo de investigación en el ámbito empresarial; este estudio contribuye con una propuesta de un nuevo modelo de estructura para los artículos de investigación con estructura IMRD con la inclusión de una nueva sección que contribuya a mejorar la comunicación escrita del profesional de los negocios. A partir de esta investigación, las implicaciones pedagógicas que se pueden extraer son varias: los dos géneros estudiados deberían ser introducidos en el currículo empresarial, puesto que la estructura del artículo también conduce a la comprensión de textos científicos; así se contribuye al aprendizaje de las estrategias comunicativas del ámbito de los negocios que son necesarias para futuros profesionales. Este trabajo tiene como fin ayudar a investigadores, estudiantes y cualquiera relacionado con el mundo empresarial a incrementar su conocimiento de los géneros escritos de su comunidad discursiva.Although many papers have been written on abstracts and research articles, especially in the last twenty years, very few of them have addressed these genres in their business perspective, and much less on their structure and on the relationship between the two. The general aim of this research is precisely to increase the awareness and knowledge of the importance of writing good abstracts and research articles in the business field and how one should persuasively lead into the other. Research papers as a genre have indeed been the target of applied linguists for a long time, recognizing their important role in the dissemination of knowledge. However, even though abstracts are an essential tool for the selection of texts, not enough had been written about this genre until the beginning of this century, when authors began to speak not only about structure but also about their rhetorical content. Furthermore, this lack of publications is particularly so in the area of business. The research articles and abstracts selected for this corpus-based study were taken from four prominent journals in the area of business, later tagged and interpreted through the WordSmith Tools software. In order to analyze the structure and content of the abstract, Weissberg and Buker’s (1990) five-move model was applied. Due to the structural idiosyncrasy of business papers, several models from the existing literature were employed for the analysis of their sections. Finally, through Hyland’s (2005) metadiscourse devices, this study explores the persuasive message of abstracts and research papers and the implication of authors in their texts. This investigation underscores the relationship between abstract and Introduction. They should be written in such a way as to constitute the ‘road map’ for the paper, each with a specific function in regard to readers: the abstract to persuade and the Introduction to guide. One of the relevant contributions of this study is the proposal of a new model for IMRD structured research papers as to contribute to the enhancement of the business professional’s identity. From the pedagogical point of view, there are a few suggestions that can be made: the two genres studied should be introduced in the business curriculum, since the structure of the article also leads to the comprehension of scientific texts. This will contribute to the learning of necessary business communicative strategies for future business professionals. This piece of work should help researchers, practitioners and anyone involved in the business field to increase their knowledge of the written genres of their discourse community
    corecore