5 research outputs found
Aplicação de métodos de minimização do número de regras de associação que represente totalmente uma base de dados
Association rules are a form of knowledge representation used in decision making systems due to their simple structure and high information storage potential. This feature can be obtained through association rule mining algorithms, such as Apriori, which takes a dataset as an input parameter and returns a set of association rules. However, the existing algorithms return a large number of rules, which makes the use of association rules costly for computer systems and very hard to interpret for domain experts. In order to overcome this difficulty and facilitate the application of association rules in solving decision making problems, many researches have been searching for a computational solution to reduce the amount of association rules in such a way that there is no significant loss of information. This paper presents two computational procedures for minimizing the number of association rules that fully represent a dataset. Then, the authors present the tests performed and a comparative study with other methods in the literature. In view of the success achieved, the authors make their considerations about the results and point out the new direction of the project.As regras de associação são uma forma de representação de conhecimento utilizada em sistemas de tomada de decisão devido `a sua estrutura simples e ao alto potencial de armazenamento de informações. Esse recurso pode ser obtida através de algoritmos de mineração de regras de associação, como o Priori, que toma um conjunto de dados como parâmetro de entrada e retorna um conjunto de regras de associação. Entretanto, os algoritmos existentes retornam um grande n´úmero de regras, o que torna o uso de regras de associação oneroso para os sistemas de computador e muito difícil de interpretar para os especialistas de domínio. A fim de superar esta dificuldade e facilitar a aplicação das regras de associação na solução de problemas de tomada de decisão, muitas pesquisas tem procurado uma solução computacional para reduzir a quantidade de regras de associação de tal forma que não haja perda significativa de informações. Este trabalho apresenta dois procedimentos computacionais para minimizar o n´úmero de regras de associação que representam plenamente um conjunto de dados. Em seguida, os autores apresentam os testes realizados e um estudo comparativo com outros m´todos da literatura. Tendo em vista o sucesso alcançado, os autores fazem suas considerações sobre os resultados e apontam a nova direção do projeto
A SUPPORT TOOL TO IMPROVE COURSE CREDIT TRANSFER IN AN EDUCATION INSTITUTION
Processes of course transfer equivalencies should verify the compatibility or equivalence between these curricular components. In educational institutions, the teachers evaluate manually such decision processes with no type of technological support. In order to determine if the courses attended by the students in their institutions of origin can be accepted, the teachers make comparisons between the contents of both courses (attended and requested). Allied to this, the semiannual volume of these processes makes the analysis tedious, time-consuming, error-prone, and constantly challenged by stakeholders. Thus, this work purposes the development of a decision tool based on Natural Language Processing (NLP) techniques to aid in identifying the equivalence of disciplines through the analysis of their contents. The purpose of the decision tool is to support teachers during the evaluation of processes to take advantage of these curricular components. In order to evaluate the performance of the system, we constructed a dataset containing teacher evaluations in real processes of course equivalencies. This dataset was the gold standard (benchmark) for the computational tests. The metrics used in the tests for the evaluation of the proposed technique included AUROC curve, Accuracy and F-Measure.Los procesos de equivalencias de transferencia de cursos deben verificar la compatibilidad o equivalencia entre estos componentes curriculares. En las instituciones educativas, los docentes evalúan manualmente dichos procesos de decisión sin ningún tipo de soporte tecnológico. Para determinar si los cursos a los que asisten los estudiantes en sus instituciones de origen pueden ser aceptados, los docentes realizan comparaciones entre los contenidos de ambos cursos (cursados y solicitados). Aliado a esto, el volumen semestral de estos procesos hace que el análisis sea tedioso, lento, propenso a errores y constantemente desafiado por las partes interesadas. Así, este trabajo tiene como objetivo el desarrollo de una herramienta de decisión basada en técnicas de Procesamiento del Lenguaje Natural (PNL) que ayude a identificar la equivalencia de disciplinas a través del análisis de sus contenidos. El propósito de la herramienta de decisión es apoyar a los docentes durante la evaluación de procesos para aprovechar estos componentes curriculares. Para evaluar el desempeño del sistema, construimos un conjunto de datos que contiene las evaluaciones de los maestros en procesos reales de equivalencias de cursos. Este conjunto de datos fue el estándar de oro (punto de referencia) para las pruebas computacionales. Las métricas utilizadas en las pruebas para la evaluación de la técnica propuesta incluyeron curva AUROC, Precisión y Medida F.Os processos de equivalência de transferência de curso devem verificar a compatibilidade ou equivalência entre estes componentes curriculares. Nas instituições de ensino, os professores avaliam manualmente tais processos de decisão sem nenhum tipo de suporte tecnológico. Para determinar se os cursos frequentados pelos alunos nas suas instituições de origem podem ser aceites, os professores fazem comparações entre os conteúdos dos dois cursos (frequentados e solicitados). Aliado a isso, o volume semestral desses processos torna a análise tediosa, demorada, sujeita a erros e constantemente desafiada pelos stakeholders. Assim, este trabalho objetiva o desenvolvimento de uma ferramenta de decisão baseada em técnicas de Processamento de Linguagem Natural (PNL) para auxiliar na identificação da equivalência de disciplinas por meio da análise de seus conteúdos. O objetivo da ferramenta de decisão é apoiar os professores na avaliação dos processos de aproveitamento destes componentes curriculares. Para avaliar o desempenho do sistema, construímos um conjunto de dados contendo avaliações de professores em processos reais de equivalências de cursos. Este conjunto de dados foi o padrão ouro (benchmark) para os testes computacionais. As métricas utilizadas nos testes de avaliação da técnica proposta incluíram curva AUROC, Exatidão e F-Measure
MUDANÇAS NAS CARACTERÍSTICAS CLÍNICAS E LETALIDADE INTRA-HOSPITALAR DE PACIENTES COM ENDOCARDITE INFECCIOSA: ESTUDO DE QUATRO DÉCADAS
Introdução: Endocardite infecciosa é uma doença pouco frequente mas com elevado risco de complicações e morte. Objetivo: Descrever tendências temporais nas características clínicas e epidemiológicas de pacientes hospitalizados com endocardite infecciosa em um único centro de referência ao longo de quatro décadas. Métodos: Coorte de 1.804 episódios consecutivos de endocardite em pacientes (> 12 anos) internados em um hospital cardiológico, 1978-2022. O desfecho foi óbito intra-hospitalar. Foram estudados dados demográficos, comorbidades, condições predisponentes, microrganismos e complicações ao longo do tempo e por décadas (1978-1988, 1989-1999, 2000-2010, 2011-2022). Foi realizada uma análise de séries temporais, modelando cada ano usando uma função spline cúbica não-linear com 4 pontos de inflexão para permitir a análise de não-linearidades ao longo do tempo. As associações brutas de cada resultado com essa função não-linear dos anos foram analisadas e ajustadas para fatores de risco (idade, prótese valvar, S. aureus, evento embólico e abscesso perivalvar). Resultados: A maioria dos pacientes era do sexo masculino (64%). Verificou-se aumento da mediana de idade ao longo das décadas (29 a 57 anos; p < 0,001). Também se observou redução na frequência de cardiopatia reumática (14% para 6%; p < 0,001) assim como das infecções estreptocócicas (46% para 33%; p < 0,001). Houve um aumento progressivo de endocardite em prótese valvar, complicações associadas (abscesso perivalvar, insuficiência cardíaca descompensada, embolização) e infecções por estafilococos coagulase-negativos e MRSA ao longo do tempo. A mortalidade geral intra-hospitalar foi de 30%, com tendência ascendente ao longo das últimas três décadas (p = 0,022). No entanto, ao ajustar para fatores relacionados a pior prognóstico (idade, prótese, infecção por S. aureus, eventos embólicos e abscesso perivalvar), verificou-se uma diminuição nas mortes intra-hospitalares (p = 0,019), variando de 34% na primeira década estudada até 26% na última década. Conclusões: No período de 44 anos, ocorreram mudanças significativas nas características clínicas e epidemiológicas dos pacientes internados com endocardite. Apesar do aumento da idade média dos pacientes, do envolvimento de próteses valvares, das infecções por estafilococos coagulase negativos/MRSA e das complicações, foi observada uma redução progressiva na taxa de mortalidade ajustada aos fatores de risco ao longo das décadas analisadas
Changing trends in clinical characteristics and in-hospital mortality of patients with infective endocarditis over four decades
Background: Infective endocarditis continues to be a significant concern and may be undergoing an epidemiological transition. Methods: Were studied 1804 consecutive episodes of infective endocarditis between 1978 and 2022. The mean age was 48 ( ± 19), and 1162 (64%) patients were male. Temporal trends in demographic data, comorbidities, predisposing conditions, microorganisms, complications and in-hospital death have been studied over the decades (1978–1988, 1989–1999, 2000–2010 and 2011–2022). The outcomes and clinical characteristics were modeled using nonlinear cubic spline functions. Findings: Valve surgery was performed in 50% of the patients and overall in-hospital mortality was 30%. From the first to the fourth decade studied, the average age of patients increased from 29 to 57 years (p < 0.001), with significant declines in the occurrence of rheumatic valvular heart disease (15% to 6%; p < 0.001) and streptococcal infections (46% to 33%; p < 0.001). Healthcare-associated infections have increased (9% to 21%; p < 0.001), as have prosthetic valve endocarditis (26% to 53%; p < 0.001), coagulase-negative staphylococcal infections (4% to 11%; p < 0.001), and related-complications (heart failure, embolic events, and perivalvular abscess; p < 0.001). These changes were associated with a decline in adjusted in-hospital mortality from 34% to 25% (p = 0.019). Interpretation: In the 44 years studied, there was an increase in the mean age of patients, healthcare-related, prosthetic valve, coagulase-negative staphylococci/MRSA infections, and related complications. Notably, these epidemiological changes were associated with a decline in the adjusted in-hospital mortality
NEOTROPICAL ALIEN MAMMALS: a data set of occurrence and abundance of alien mammals in the Neotropics
Biological invasion is one of the main threats to native biodiversity. For a species to become invasive, it must be voluntarily or involuntarily introduced by humans into a nonnative habitat. Mammals were among first taxa to be introduced worldwide for game, meat, and labor, yet the number of species introduced in the Neotropics remains unknown. In this data set, we make available occurrence and abundance data on mammal species that (1) transposed a geographical barrier and (2) were voluntarily or involuntarily introduced by humans into the Neotropics. Our data set is composed of 73,738 historical and current georeferenced records on alien mammal species of which around 96% correspond to occurrence data on 77 species belonging to eight orders and 26 families. Data cover 26 continental countries in the Neotropics, ranging from Mexico and its frontier regions (southern Florida and coastal-central Florida in the southeast United States) to Argentina, Paraguay, Chile, and Uruguay, and the 13 countries of Caribbean islands. Our data set also includes neotropical species (e.g., Callithrix sp., Myocastor coypus, Nasua nasua) considered alien in particular areas of Neotropics. The most numerous species in terms of records are from Bos sp. (n = 37,782), Sus scrofa (n = 6,730), and Canis familiaris (n = 10,084); 17 species were represented by only one record (e.g., Syncerus caffer, Cervus timorensis, Cervus unicolor, Canis latrans). Primates have the highest number of species in the data set (n = 20 species), partly because of uncertainties regarding taxonomic identification of the genera Callithrix, which includes the species Callithrix aurita, Callithrix flaviceps, Callithrix geoffroyi, Callithrix jacchus, Callithrix kuhlii, Callithrix penicillata, and their hybrids. This unique data set will be a valuable source of information on invasion risk assessments, biodiversity redistribution and conservation-related research. There are no copyright restrictions. Please cite this data paper when using the data in publications. We also request that researchers and teachers inform us on how they are using the data