University of Pernambuco - Engineering School/ Editorial System Journals
Not a member yet
    9038 research outputs found

    Software Engineering and Open Innovation: Collaboration between Industry, Academia, and Government

    No full text
    Collaboration between industry, academia, and government (IAC) has proven to be an effective model for promoting innovation, especially through open innovation. However, the integration of these sectors still faces challenges in its implementation, despite the numerous benefits it brings to all involved parties. This research analyzes the perceptions of undergraduate and graduate students involved in open innovation projects, focusing on the development of new products and Minimum Viable Products (MVPs) through Action Research (AR) in real-world projects. The study addresses the use of AR, turnover, and conflicts within software development teams, as well as the collaboration between industry and academia and perceptions of its application. The results show that, although the use of AR presented challenges for students, it led to positive outcomes, including the successful implementation of MVPs.Collaboration between industry, academia, and government (IAC) has proven to be an effective model for promoting innovation, especially through open innovation. However, the integration of these sectors still faces challenges in its implementation, despite the numerous benefits it brings to all involved parties. This research analyzes the perceptions of undergraduate and graduate students involved in open innovation projects, focusing on the development of new products and Minimum Viable Products (MVPs) through Action Research (AR) in real-world projects. The study addresses the use of AR, turnover, and conflicts within software development teams, as well as the collaboration between industry and academia and perceptions of its application. The results show that, although the use of AR presented challenges for students, it led to positive outcomes, including the successful implementation of MVPs

    Análise de Dados dos Estágios Obrigatórios da Escola Politécnica de Pernambuco (POLI)

    Get PDF
    This paper investigated the impact of mandatory internships on the academic performance of engineering students at the Polytechnic School of Pernambuco (POLI), applying data mining techniques, such as the K-Means algorithm, to identify patterns and associated variables. The analysis segmented students into clusters before and after the internship, enabling a detailed understanding of changes in performance, attendance, approvals, and ranking. The results demonstrated that the internship significantly influences academic trajectory, with some groups showing improvements and others facing challenges related to attendance and performance.Este artigo investigou o impacto do estágio obrigatório no desempenho acadêmico de alunos dos cursos de engenharia da Escola Politécnica de Pernambuco (POLI), aplicando técnicas de mineração de dados, como o algoritmo K-Means, para identificar padrões e variáveis associadas. A análise segmentou os estudantes em clusters antes e depois do estágio, possibilitando uma compreensão detalhada das mudanças no desempenho, frequência, aprovações e posicionamento no ranking. Os resultados demonstraram que o estágio influencia significativamente a trajetória acadêmica, com alguns grupos apresentando melhorias e outros enfrentando desafios relacionados à frequência e desempenho

    Análise de Séries Temporais de Acidentes nas Rodovias Federais de Pernambuco

    No full text
    The research on traffic accidents in Brazil, with an emphasis on federal highways in Pernambuco, aims to analyze and investigate accidents through data analysis. The central purpose is to predict future events on different types of lanes—single, double, and multiple—based on historical data from 2017 to February 2024. The study aims to support the development of strategies and inform metric-based decision-making, using an experimental protocol that utilizes data analysis techniques and models such as Isolated Forest, Prophet, and SARIMAX. Each step involves smoothing the data with moving average and median techniques to generate new metrics, identifying the best configuration for each lane type.A pesquisa sobre acidentes de trânsito no Brasil, com ênfase nas rodovias federais de Pernambuco, tem como objetivo analisar e investigar acidentes por meio de análise de dados. O propósito central é prever eventos futuros em diferentes tipos de pistas — simples, duplas e múltiplas — com base em dados históricos de 2017 até fevereiro de 2024. O estudo busca apoiar o desenvolvimento de estratégias e fundamentar a tomada de decisões baseadas em métricas, utilizando um protocolo experimental com o uso de técnicas e modelos de análise de dados, como Isolated Forest, Prophet e SARIMAX. Cada etapa envolve a suavização dos dados com técnicas de média e mediana móvel para gerar novas métricas, identificando a melhor configuração para cada tipo de pista

    Ciência de Dados em Pré-diagnóstico para Auxílio na Tomada de Decisões em Teleconsultas no CISAM

    No full text
    The overburdened healthcare systems and the difficulty of accessing care are global challenges. Telehealth, supported by Data Science, emerges as a viable solution, facilitating assistance. This work, developed in partnership with NUTES/CISAM, proposes an integrated Data Mining solution to optimize the flow of teleconsultations. The central objective is to develop a unified platform for the secure storage of patient data and the creation of a dashboard to support strategic decision-making. The methodology combined CRISP-DM for data flow and SCRUM/Kanban for project management. Data were extracted from heterogeneous sources (spreadsheets, medical records, and imaging exams) and centralized in a PostgreSQL database with MinIO. The main results are an interactive dashboard that reveals metrics and bottlenecks in care, and a web interface for exam management, aiming to improve the efficiency and assertiveness of medical decision-making.A sobrecarga dos sistemas de saúde e a dificuldade de acesso ao atendimento são desafios globais. A telessaúde, apoiada pela Ciência de Dados, surge como uma solução viável, facilitando a assistência. Este trabalho, desenvolvido em parceria com o NUTES/CISAM, propõe uma solução integrada de Mineração de Dados para otimizar o fluxo de teleconsultas. O objetivo central é desenvolver uma plataforma unificada para armazenamento seguro de dados de pacientes e a criação de um dashboard de apoio à decisão estratégica. A metodologia combinou o CRISP-DM, para o fluxo de dados, e o SCRUM/Kanban, para a gestão do projeto. Os dados foram extraídos de fontes heterogêneas (planilhas, prontuários e exames em imagem) e centralizados em um banco PostgreSQL com MinIO. Os resultados principais são um dashboard interativo, que revela métricas e gargalos do atendimento, e uma interface web para a gestão de exames, visando melhorar a eficiência e a assertividade da tomada de decisão médica

    A Data-Driven and Explainable Machine Learning Approach to Predict Prolonged Hospitalization in Brazilian SARS Patients

    No full text
    Severe Acute Respiratory Syndrome (SARS) continues to pose a substantial public health challenge in Brazil, with prolonged hospitalizations increasing pressure on healthcare resources. This study utilized Brazil’s national SIVEP-Gripe surveillance system, a comprehensive repository of anonymized, individual-level records for SARS cases including influenza and other respiratory viruses, to develop and evaluate machine learning models. Using data from 2024, we constructed a preprocessed dataset consisting of 64,238 hospitalized patient records. This dataset was built using 32 independent variables, all of which are available at the time of patient admission. The focus of this dataset is to predict prolonged hospital length of stay (PLOS > 7 days). Three ensemble tree-based algorithms—Random Forest, XGBoost, and CatBoost—were trained after data preprocessing and robust imputation, using stratified 5-fold cross-validation with AUC maximization. The models exhibited moderate but consistent predictive performance, with AUC values around 0.65. XGBoost achieved the best balance between sensitivity and specificity, while Random Forest achieved higher recall for prolonged-stay cases. Explainable AI analysis using SHAP values revealed asthma, age, oxygen saturation, and geographic region as the most influential predictors. These findings underscore the potential of explainable machine learning approaches to support early hospital resource planning using routinely collected surveillance data. Future research should incorporate dynamic and clinical progression variables to further enhance predictive performance and real-world applicability. Severe Acute Respiratory Syndrome (SARS) continues to pose a substantial public health challenge in Brazil, with prolonged hospitalizations increasing pressure on healthcare resources. This study utilized Brazil’s national SIVEP-Gripe surveillance system, a comprehensive repository of anonymized, individual-level records for SARS cases including influenza and other respiratory viruses, to develop and evaluate machine learning models. Using data from 2024, we constructed a preprocessed dataset consisting of 64,238 hospitalized patient records. This dataset was built using 32 independent variables, all of which are available at the time of patient admission. The focus of this dataset is to predict prolonged hospital length of stay (PLOS > 7 days). Three ensemble tree-based algorithms—Random Forest, XGBoost, and CatBoost—were trained after data preprocessing and robust imputation, using stratified 5-fold cross-validation with AUC maximization. The models exhibited moderate but consistent predictive performance, with AUC values around 0.65. XGBoost achieved the best balance between sensitivity and specificity, while Random Forest achieved higher recall for prolonged-stay cases. Explainable AI analysis using SHAP values revealed asthma, age, oxygen saturation, and geographic region as the most influential predictors. These findings underscore the potential of explainable machine learning approaches to support early hospital resource planning using routinely collected surveillance data. Future research should incorporate dynamic and clinical progression variables to further enhance predictive performance and real-world applicability.&nbsp

    Mineração de Dados para Auxiliar na Tomada de Decisões Estratégicas em Teleatendimentos do CISAM-UPE

    No full text
    This study aimed to enhance the quality of patient care at the Amaury de Medeiros University Health Center, part of the University of Pernambuco (CISAM-UPE). The initiative was based on analyzing patterns in historical telehealth data using Data Science tools and institution-defined parameters to support strategic decision-making, prioritizing care for patients in critical and urgent conditions. Initially, it was necessary to align business interests with data mining objectives and establish success criteria for the models to be developed. The CRISP-DM methodology (Cross Industry Standard Process for Data Mining) was selected as a guide for systematically executing data mining activities. As a result, models were created using specific data mining software and libraries. These models provide essential insights that enable the development of new care strategies, focusing on prioritizing the most critical and urgent cases.Este estudo teve como propósito aprimorar a qualidade do atendimento aos pacientes do Centro Universitário Integrado de Saúde Amaury de Medeiros da Universidade de Pernambuco (CISAM-UPE). A iniciativa foi baseada na análise de padrões presentes nos dados históricos de teleatendimento, com o uso de ferramentas de Ciência de Dados e parâmetros definidos pela instituição, para apoiar a tomada de decisões estratégicas, dando prioridade ao atendimento de pacientes em condições críticas e de urgência. Primeiramente, foi preciso alinhar os interesses do negócio com os objetivos da mineração de dados, além de definir critérios de sucesso para os modelos que seriam desenvolvidos. A metodologia CRISP-DM (Cross Industry Standard Process for Data Mining) foi escolhida como referência para a execução organizada das atividades de mineração de dados. Como resultado, modelos foram elaborados com o uso de softwares e bibliotecas específicos de mineração de dados. Esses modelos fornecem informações importantes que possibilitam o desenvolvimento de novas estratégias de atendimento, com foco na priorização dos casos mais críticos e urgentes

    Uso do Aprendizado de Máquina para Avaliar a Aplicação de Recursos na Assistência de Internação Hospitalar

    No full text
    The article addresses the use of machine learning to optimize resource allocation in Hospital Admission Assistance within Brazil’s Unified Health System (SUS), considering the management challenges posed by decentralization and demographic transitions. The main objective is To present a machine learning method to support managers in evaluating discrepancies between predictions and resource allocation in Hospital Admission Assistance. Data from Datasus (2022-2024) were preprocessed and used to train regression models, including Decision Tree, Random Forest, and MLP (Multi-Layer Perceptron), focusing on predicting average hospitalization costs per municipality. The MLP model stood out with the lowest errors (MAPE: 28.46% and MAE: 183.20). Results indicate that the model can support strategic decisions, enabling local and regional analyses for greater efficiency in public spending. It is concluded that the approach contributes to prioritizing resource allocations and suggests improvements in public policies based on artificial intelligence.O artigo aborda a utilização de aprendizado de máquina para otimizar a aplicação de recursos na Assistência de Internação Hospitalar no SUS, diante dos desafios de gestão impostos pela descentralização e transições demográficas. O objetivo principal é apresentar um método de aprendizagem de máquina que apoie os gestores na avaliação de divergências entre a predição e a aplicação de recursos na Assistência de Internação Hospitalar. Dados do Datasus (2022-2024) foram pré-processados e utilizados para treinar modelos de regressão, incluindo Decision Tree, Random Forest e MLP (Multi-Layer Perceptron), com foco na previsão de custos médios de internações por município. O MLP destacou-se com os menores erros (MAPE: 28,46% e MAE: 183,20). Os resultados indicam que o modelo pode apoiar decisões estratégicas, possibilitando análises locais e regionais para maior eficiência nos gastos públicos. Conclui-se que a abordagem contribui para priorizar alocações de recursos e sugere melhorias em políticas públicas baseadas em inteligência artificial

    Análise do Erro Humano nos Rótulos de Bases de Dados de Detecção de Objetos

    Get PDF
    Object detection is an important task in computer vision, applied in areas such as video surveillance, autonomous vehicles, and facial recognition. Advances in convolutional neural networks and deep learning have improved the accuracy of detection models, but the effectiveness of these systems depends on the quality of labeled datasets. Manual image annotation, especially in complex scenes with multiple objects, is a labor-intensive and error-prone process, which can compromise the performance of trained models. In this study, 30 participants conducted a labeling experiment, analyzing the influence of image complexity across three difficulty levels. Level 1 involved up to 4 objects, Level 2 from 4 to 10 objects, and Level 3 more than 10, with variations in the area occupied by each object and the classes represented. The results showed that increasing image complexity significantly raised the number of errors made, with variations in means and standard deviations. These findings highlight that discrepancies in manual labeling by different individuals can compromise the effectiveness of detection models.A detecção de objetos é uma tarefa importante em visão computacional, aplicada em áreas como vigilância por vídeo, veículos autônomos e reconhecimento facial. Avanços em redes neurais convolucionais e aprendizado profundo têm melhorado a precisão dos modelos de detecção, mas a eficácia desses sistemas depende da qualidade das bases de dados rotuladas. A anotação manual de imagens, especialmente em cenas complexas com múltiplos objetos, é um processo trabalhoso e suscetível a erros, o que pode comprometer o desempenho dos modelos treinados. Neste estudo, 30 participantes realizaram um experimento de rotulagem, analisando a influência da complexidade das imagens em três níveis de dificuldade. O Nível 1 envolvia até 4 objetos, o Nível 2 de 4 a 10 objetos, e o Nível 3 mais de 10, com variações na área ocupada por cada objeto e nas classes representadas. Os resultados mostraram que a complexidade crescente das imagens elevou significativamente o número de erros cometidos, com variações nas médias e desvios padrões. Esses resultados evidenciam que as discrepâncias na rotulagem manual de diferentes indivíduos podem comprometer a eficácia dos modelos de detecção

    Copilot Médico: Assistente Inteligente para Apoio ao Diagnóstico e Gestão de Pacientes

    No full text
    O presente trabalho tem como objetivo desenvolver uma ferramenta digital inovadora, o Copilot Médico, concebida como uma extensão de navegador para aprimorar significativamente o apoio ao diagnóstico e a gestão de informações de pacientes no contexto da saúde digital(WORLD HEALTH ORGANIZATION, 2023). A metodologia adotada focou na criação de um sistema interativo que permite aos profissionais de saúde interagir com um assistente inteligente, facilitando a organização e o acesso a dados clínicos de forma otimizada. Por meio de funcionalidades avançadas, a extensão possibilita a extração automatizada de informações relevantes diretamente de prontuários eletrônicos, utilizando seletores CSS para coletar dados estruturados e textuais(MINISTÉRIO DA SAÚDE, s.d.), e a análise aprofundada de documentos como PDFs, que são processados e interpretados por um sistema de Inteligência Artificial (IA) no backend. Este sistema foi construído sobre uma arquitetura robusta de cliente-servidor, onde o frontend(em React e TypeScript) gerencia a interface e a interação do usuário, enquanto o backend(em Python com Flask) orquestra a comunicação com modelos de IA e a persistência de dados em um sistema de arquitetura JSON.   Os resultados obtidos demonstram a capacidade do Copilot Médico de otimizar o fluxo de trabalho clínico, proporcionando um gerenciamento mais eficiente de históricos de pacientes e suas consultas, além de registrar e contextualizar as interações com a IA, criando um histórico conversacional persistente. A implementação bem-sucedida da extração de dados vitais e sessões de anamnese, que foram subsequentemente utilizados para enriquecer o contexto da IA. A funcionalidade de upload e processamento de PDFs foi validada, demonstrando a capacidade de extrair texto de documentos complexos e integrá-los ao fluxo de análise da IA. O sistema de IA otimizado para contextos médicos(OLIVEIRA; SANTOS, 2024), demonstrou capacidade de gerar respostas coerentes e relevantes, utilizando o histórico de chat e os resumos de consultas anteriores como base para um diálogo contínuo e contextualizado na busca e organização de informações, e uma melhoria percebida na qualidade do suporte à decisão clínica, conforme esperado para a ferramentas de apoio baseadas em IA(LI; CHEN,2021). Um estudo comparativo hipotético revelou que a utilização do Copilot Médico em consultas assistidas resultou em uma redução estimada de 30% no tempo de registro de informações e um aumento de 20% na completude dos dados do prontuário, em comparação com consultas não assistidas. Adicionalmente, a interação com a IA em um ambiente colaborativo (assistido) demonstrou ser 15% mais eficiente na resolução de dúvidas complexas do que a consulta a uma IA isolada, devido à contextualização e ao controle do profissional sobre o fluxo da informação (FERREIRA; GOMES, 2024).   As conclusões apontam que o Copilot Médico é uma solução promissora para modernizar a prática médica, ao centralizar informações dispersas e prover assistência inteligente em tempo real (SILVA; COSTA, 2023), o que contribui diretamente para maior eficiência operacional e potencializa a precisão diagnóstica, ao oferecer um suporte cognitivo à decisão médica. A estrutura modular e adaptável do projeto assegura sua escalabilidade e a possibilidade de  futuras expansões e integrações com sistemas de saúde eletrônicos mais complexos e bases de conhecimento médico.   Como trabalhos futuros, prevê-se a implementação de uma funcionalidade de transcrição inteligente ao vivo de áudios de consultas. Esta funcionalidade permitirá a coleta de informações faladas durante a interação médico-paciente, com a capacidade de separar e categorizar os dados coletados para incorporação automática ao prontuário eletrônico e ao contexto da IA. O objetivo é otimizar ainda mais o registro de informações, minimizando a necessidade de digitação manual e garantindo a completude e precisão dos dados

    Um Estudo Comparativo entre Modelos de NER para Documentos de Identidade e Notas Fiscais

    No full text
    Os modelos de Named Entity Recognition (NER) são aqueles que utilizam uma técnica de Natural Language Processing (NLP), onde palavras e termos segmentados, chamados de tokens, são identificados e categorizados em diferentes classes de sentidos semânticos. O objetivo do trabalho é investigar diferentes modelos conhecidos na literatura, aplicados a documentos de identificação pessoal e notas fiscais, a fim de concluir qual modelo melhor desempenha tarefas de extração e classificação de informações textuais e posicionais de imagens de documentos. Outra meta importante a qual o trabalho almeja contribuir é a de apontar possíveis fragilidades dos encontradas durante a pesquisa, sugerindo possíveis melhorias para trabalhos futuros. Foi realizada uma pesquisa experimental avaliando a performance de cada modelo de acordo com os conjuntos de entrada. A principal métrica utilizada para avaliação dos modelos foi o F1-Score, que consiste na média harmônica entre a proporção de verdadeiros positivos entre todos os verdadeiros e a proporção de verdadeiros positivos entre positivos reais, comumente utilizado em modelos de classificação. Durante a fase de treinamento, parte dos conjuntos de dados treinados são separados em trials, com cada conjunto tendo seu desempenho próprio. O trial que obteve a maior pontuação em F1-Score no conjunto de validação é selecionado como o de melhor desempenho para aquele modelo, sendo utilizado sua pontuação do conjunto de treinamento. Ademais, foram testados também versões artificialmente aumentadas dos conjuntos de dados mediante algoritmos de aumento de volume de dados, tendo eles seus resultados próprios. Dentre os 5 (cinco) modelos elencados para a pesquisa, 2 (dois) deles se destacaram e foram avaliados mais afundo, sendo eles o Language-independent Layout Transformer (LiLT) e o LayoutLMv3. Para estes modelos selecionados, para além da performance com seu conjunto de dados padrão, foi realizada também uma avaliação comparativa testando modelos treinados em dado conjunto em conjuntos diferentes de dados, com o propósito de estimar seu desempenho com dados diferentes de seu treinamento, provando sua capacidade de generalização. Por fim, pode-se chegar à conclusão de que os modelos apresentavam melhora de capacidade nos conjuntos com volume aumentados artificialmente, evidenciando que uma maior quantidade de dados aprimora a qualidade do treinamento, a custo de maior gasto computacional. Outra característica notável dos resultados é a disparidade de pontuação entre os modelos testados no seu conjunto de treinamento com as pontuações de teste em conjuntos diferentes, os quais apresentaram relevante queda de desempenho, indicando baixa generalização por parte dos modelos treinados. Apesar dos resultados alcançados terem sido abaixo do encontrado em seus benchmarks de cada modelo, foram próximos o bastante para concluir que houve convergência dos modelos. Evidentemente, o surgimento de novas arquiteturas para NER podem proporcionar melhores resultados para as tarefas propostas nesta pesquisa, levando à necessidade de realizar novas apurações para se comparar modelos mais recentes encontrados na literatura

    426

    full texts

    9,038

    metadata records
    Updated in last 30 days.
    University of Pernambuco - Engineering School/ Editorial System Journals is based in Brazil
    Access Repository Dashboard
    Do you manage Open Research Online? Become a CORE Member to access insider analytics, issue reports and manage access to outputs from your repository in the CORE Repository Dashboard! 👇