3 research outputs found

    Predicting multiple domain queue waiting time via machine learning

    Get PDF
    This paper describes an implementation of the Cross-Industry Standard Process for Data Mining (CRISP-DM) methodology for a demonstrative case of human queue waiting time prediction. We collaborated with a multiple domain (e.g., bank, pharmacies) ticket management service software development company, aiming to study a Machine Learning (ML) approach to estimate queue waiting time. A large multiple domain database was analyzed, which included millions of records related with two time periods (one year, for the modeling experiments; and two year, for a deployment simulation). The data was first preprocessed (including data cleaning and feature engineering tasks) and then modeled by exploring five state-of-the-art ML regression algorithms and four input attribute selections (including newly engineered features). Furthermore, the ML approaches were compared with the estimation method currently adopted by the analyzed company. The computational experiments assumed two main validation procedures, a standard cross-validation and a Rolling Window scheme. Overall, competitive and quality results were obtained by an Automated ML (AutoML) algorithm fed with newly engineered features. Indeed, the proposed AutoML model produces a small error (from 5 to 7 min), while requiring a reasonable computational effort. Finally, an eXplainable Artificial Intelligence (XAI) approach was applied to a trained AutoML model, demonstrating the extraction of useful explanatory knowledge for this domain.This work has been supported by FCT - Fundação para a Ciência e Tecnologia within the R &D Units Project Scope: UIDB/00319/2020 and the project “QOMPASS .: Solução de Gestão de Serviços de Atendimento multi-entidade, multi-serviço e multi-idioma” within the Project Scope NORTE-01-0247-FEDER-038462

    Extracting clinical knowledge from electronic medical records

    Get PDF
    As the adoption of Electronic Medical Records (EMRs) rises in the healthcare institutions, these resources’ importance increases due to all clinical information they contain about patients. However, the unstructured information in the form of clinical narratives present in these records makes it hard to extract and structure useful clinical knowledge. This unstructured information limits the potential of the EMRs because the clinical information these records contain can be used to perform essential tasks inside healthcare institutions such as searching, summarization, decision support and statistical analysis, as well as be used to support management decisions or serve for research. These tasks can only be done if the unstructured clinical information from the narratives is appropriately extracted, structured and processed in clinical knowledge. Usually, this information extraction and structuration in clinical knowledge is performed manually by healthcare practitioners, which is not efficient and is error-prone. This research aims to propose a solution to this problem, by using Machine Translation (MT) from the Portuguese language to the English language, Natural Language Processing (NLP) and Information Extraction (IE) techniques. With the help of these techniques, the goal is to develop a prototype pipeline modular system that can extract clinical knowledge from unstructured clinical information contained in Portuguese EMRs, in an automated way, in order to help EMRs to fulfil their potential and consequently help the Portuguese hospital involved in this research. This research also intends to show that this generic prototype system and approach can potentially be applied to other hospitals, even if they don’t use the Portuguese language.Com a adopção cada vez maior das instituições de saúde face aos Processos Clínicos Electrónicos (PCE), estes documentos ganham cada vez mais importância em contexto clínico, devido a toda a informação clínica que contêm relativamente aos pacientes. No entanto, a informação não estruturada na forma de narrativas clínicas presente nestes documentos electrónicos, faz com que seja difícil extrair e estruturar deles conhecimento clínico. Esta informação não estruturada limita o potencial dos PCE, uma vez que essa mesma informação, caso seja extraída e estruturada devidamente, pode servir para que as instituições de saúde possam efectuar actividades importantes com maior eficiência e sucesso, como por exemplo actividades de pesquisa, sumarização, apoio à decisão, análises estatísticas, suporte a decisões de gestão e de investigação. Este tipo de actividades apenas podem ser feitas com sucesso caso a informação clínica não estruturada presente nos PCE seja devidamente extraída, estruturada e processada em conhecimento clínico. Habitualmente, esta extração é realizada manualmente pelos profissionais médicos, o que não é eficiente e é susceptível a erros. Esta dissertação pretende então propôr uma solução para este problema, ao utilizar técnicas de Tradução Automática (TA) da língua portuguesa para a língua inglesa, Processamento de Linguagem Natural (PLN) e Extração de Informação (EI). O objectivo é desenvolver um sistema protótipo de módulos em série que utilize estas técnicas, possibilitando a extração de conhecimento clínico, de uma forma automática, de informação clínica não estruturada presente nos PCE de um hospital português. O principal objetivo é ajudar os PCE a atingirem todo o seu potencial em termos de conhecimento clínico que contêm e consequentemente ajudar o hospital português em questão envolvido nesta dissertação, demonstrando também que este sistema protótipo e esta abordagem podem potencialmente ser aplicados a outros hospitais, mesmo que não sejam de língua portuguesa

    Utilização do feedback para melhorar o desenvolvimento de produtos

    Get PDF
    Dissertação de Mestrado em Engenharia InformáticaAtualmente, a industria 4.0 está a revolucionar os processos e os produtos das organizações. A adoção de novas tecnologias permite um maior conhecimento interno, uma maior agilização de processos e personalização dos produtos. Com um maior foco nos consumidores, a revolução tem como objetivo a sua aproximação com a indústria. As organizações têm a necessidade de conhecer melhor os consumidores, identificar a sua personalidade, os seus comportamentos, necessidades, opiniões e preferências que podem contribuir para a melhoria dos processos de fabrico. Motivado pela quantidade de dados disponíveis online, a personalização é um fator diferenciador. Ao olhar para as organizações como Smart Environments, é possível melhorar o comportamento global de um sistema, fornecendo funcionalidades de alto nível. Em Smart Environments existe a necessidade de obtenção de conhecimento que possa ser utilizado no momento de interação com o mesmo. Esse conhecimento poderá ser obtido através de fontes externas, através da recolha de dados sobre os consumidores. A obtenção desse conhecimento permite às organizações conhecer melhor os seus consumidores, bem como utilizá-lo nos mais variados processos internos de tomada de decisão. Para a obtenção do conhecimento dos consumidores, é proposto um modelo de um sensor virtual inteligente capaz de recolher dados relativos aos consumidores que permitam identificar a sua personalidade, os seus comportamentos, necessidades, preferências e opiniões de forma a relacioná-los com a indústria. É utilizado um caso real que realça de que forma é que o conhecimento acerca dos consumidores pode ser utilizado nos processos internos de forma a melhorar a qualidade do produto final.Industry 4.0 is currently revolutionizing organizations’ processes and products. The adoption of new technologies allows greater internal knowledge, greater streamlining of processes and customization of products. With greater focus on consumers, the revolution aims to bring them closer to the industry. Organizations have the need to know consumers better, identify their personality, their behaviors, needs, opinions and preferences that can contribute to the improvement of manufacturing processes. Motivated by the amount of data available online, personalization is a differentiating factor. By looking at organizations like Smart Environments, it is possible to improve the overall behavior of a system by providing high level functionality. In Smart Environments there is a need to obtain knowledge that can be used when interacting with it. This knowledge can be obtained through external sources, through the collection of consumers data. By obtaining this knowledge organizations get to know their consumers better as well as to use it in the most varied internal decision-making processes. To obtain consumers’ knowledge, a model of an intelligent virtual sensor is proposed, capable of collecting data related to consumers, allowing them to identify their personality, their behaviors, needs, preferences and opinions in order to relate them to the industry. A real case is used that highlights how knowledge about consumers can be used in internal processes in order to improve the quality of the final product
    corecore