Time-series analysis based on machine learning for occupational risk evaluation in public administration

Abstract

Occupational diseases are currently a concerning problem for office workers, who spend long periods of time seated in static positions. Musculoskeletal disorders, specifically, have the highest prevalence among workers, contributing negatively by 17% to the Years Lived with Disability worldwide. This work is part of the PrevOccupAI project, which monitors office workers through wearable sensors and questionnaires, in order to provide them reports that bring to their attention some risk factors that can potentiate occupational diseases. During this work, a study with 40 subjects working in a real environment was carried out. After data pre-processing and synchronization, as it was only intended to analyze sitting data, the periods in which the participants were not seated were removed from the acquired signals. For this purpose, a machine learning model was developed, which uses features from the smartphone’s accelerometer signal to distinguish between sitting and walking. The best model reached an accuracy of 100.0%. Additionally, a model capable of partially predicting the participants’ answers to daily pain questionnaires was developed. Using the electromyography signals and personal information gathered from other questionnaires, it was possible to train a model that predicts if the subject reported pain or not, both at the beginning and end of the working day. Using the Random Forest algorithm, it was possible to achieve a mean accuracy of 86.3%. For each acquisition performed by the 40 participants, a relative ergonomic occupa- tional risk was assigned through variables that characterize postural variability. Using machine learning algorithms, models were trained to attempt to predict the modelled risk. A mean accuracy of 65.7% was achieved for the classification model, and a mean absolute error of 0.84 for the regression model.As doenças ocupacionais são, atualmente, um problema preocupante em trabalhadores de escritório, que passam muito tempo sentados em posições estáticas. As doenças muscu- loesqueléticas, especificamente, são as que têm maior prevalência entre os trabalhadores, contribuindo negativamente em 17% para os Anos Vividos com Incapacidade. Esta dissertação é parte do projeto PrevOccupAI, que monitoriza trabalhadores de escritório através de sensores e questionários, de forma a fornecer-lhes relatórios que cha- mem à sua atenção alguns dos fatores de risco que podem potenciar doenças ocupacionais. Durante este trabalho, foi realizado um estudo em 40 sujeitos a trabalhar em contexto real. Depois de pré-processamento e sincronização dos dados, como só se pretendia analisar dados de trabalhadores sentados, os períodos em que os participantes não estiveram sentados foram retirados dos sinais adquiridos. Para isso, foi desenvolvido um modelo de aprendizagem automática, que usa características do sinal do acelerómetro do telemóvel para distinguir entre sentado e a andar. O melhor modelo atingiu uma exatidão de 100,0%. Adicionalmente, foi desenvolvido um modelo capaz de prever parcialmente as respos- tas dos participantes a questionários diários de dor. Através dos sinais de eletromiografia e informação pessoal retirada de outros questionários, foi possível treinar um modelo que prevê se o sujeito reportou dor ou não, tanto no início como no fim do dia de trabalho. Utilizando o algoritmo de Floresta Aleatória, foi possível atingir uma exatidão média de 86,3%. A cada aquisição realizada pelos 40 participantes foi atribuído um risco ocupacional ergonómico relativo, através de variáveis que caracterizam a variabilidade postural. Uti- lizando algoritmos de aprendizagem automática, foram treinados modelos para tentar prever o risco modelado. Para o modelo de classificação, atingiu-se uma exatidão média de 65,7%, enquanto que para o modelo de regressão se conseguiu que o erro médio absoluto não ultrapassasse 0,84

    Similar works