Time Series data became broadly applied by the research community in the last decades after
a massive explosion of its availability. Nonetheless, this rise required an improvement
in the existing analysis techniques which, in the medical domain, would help specialists
to evaluate their patients condition. One of the key tasks in time series analysis is pattern
recognition (segmentation and classification). Traditional methods typically perform subsequence
matching, making use of a pattern template and a similarity metric to search
for similar sequences throughout time series. However, real-world data is noisy and variable
(morphological distortions), making a template-based exact matching an elementary
approach. Intending to increase flexibility and generalize the pattern searching tasks
across domains, this dissertation proposes two Deep Learning-based frameworks to solve
pattern segmentation and anomaly detection problems.
Regarding pattern segmentation, a Convolution/Deconvolution Neural Network is
proposed, learning to distinguish, point-by-point, desired sub-patterns from background
content within a time series. The proposed framework was validated in two use-cases:
electrocardiogram (ECG) and inertial sensor-based human activity (IMU) signals. It outperformed
two conventional matching techniques, being capable of notably detecting the
targeted cycles even in noise-corrupted or extremely distorted signals, without using any
reference template nor hand-coded similarity scores.
Concerning anomaly detection, the proposed unsupervised framework uses the reconstruction
ability of Variational Autoencoders and a local similarity score to identify
non-labeled abnormalities. The proposal was validated in two public ECG datasets (MITBIH
Arrhythmia and ECG5000), performing cardiac arrhythmia identification. Results
indicated competitiveness relative to recent techniques, achieving detection AUC scores
of 98.84% (ECG5000) and 93.32% (MIT-BIH Arrhythmia).Dados de séries temporais tornaram-se largamente aplicados pela comunidade científica
nas últimas decadas após um aumento massivo da sua disponibilidade. Contudo, este
aumento exigiu uma melhoria das atuais técnicas de análise que, no domínio clínico, auxiliaria
os especialistas na avaliação da condição dos seus pacientes. Um dos principais
tipos de análise em séries temporais é o reconhecimento de padrões (segmentação e classificação).
Métodos tradicionais assentam, tipicamente, em técnicas de correspondência em
subsequências, fazendo uso de um padrão de referência e uma métrica de similaridade
para procurar por subsequências similares ao longo de séries temporais. Todavia, dados
do mundo real são ruidosos e variáveis (morfologicamente), tornando uma correspondência
exata baseada num padrão de referência uma abordagem rudimentar. Pretendendo
aumentar a flexibilidade da análise de séries temporais e generalizar tarefas de procura
de padrões entre domínios, esta dissertação propõe duas abordagens baseadas em Deep
Learning para solucionar problemas de segmentação de padrões e deteção de anomalias.
Acerca da segmentação de padrões, a rede neuronal de Convolução/Deconvolução
proposta aprende a distinguir, ponto a ponto, sub-padrões pretendidos de conteúdo de
fundo numa série temporal. O modelo proposto foi validado em dois casos de uso: sinais
eletrocardiográficos (ECG) e de sensores inerciais em atividade humana (IMU). Este superou
duas técnicas convencionais, sendo capaz de detetar os ciclos-alvo notavelmente,
mesmo em sinais corrompidos por ruído ou extremamente distorcidos, sem o uso de
nenhum padrão de referência nem métricas de similaridade codificadas manualmente.
A respeito da deteção de anomalias, a técnica não supervisionada proposta usa a
capacidade de reconstrução dos Variational Autoencoders e uma métrica de similaridade
local para identificar anomalias desconhecidas. A proposta foi validada na identificação
de arritmias cardíacas em duas bases de dados públicas de ECG (MIT-BIH Arrhythmia e
ECG5000). Os resultados revelam competitividade face a técnicas recentes, alcançando
métricas AUC de deteção de 93.32% (MIT-BIH Arrhythmia) e 98.84% (ECG5000)