1,928 research outputs found
EEG-Based Emotion Recognition Using Regularized Graph Neural Networks
Electroencephalography (EEG) measures the neuronal activities in different
brain regions via electrodes. Many existing studies on EEG-based emotion
recognition do not fully exploit the topology of EEG channels. In this paper,
we propose a regularized graph neural network (RGNN) for EEG-based emotion
recognition. RGNN considers the biological topology among different brain
regions to capture both local and global relations among different EEG
channels. Specifically, we model the inter-channel relations in EEG signals via
an adjacency matrix in a graph neural network where the connection and
sparseness of the adjacency matrix are inspired by neuroscience theories of
human brain organization. In addition, we propose two regularizers, namely
node-wise domain adversarial training (NodeDAT) and emotion-aware distribution
learning (EmotionDL), to better handle cross-subject EEG variations and noisy
labels, respectively. Extensive experiments on two public datasets, SEED and
SEED-IV, demonstrate the superior performance of our model than
state-of-the-art models in most experimental settings. Moreover, ablation
studies show that the proposed adjacency matrix and two regularizers contribute
consistent and significant gain to the performance of our RGNN model. Finally,
investigations on the neuronal activities reveal important brain regions and
inter-channel relations for EEG-based emotion recognition
The effect of using multiple connectivity metrics in brain Functional Connectivity studies
Tese de mestrado integrado, Engenharia Biomédica e Biofísica (Sinais e Imagens Médicas) Universidade de Lisboa, Faculdade de Ciências, 2022Resting-state functional magnetic resonance imaging (rs-fMRI) has the potential to assist as a
diagnostic or prognostic tool for a diverse set of neurological and neuropsychiatric disorders, which are
often difficult to differentiate. fMRI focuses on the study of the brain functional Connectome, which is
characterized by the functional connections and neuronal activity among different brain regions, also
interpreted as communications between pairs of regions. This Functional Connectivity (FC) is quantified
through the statistical dependences between brain regions’ blood-oxygen-level-dependent (BOLD)
signals time-series, being traditionally evaluated by correlation coefficient metrics and represented as
FC matrices. However, several studies underlined limitations regarding the use of correlation metrics to
fully capture information from these signals, leading investigators towards different statistical metrics
that would fill those shortcomings. Recently, investigators have turned their attention to Deep Learning
(DL) models, outperforming traditional Machine Learning (ML) techniques due to their ability to
automatically extract relevant information from high-dimensional data, like FC data, using these models
with rs-fMRI data to improve diagnostic predictions, as well as to understand pathological patterns in
functional Connectome, that can lead to the discovery of new biomarkers. In spite of very encouraging
performances, the black-box nature of DL algorithms makes difficult to know which input information
led the model to a certain prediction, restricting its use in clinical settings.
The objective of this dissertation is to exploit the power of DL models, understanding how FC
matrices created from different statistical metrics can provide information about the brain FC, beyond
the conventionally used correlation family. Two publicly available datasets where studied, the ABIDE I dataset, composed by healthy and autism spectrum disease (ASD) individuals, and the ADHD-200
dataset, with typically developed controls and individuals with attention-deficit/hyperactive disorder
(ADHD). The computation of the FC matrices of both datasets, using different statistical metrics, was
performed in MATLAB using MULAN’s toolbox functions, encompassing the correlation coefficient,
non-linear correlation coefficient, mutual information, coherence and transfer entropy. The
classification of FC data was performed using two DL models, the improved ConnectomeCNN model
and the innovative ConnectomeCNN-Autoencoder model. Moreover, another goal is to study the effect
of a multi-metric approach in classification performances, combining multiple FC matrices computed
from the different statistical metrics used, as well as to study the use of Explainable Artificial
Intelligence (XAI) techniques, namely Layer-wise Relevance Propagation method (LRP), to surpass the
black-box problem of DL models used, in order to reveal the most important brain regions in ADHD.
The results show that the use of other statistical metrics to compute FC matrices can be a useful
complement to the traditional correlation metric methods for the classification between healthy subjects
and subjects diagnosed with ADHD and ASD. Namely, non-linear metrics like h2 and mutual
information, achieved similar and, in some cases, even slightly better performances than correlation
methods. The use of FC multi-metric, despite not showing improvements in classification performance
compared to the best individual method, presented promising results, namely the ability of this approach
to select the best features from all the FC matrices combined, achieving a similar performance in relation
to the best individual metric in each of the evaluation measures of the model, leading to a more complete
classification. The LRP analysis applied to ADHD-200 dataset proved to be promising, identifying brain
regions related to the pathophysiology of ADHD, which are in broad accordance with FC and structural
study’s findings.A ressonância magnética funcional em estado de repouso (rs-fMRI) tem o potencial de ser uma
ferramenta auxiliar de diagnóstico ou prognóstico para um conjunto diversificado de distúrbios
neurológicos e neuropsiquiátricos, que muitas vezes são difíceis de diferenciar. A análise de dados de
rs-fMRI recorre muitas vezes ao conceito de conectoma funcional do cérebro, que se caracteriza pelas
conexões funcionais entre as diferentes regiões do cérebro, sendo estas conexões interpretadas como
comunicações entre diferentes pares de regiões cerebrais. Esta conectividade funcional é quantificada
através de dependências estatísticas entre os sinais fMRI das regiões cerebrais, sendo estas
tradicionalmente calculadas através da métrica coeficiente de correlação, e representadas através de
matrizes de conectividade funcional. No entanto, vários estudos demonstraram limitações em relação ao
uso de métricas de correlação, em que estas não conseguem capturar por completo todas as informações
presentes nesses sinais, levando os investigadores à procura de diferentes métricas estatísticas que
pudessem preencher essas lacunas na obtenção de informações mais completas desses sinais.
O estudo destes distúrbios neurológicos e neuropsiquiátricos começou por se basear em técnicas
como mapeamento paramétrico estatístico, no contexto de estudos de fMRI baseados em tarefas. Porém,
essas técnicas apresentam certas limitações, nomeadamente a suposição de que cada região cerebral atua
de forma independente, o que não corresponde ao conhecimento atual sobre o funcionamento do cérebro.
O surgimento da rs-fMRI permitiu obter uma perspetiva mais global e deu origem a uma vasta literatura
sobre o efeito de patologias nos padrões de conetividade em repouso, incluindo tentativas de diagnóstico
automatizado com base em biomarcadores extraídos dos conectomas. Nos últimos anos, os
investigadores voltaram a sua atenção para técnicas de diferentes ramos de Inteligência Artificial, mais
propriamente para os algoritmos de Deep Learning (DL), uma vez que são capazes de superar os
algoritmos tradicionais de Machine Learning (ML), que foram aplicados a estes estudos numa fase
inicial, devido à sua capacidade de extrair automaticamente informações relevantes de dados de alta
dimensão, como é o caso dos dados de conectividade funcional. Esses modelos utilizam os dados obtidos
da rs-fMRI para melhorar as previsões de diagnóstico em relação às técnicas usadas atualmente em
termos de precisão e rapidez, bem como para compreender melhor os padrões patológicos nas conexões
funcionais destes distúrbios, podendo levar à descoberta de novos biomarcadores. Apesar do notável
desempenho destes modelos, a arquitetura natural em caixa-preta dos algoritmos de DL, torna difícil
saber quais as informações dos dados de entrada que levaram o modelo a executar uma determinada
previsão, podendo este utilizar informações erradas dos dados para alcançar uma dada inferência,
restringindo o seu uso em ambientes clínicos.
O objetivo desta dissertação, desenvolvida no Instituto de Biofísica e Engenharia Biomédica, é
explorar o poder dos modelos DL, de forma a avaliar até que ponto matrizes de conectividade funcional
criadas a partir de diferentes métricas estatísticas podem fornecer mais informações sobre a
conectividade funcional do cérebro, para além das métricas de correlação convencionalmente usadas
neste tipo de estudos. Foram estudados dois conjuntos de dados bastante utilizados em estudos de
Neurociência e que estão disponíveis publicamente: o conjunto de dados ABIDE-I, composto por
indivíduos saudáveis e indivíduos com doenças do espectro do autismo (ASD), e o conjunto de dados
ADHD-200, com controlos tipicamente desenvolvidos e indivíduos com transtorno do défice de atenção
e hiperatividade (ADHD).
Numa primeira fase foi realizada a computação das matrizes de conetividade funcional de ambos os
conjuntos de dados, usando as diferentes métricas estatísticas. Para isso, foi desenvolvido código de
MATLAB, onde se utilizam as séries temporais dos sinais BOLD obtidas dos dois conjuntos de dados
para criar essas mesmas matrizes de conectividade funcional, incorporando funções de diferentes
métricas estatísticas da caixa de ferramentas MULAN, compreendendo o coeficiente de correlação, o
coeficiente de correlação não linear, a informação mútua, a coerência e a entropia de transferência. De
seguida, a classificação dos dados de conectividade funcional, de forma a avaliar o efeito do uso de
diferentes métricas estatísticas para a criação de matrizes de conectividade funcional na discriminação
de sujeitos saudáveis e patológicos, foi realizada usando dois modelos de DL. O modelo
ConnectomeCNN melhorado e o modelo inovador ConnectomeCNN-Autoencoder foram desenvolvidos
com recurso à biblioteca de Redes Neuronais Keras, juntamente com o seu backend Tensorflow, ambos
em Python. Estes modelos, desenvolvidos previamente no Instituto de Biofísica e Engenharia
Biomédica, tiveram de ser otimizados de forma a obter a melhor performance, onde vários parâmetros
dos modelos e do respetivo treino dos mesmos foram testados para os dados a estudar. Pretendeu-se
também estudar o efeito de uma abordagem multi-métrica nas tarefas de classificação dos sujeitos de
ambos os conjuntos de dados, sendo que, para estudar essa abordagem as diferentes matrizes calculadas
a partir das diferentes métricas estatísticas utilizadas, foram combinadas, sendo usados os mesmos
modelos que foram aplicados às matrizes de conectividade funcional de cada métrica estatística
individualmente. É importante realçar que na abordagem multi-métrica também foi realizada a
otimização dos parâmetros dos modelos utilizados e do respetivo treino, de modo a conseguir a melhor
performance dos mesmos para estes dados. Para além destes dois objetivos, estudou-se o uso de técnicas
de Inteligência Artificial Explicável (XAI), mais especificamente o método Layer-wise Relevance
Propagation (LRP), com vista a superar o problema da caixa-preta dos modelos de DL, com a finalidade
de explicar como é que os modelos estão a utilizar os dados de entrada para realizar uma dada previsão.
O método LRP foi aplicado aos dois modelos utilizados anteriormente, usando como dados de entrada
o conjunto de dados ADHD-200, permitindo assim revelar quais as regiões cerebrais mais importantes
no que toca a um diagnóstico relacionado com o ADHD.
Os resultados obtidos mostram que o uso de outras métricas estatísticas para criar as matrizes de
Conectividade Funcional podem ser um complemento bastante útil às métricas estatísticas
tradicionalmente utilizadas para a classificação entre indivíduos saudáveis e indivíduos como ASD e
ADHD. Nomeadamente métricas estatísticas não lineares como o h2 e a informação mútua, obtiveram
desempenhos semelhantes e, em alguns casos, desempenhos ligeiramente melhores em relação aos
desempenhos obtidos por métodos de correlação, convencionalmente usados nestes estudos de
conectividade funcional. A utilização da multi-métrica de conectividade funcional, apesar de não
apresentar melhorias no desempenho geral da classificação em relação ao melhor método das matrizes
de conectividade funcional individuais do conjunto de métricas estatísticas abordadas, apresenta
resultados que justificam a exploração mais aprofundada deste tipo de abordagem, de forma a
compreender melhor a complementaridade das métricas e a melhor maneira de as utilizar. O uso do
método LRP aplicado ao conjunto de dados do ADHD-200 mostrou a sua aplicabilidade a este tipo de
estudos e a modelos de DL, identificando as regiões cerebrais mais relacionadas à fisiopatologia do
diagnóstico do ADHD que são compatíveis com o que é reportado por diversos estudos de conectividade
funcional e estudos de alterações estruturais associados a esta doença. O facto destas técnicas de XAI
demonstrarem como é que os modelos de DL estão a usar os dados de entrada para efetuar as previsões,
pode significar uma mais rápida e aceite adoção destes algoritmos em ambientes clínicos. Estas técnicas
podem auxiliar o diagnóstico e prognóstico destes distúrbios neurológicos e neuropsiquiátricos, que são
na maioria das vezes difíceis de diferenciar, permitindo aos médicos adquirirem um conhecimento em
relação à previsão realizada e poder explicar a mesma aos seus pacientes
Geometric deep learning: going beyond Euclidean data
Many scientific fields study data with an underlying structure that is a
non-Euclidean space. Some examples include social networks in computational
social sciences, sensor networks in communications, functional networks in
brain imaging, regulatory networks in genetics, and meshed surfaces in computer
graphics. In many applications, such geometric data are large and complex (in
the case of social networks, on the scale of billions), and are natural targets
for machine learning techniques. In particular, we would like to use deep
neural networks, which have recently proven to be powerful tools for a broad
range of problems from computer vision, natural language processing, and audio
analysis. However, these tools have been most successful on data with an
underlying Euclidean or grid-like structure, and in cases where the invariances
of these structures are built into networks used to model them. Geometric deep
learning is an umbrella term for emerging techniques attempting to generalize
(structured) deep neural models to non-Euclidean domains such as graphs and
manifolds. The purpose of this paper is to overview different examples of
geometric deep learning problems and present available solutions, key
difficulties, applications, and future research directions in this nascent
field
Dual Skipping Networks
Inspired by the recent neuroscience studies on the left-right asymmetry of
the human brain in processing low and high spatial frequency information, this
paper introduces a dual skipping network which carries out coarse-to-fine
object categorization. Such a network has two branches to simultaneously deal
with both coarse and fine-grained classification tasks. Specifically, we
propose a layer-skipping mechanism that learns a gating network to predict
which layers to skip in the testing stage. This layer-skipping mechanism endows
the network with good flexibility and capability in practice. Evaluations are
conducted on several widely used coarse-to-fine object categorization
benchmarks, and promising results are achieved by our proposed network model.Comment: CVPR 2018 (poster); fix typ
Graph Convolutional Network with Connectivity Uncertainty for EEG-based Emotion Recognition
Automatic emotion recognition based on multichannel Electroencephalography
(EEG) holds great potential in advancing human-computer interaction. However,
several significant challenges persist in existing research on algorithmic
emotion recognition. These challenges include the need for a robust model to
effectively learn discriminative node attributes over long paths, the
exploration of ambiguous topological information in EEG channels and effective
frequency bands, and the mapping between intrinsic data qualities and provided
labels. To address these challenges, this study introduces the
distribution-based uncertainty method to represent spatial dependencies and
temporal-spectral relativeness in EEG signals based on Graph Convolutional
Network (GCN) architecture that adaptively assigns weights to functional
aggregate node features, enabling effective long-path capturing while
mitigating over-smoothing phenomena. Moreover, the graph mixup technique is
employed to enhance latent connected edges and mitigate noisy label issues.
Furthermore, we integrate the uncertainty learning method with deep GCN weights
in a one-way learning fashion, termed Connectivity Uncertainty GCN (CU-GCN). We
evaluate our approach on two widely used datasets, namely SEED and SEEDIV, for
emotion recognition tasks. The experimental results demonstrate the superiority
of our methodology over previous methods, yielding positive and significant
improvements. Ablation studies confirm the substantial contributions of each
component to the overall performance.Comment: 10 page
- …