5 research outputs found
Assessment of the state of health by the measurement of a set of biophysiological signals
The dissertation studies the estimation of the degree of self-similarity and entropy of Shannon of several real electrocardiography (ECG) signals for healthy and non-healthy humans. The goal of the dissertation is to create a starting point algorithm which allows distinguishing between healthy and non-healthy subjects and can be used as a basis for further study of a diagnosis algorithm, necessarily more complex.
We used a novel Hurst parameter estimation algorithm based on the Embedded Branching Process, termed modified Embedded Branching Process algorithm. The algorithm for estimation of entropy was based on Shannon‟s entropy. Both algorithms were applied on the spatial distribution of ECG signals in a windowed manner.
The studied signals were retrieved from the Physionet website, where they are diagnosed as normal or as having certain pathologies.
The results presented for the Hurst parameter estimation allow us to confirm the results already published on the temporal self-similarity of ECG signals, this time for its spatial distribution. We also conclude that the non-self similar signals belong to non-healthy subjects.
The results obtained for entropy estimation on the spatial distribution of ECG signals also allowed a comparison between healthy and non-healthy systems. We obtained high entropy estimates both for healthy and non-healthy subjects; nevertheless, non-healthy subjects show higher variability of Shannon‟s entropy than healthy ones.A dissertação estuda a estimativa do grau de auto-semelhança e da entropia de Shannon de
vários sinais reais de electrocardiograma (ECG) obtidos em humanos saudáveis e não
saudáveis. O objectivo da dissertação é criar um algoritmo inicial que permita distinguir entre
indivíduos saudáveis e não saudáveis e que possa ser usado como base para o estudo de um
posterior algoritmo de diagnóstico, necessariamente mais complexo.
Utilizamos um algoritmo novo para estimativa do parâmetro de Hurst baseado no Embedded
Branching Process, denominado algoritmo modified Embedded Branching Process. A entropia
foi estimada através da entropia de Shannon. Ambos algoritmos foram aplicados sob a
distribuição espacial dos sinais ECG numa forma de janela.
Os sinais estudados foram retirados do website Physionet, onde estão diagnosticados como
normais ou possuindo uma determinada patologia.
Os resultados apresentados para a estimativa do parâmetro de Hurst permitem confirmar
resultados já publicados sobre a auto-semelhança temporal dos sinais ECG, desta vez para a
sua distribuição espacial. Também se concluí que os sinais não auto-semelhantes
correspondem a indivíduos não saudáveis.
Os resultados obtidos na estimativa da entropia para a distribuição espacial dos sinais de ECG
também permitiram uma comparação entre sistemas saudáveis e não saudáveis. Obtiveram-se
estimativas de entropia elevadas quer para indivíduos saudáveis quer para indivíduos não
saudáveis; no entanto, os indivíduos não saudáveis mostram uma maior variabilidade da
entropia de Shannon em relação aos saudáveis
Improvement of TestH: a C Library for Generating Self-Similar Series and for Estimating the Hurst Parameter
The discovery of consistent dependencies between values in certain data series paved the way
for the development of algorithms that could, somehow, classify the degree of self-similarity
between values and derive considerations about the behavior of these series. This self-similarity
metric is typically known as the Hurst Parameter, and allows the classification of the behavior of
a data series as persistent, anti-persistent, or purely random. This discovery was highly relevant
in the field of computer networks, inclusively helping companies to develop equipment and
infrastructure that suit their needs more efficiently. The Hurst Parameter is relevant in many
other fields, and it has been for exemple applied in the study of geologic phenomena [KTC07]
or even on areas related with health sciencies[VAJ08, HPS+12].
There are several algorithms for estimating the Hurst Parameter [Hur51, Hig88, RPGC06], and
each one of them has its strengths and weaknesses. The usage of these algorithms is sometimes
difficult, motivating the creation of tools or libraries that provide them in a more user-friendly
manner. Unfortunately, and despite of being an area that has been studied for decades, the
tools available have limitations and do not implement all algorithms available in the literature.
The work presented in this dissertation consists on the improvement of TestH, a library written in
ANSI C for the study of self-similarity in time series, which was initially developed by Fernandes
et al. [FNS+14]. These improvements are materialized as the addition of algorithms to estimate
the Hurst Parameter and to generate self-similar sequences. Additionally, auxiliary functions
were implemented, along with code refactoring, documentation of the application programming
interface and the creation of a website for the project.
This dissertation is mostly focused on the algorithms that were introduced in TestH, namely
the Periodogram, the Higuchi method, the Hurst Exponent by Autocorrelation Function and the
Detrended Fluctuation Analysis estimators, and the Davies and Hart method for generating selfsimilar
sequences. In order to turn TestH into a robust and trustable library, several tests were
performed comparing the results of these implementations with the values provided by similar
tools. The overall results obtained in these tests are in line with expectations and the algorithms
that are simultaneously implemented in TestH and in the other tools analyzed (for example, the
Periodogram) returned very similar results, corroborating the belief that the methods were well
implemented.A descoberta da dependência consistente entre valores em certas séries de dados, abriu caminho
para o desenvolvimento de algoritmos que permitissem, de alguma forma, classificar o
grau de auto-semelhança entre valores e tecer considerações sobre o comportamento da série.
A esta estatística dá-se o nome de Parâmetro de Hurst, que permite analisar e classificar o comportamento
de uma série de dados como persistente, antipersistente ou puramente aleatória.
Esta descoberta tem sido bastante relevante na área das redes de computadores, onde serve,
p.ex., de ajuda às empresas para desenvolverem equipamentos e infraestruturas adequadas às
suas necessidades. Para além do elevado interesse que a referida área apresentou por esta
métrica, existem outros campos ciêntificos onde algoritmos para estimar o Parâmetro de Hurst
de sequências de valores estão a ser aplicados, como por exemplo no estudo de fenómenos
geológicos [KTC07], bem como em fenómenos ligados às ciências da saúde [VAJ08, HPS+12].
Existem vários algoritmos para estimar o Parâmetro de Hurst [Hur51, Hig88, RPGC06], tendo
cada um deles as suas virtudes e fraquezas. A utilização destes algoritmos é por vezes difícil,
motivando a criação de ferramentas e bibliotecas que os congregam e disponibilizam de uma
forma mais amigável ao utilizador. Infelizmente, e apesar de ser uma área que está a ser alvo de
estudos há décadas, as ferramentas existentes, para além de não implementarem a totalidade
dos algoritmos mais relevantes, apresentam ainda algumas limitações. Desta forma, o trabalho
apresentado nesta dissertação consiste, principalmente, na melhoria da TestH, uma biblioteca
escrita em ANSI C para o estudo de séries temporais auto-semelhantes, inicialmente desenvolvida
por Fernandes et al. [FNS+14]. Estas melhorias materializam-se sobretudo na adição
de algoritmos para estimar o Parâmetro de Hurst e gerar séries de dados auto-semelhantes.
Adicionalmente foram introduzidas funções auxiliares, foi efetuada a refactorização do código,
documentação das interfaces de programação e ainda a criação de um sítio web para divulgação
do projeto.
Esta dissertação dá enfase aos algoritmos de estimação do Parâmetro de Hurst e geração de
séries auto-semelhantes. Relativamente à estimação, foram introduzidos na TestH, no âmbito
deste trabalho, o Periodograma, o método de Higuchi, a estimação através da função de autocorrelação
e o método de análise através da remoção das tendências. No que respeita à geração
de séries, foi também introduzido o método de Davies e Hart. Com o objetivo de tornar a TestH
robusta e credível, foram realizados vários testes, comparando os resultados destas implementações
com os valores fornecidos por ferramentas semelhantes. Os resultados obtidos estão alinhados
com o esperado e, inclusivamente, os algoritmos que se encontram implementados na
TestH e restantes ferramentas analisadas (como por exemplo, o Periodograma), apresentaram
valores bastante semelhantes entre si, corroborando a crença da correção da implementação
dos vários métodos