23 research outputs found
Bilateral-ViT For Robust Fovea Localization
The fovea is an important anatomical landmark of the retina. Detecting the
location of the fovea is essential for the analysis of many retinal diseases.
However, robust fovea localization remains a challenging problem, as the fovea
region often appears fuzzy, and retina diseases may further obscure its
appearance. This paper proposes a novel Vision Transformer (ViT) approach that
integrates information both inside and outside the fovea region to achieve
robust fovea localization. Our proposed network, named
Bilateral-Vision-Transformer (Bilateral-ViT), consists of two network branches:
a transformer-based main network branch for integrating global context across
the entire fundus image and a vessel branch for explicitly incorporating the
structure of blood vessels. The encoded features from both network branches are
subsequently merged with a customized Multi-scale Feature Fusion (MFF) module.
Our comprehensive experiments demonstrate that the proposed approach is
significantly more robust for diseased images and establishes the new state of
the arts using the Messidor and PALM datasets.Comment: This work has been accepted for oral presentation by ISBI202
Computational Analysis of Fundus Images: Rule-Based and Scale-Space Models
Fundus images are one of the most important imaging examinations in modern ophthalmology
because they are simple, inexpensive and, above all, noninvasive.
Nowadays, the acquisition and
storage of highresolution
fundus images is relatively easy and fast. Therefore, fundus imaging
has become a fundamental investigation in retinal lesion detection, ocular health monitoring and
screening programmes. Given the large volume and clinical complexity associated with these images,
their analysis and interpretation by trained clinicians becomes a timeconsuming
task and is
prone to human error. Therefore, there is a growing interest in developing automated approaches
that are affordable and have high sensitivity and specificity. These automated approaches need to
be robust if they are to be used in the general population to diagnose and track retinal diseases. To
be effective, the automated systems must be able to recognize normal structures and distinguish
them from pathological clinical manifestations.
The main objective of the research leading to this thesis was to develop automated systems capable
of recognizing and segmenting retinal anatomical structures and retinal pathological clinical
manifestations associated with the most common retinal diseases. In particular, these automated
algorithms were developed on the premise of robustness and efficiency to deal with the difficulties
and complexity inherent in these images. Four objectives were considered in the analysis of
fundus images. Segmentation of exudates, localization of the optic disc, detection of the midline
of blood vessels, segmentation of the vascular network and detection of microaneurysms.
In addition, we also evaluated the detection of diabetic retinopathy on fundus images using the
microaneurysm detection method. An overview of the state of the art is presented to compare the
performance of the developed approaches with the main methods described in the literature for
each of the previously described objectives. To facilitate the comparison of methods, the state of
the art has been divided into rulebased
methods and machine learningbased
methods.
In the research reported in this paper, rulebased
methods based on image processing methods
were preferred over machine learningbased
methods. In particular, scalespace
methods proved
to be effective in achieving the set goals.
Two different approaches to exudate segmentation were developed. The first approach is based on
scalespace
curvature in combination with the local maximum of a scalespace
blob detector and
dynamic thresholds. The second approach is based on the analysis of the distribution function of
the maximum values of the noise map in combination with morphological operators and adaptive
thresholds. Both approaches perform a correct segmentation of the exudates and cope well with
the uneven illumination and contrast variations in the fundus images.
Optic disc localization was achieved using a new technique called cumulative sum fields, which was
combined with a vascular enhancement method. The algorithm proved to be reliable and efficient,
especially for pathological images. The robustness of the method was tested on 8 datasets.
The detection of the midline of the blood vessels was achieved using a modified corner detector
in combination with binary philtres and dynamic thresholding. Segmentation of the vascular network
was achieved using a new scalespace
blood vessels enhancement method. The developed
methods have proven effective in detecting the midline of blood vessels and segmenting vascular
networks.
The microaneurysm detection method relies on a scalespace
microaneurysm detection and labelling
system. A new approach based on the neighbourhood of the microaneurysms was used
for labelling. Microaneurysm detection enabled the assessment of diabetic retinopathy detection.
The microaneurysm detection method proved to be competitive with other methods, especially with highresolution
images. Diabetic retinopathy detection with the developed microaneurysm
detection method showed similar performance to other methods and human experts.
The results of this work show that it is possible to develop reliable and robust scalespace
methods
that can detect various anatomical structures and pathological features of the retina. Furthermore,
the results obtained in this work show that although recent research has focused on machine learning
methods, scalespace
methods can achieve very competitive results and typically have greater
independence from image acquisition. The methods developed in this work may also be relevant
for the future definition of new descriptors and features that can significantly improve the results
of automated methods.As imagens do fundo do olho são hoje um dos principais exames imagiológicos da oftalmologia
moderna, pela sua simplicidade, baixo custo e acima de tudo pelo seu carácter nãoinvasivo.
A
aquisição e armazenamento de imagens do fundo do olho com alta resolução é também relativamente
simples e rápida. Desta forma, as imagens do fundo do olho são um exame fundamental
na identificação de alterações retinianas, monitorização da saúde ocular, e em programas de rastreio.
Considerando o elevado volume e complexidade clínica associada a estas imagens, a análise
e interpretação das mesmas por clínicos treinados tornase
uma tarefa morosa e propensa a erros
humanos. Assim, há um interesse crescente no desenvolvimento de abordagens automatizadas,
acessíveis em custo, e com uma alta sensibilidade e especificidade. Estas devem ser robustas para
serem aplicadas à população em geral no diagnóstico e seguimento de doenças retinianas. Para
serem eficazes, os sistemas de análise têm que conseguir detetar e distinguir estruturas normais
de sinais patológicos.
O objetivo principal da investigação que levou a esta tese de doutoramento é o desenvolvimento
de sistemas automáticos capazes de detetar e segmentar as estruturas anatómicas da retina, e os
sinais patológicos retinianos associados às doenças retinianas mais comuns. Em particular, estes
algoritmos automatizados foram desenvolvidos segundo as premissas de robustez e eficácia para
lidar com as dificuldades e complexidades inerentes a estas imagens.
Foram considerados quatro objetivos de análise de imagens do fundo do olho. São estes, a segmentação
de exsudados, a localização do disco ótico, a deteção da linha central venosa dos vasos
sanguíneos e segmentação da rede vascular, e a deteção de microaneurismas. De acrescentar que
usando o método de deteção de microaneurismas, avaliouse
também a capacidade de deteção da
retinopatia diabética em imagens do fundo do olho.
Para comparar o desempenho das metodologias desenvolvidas neste trabalho, foi realizado um
levantamento do estado da arte, onde foram considerados os métodos mais relevantes descritos na
literatura para cada um dos objetivos descritos anteriormente. Para facilitar a comparação entre
métodos, o estado da arte foi dividido em metodologias de processamento de imagem e baseadas
em aprendizagem máquina.
Optouse
no trabalho de investigação desenvolvido pela utilização de metodologias de análise espacial
de imagem em detrimento de metodologias baseadas em aprendizagem máquina. Em particular,
as metodologias baseadas no espaço de escalas mostraram ser efetivas na obtenção dos
objetivos estabelecidos.
Para a segmentação de exsudados foram usadas duas abordagens distintas. A primeira abordagem
baseiase
na curvatura em espaço de escalas em conjunto com a resposta máxima local de um detetor
de manchas em espaço de escalas e limiares dinâmicos. A segunda abordagem baseiase
na
análise do mapa de distribuição de ruído em conjunto com operadores morfológicos e limiares
adaptativos. Ambas as abordagens fazem uma segmentação dos exsudados de elevada precisão,
além de lidarem eficazmente com a iluminação nãouniforme
e a variação de contraste presente
nas imagens do fundo do olho. A localização do disco ótico foi conseguida com uma nova técnica
designada por campos de soma acumulativos, combinada com métodos de melhoramento da rede
vascular. O algoritmo revela ser fiável e eficiente, particularmente em imagens patológicas. A robustez
do método foi verificada pela sua avaliação em oito bases de dados. A deteção da linha central
dos vasos sanguíneos foi obtida através de um detetor de cantos modificado em conjunto com
filtros binários e limiares dinâmicos. A segmentação da rede vascular foi conseguida com um novo
método de melhoramento de vasos sanguíneos em espaço de escalas. Os métodos desenvolvidos mostraram ser eficazes na deteção da linha central dos vasos sanguíneos e na segmentação da rede
vascular. Finalmente, o método para a deteção de microaneurismas assenta num formalismo de
espaço de escalas na deteção e na rotulagem dos microaneurismas. Para a rotulagem foi utilizada
uma nova abordagem da vizinhança dos candidatos a microaneurismas. A deteção de microaneurismas
permitiu avaliar também a deteção da retinopatia diabética. O método para a deteção
de microaneurismas mostrou ser competitivo quando comparado com outros métodos, em particular
em imagens de alta resolução. A deteção da retinopatia diabética exibiu um desempenho
semelhante a outros métodos e a especialistas humanos.
Os trabalhos descritos nesta tese mostram ser possível desenvolver uma abordagem fiável e robusta
em espaço de escalas capaz de detetar diferentes estruturas anatómicas e sinais patológicos
da retina.
Além disso, os resultados obtidos mostram que apesar de a pesquisa mais recente concentrarse
em metodologias de aprendizagem máquina, as metodologias de análise espacial apresentam
resultados muito competitivos e tipicamente independentes do equipamento de aquisição das imagens.
As metodologias desenvolvidas nesta tese podem ser importantes na definição de novos
descritores e características, que podem melhorar significativamente o resultado de métodos automatizados
Caracterización del Edema Macular Diabético mediante análisis automático de Tomografías de Coherencia Óptica
Programa Oficial de Doctorado en Computación. 5009V01[Abstract] Diabetic Macular Edema (DME) is one of the most important complications of
diabetes and a leading cause of preventable blindness in the developed countries.
Among the di erent image modalities, Optical Coherence Tomography (OCT) is
a non-invasive, cross-sectional and high-resolution imaging technique that is commonly
used for the analysis and interpretation of many retinal structures and ocular
disorders. In this way, the development of Computer-Aided Diagnosis (CAD) systems
has become relevant over the recent years, facilitating and simplifying the work
of the clinical specialists in many relevant diagnostic processes, replacing manual
procedures that are tedious and highly time-consuming.
This thesis proposes a complete methodology for the identi cation and characterization
of DMEs using OCT images. To do so, the system combines and exploits
di erent clinical knowledge with image processing and machine learning strategies.
This automatic system is able to identify and characterize the main retinal structures
and several pathological conditions that are associated with the DME disease, following
the clinical classi cation of reference in the ophthalmological eld. Despite
the complexity and heterogeneity of this relevant ocular pathology, the proposed
system achieved satisfactory results, proving to be robust enough to be used in the
daily clinical practice, helping the clinicians to produce a more accurate diagnosis
and indicate adequate treatments[Resumen] El Edema Macular Diabético (EMD) es una de las complicaciones más importantes
de la diabetes y una de las principales causas de ceguera prevenible en los países
desarrollados. Entre las diferentes modalidades de imagen, la Tomografía de Coherencia
Óptica (TCO) es una técnica de imagen no invasiva, transversal y de alta
resolución que se usa comúnmente para el análisis e interpretación de múltiples
estructuras retinianas y trastornos oculares. De esta manera, el desarrollo de los
sistemas de Diagnóstico Asistido por Ordenador (DAO) se ha vuelto relevante en
los últimos años, facilitando y simplificando el trabajo de los especialistas clínicos
en muchos procesos diagnósticos relevantes, reemplazando procedimientos manuales
que son tediosos y requieren mucho tiempo.
Esta tesis propone una metodología completa para la identificación y caracterización
de EMDs utilizando imágenes TCO. Para ello, el sistema desarrollado combina
y explota diferentes conocimientos clínicos con estrategias de procesamiento
de imágenes y aprendizaje automático. Este sistema automático es capaz de identificar y caracterizar las principales estructuras retinianas y diferentes afecciones
patológicas asociadas con el EMD, siguiendo la clasificación clínica de referencia
en el campo oftalmológico. A pesar de la complejidad de esta relevante patología
ocular, el sistema propuesto logró resultados satisfactorios, demostrando ser lo sufi
cientemente robusto como para ser usado en la práctica clínica diaria, ayudando a
los médicos a producir diagnósticos más precisos y tratamientos más adecuados.[Resumo] O Edema Macular Diabético ( EMD) é unha das complicacións máis importantes da diabetes e unha das principais causas de cegueira prevenible nos países desenvoltos. Entre as diferentes modalidades de imaxe, a Tomografía de Coherencia Óptica ( TCO) é unha técnica de imaxe non invasiva, transversal e de alta resolución que se usa comunmente para a análise e interpretación de múltiples estruturas retinianas e trastornos oculares. Desta maneira, o desenvolvemento dos sistemas de Diagnóstico Asistido por Computador ( DAO) volveuse relevante nos últimos anos, facilitando e simplificando o traballo dos especialistas clínicos en moitos procesos diagnósticos relevantes, substituíndo procedementos manuais que son tediosos e requiren moito tempo. Esta tese propón unha metodoloxía completa para a identificación e caracterización de EMDs utilizando imaxes TCO. Para iso, o sistema desenvolto combina e explota diferentes coñecementos clínicos con estratexias de procesamento de imaxes e aprendizaxe automático. Este sistema automático é capaz de identificar e caracterizar as principais estruturas retinianas e diferentes afeccións patolóxicas asociadas co EMD, seguindo a clasificación clínica de referencia no campo oftalmolóxico. A pesar da complexidade desta relevante patoloxía ocular, o sistema proposto logrou resultados satisfactorios, demostrando ser o sufi cientemente robusto como para ser usado na práctica clínica diaria, axudando aos médicos para producir diagnósticos máis precisos e tratamentos máis adecuados
Handbook of Vascular Biometrics
This open access handbook provides the first comprehensive overview of biometrics exploiting the shape of human blood vessels for biometric recognition, i.e. vascular biometrics, including finger vein recognition, hand/palm vein recognition, retina recognition, and sclera recognition. After an introductory chapter summarizing the state of the art in and availability of commercial systems and open datasets/open source software, individual chapters focus on specific aspects of one of the biometric modalities, including questions of usability, security, and privacy. The book features contributions from both academia and major industrial manufacturers
Data efficient deep learning for medical image analysis: A survey
The rapid evolution of deep learning has significantly advanced the field of
medical image analysis. However, despite these achievements, the further
enhancement of deep learning models for medical image analysis faces a
significant challenge due to the scarcity of large, well-annotated datasets. To
address this issue, recent years have witnessed a growing emphasis on the
development of data-efficient deep learning methods. This paper conducts a
thorough review of data-efficient deep learning methods for medical image
analysis. To this end, we categorize these methods based on the level of
supervision they rely on, encompassing categories such as no supervision,
inexact supervision, incomplete supervision, inaccurate supervision, and only
limited supervision. We further divide these categories into finer
subcategories. For example, we categorize inexact supervision into multiple
instance learning and learning with weak annotations. Similarly, we categorize
incomplete supervision into semi-supervised learning, active learning, and
domain-adaptive learning and so on. Furthermore, we systematically summarize
commonly used datasets for data efficient deep learning in medical image
analysis and investigate future research directions to conclude this survey.Comment: Under Revie
Object Recognition
Vision-based object recognition tasks are very familiar in our everyday activities, such as driving our car in the correct lane. We do these tasks effortlessly in real-time. In the last decades, with the advancement of computer technology, researchers and application developers are trying to mimic the human's capability of visually recognising. Such capability will allow machine to free human from boring or dangerous jobs