191 research outputs found
Development of a Surgical Assistance System for Guiding Transcatheter Aortic Valve Implantation
Development of image-guided interventional systems is growing up rapidly in the recent years. These new systems become an essential part of the modern minimally invasive surgical procedures, especially for the cardiac surgery. Transcatheter aortic valve implantation (TAVI) is a recently developed surgical technique to treat severe aortic valve stenosis in elderly and high-risk patients. The placement of stented aortic valve prosthesis is crucial and typically performed under live 2D fluoroscopy guidance. To assist the placement of the prosthesis during the surgical procedure, a new fluoroscopy-based TAVI assistance system has been developed.
The developed assistance system integrates a 3D geometrical aortic mesh model and anatomical valve landmarks with live 2D fluoroscopic images. The 3D aortic mesh model and landmarks are reconstructed from interventional angiographic and fluoroscopic C-arm CT system, and a target area of valve implantation is automatically estimated using these aortic mesh models. Based on template-based tracking approach, the overlay of visualized 3D aortic mesh model, landmarks and target area of implantation onto fluoroscopic images is updated by approximating the aortic root motion from a pigtail catheter motion without contrast agent. A rigid intensity-based registration method is also used to track continuously the aortic root motion in the presence of contrast agent. Moreover, the aortic valve prosthesis is tracked in fluoroscopic images to guide the surgeon to perform the appropriate placement of prosthesis into the estimated target area of implantation. An interactive graphical user interface for the surgeon is developed to initialize the system algorithms, control the visualization view of the guidance results, and correct manually overlay errors if needed.
Retrospective experiments were carried out on several patient datasets from the clinical routine of the TAVI in a hybrid operating room. The maximum displacement errors were small for both the dynamic overlay of aortic mesh models and tracking the prosthesis, and within the clinically accepted ranges. High success rates of the developed assistance system were obtained for all tested patient datasets.
The results show that the developed surgical assistance system provides a helpful tool for the surgeon by automatically defining the desired placement position of the prosthesis during the surgical procedure of the TAVI.Die Entwicklung bildgeführter interventioneller Systeme wächst rasant in den letzten Jahren. Diese neuen Systeme werden zunehmend ein wesentlicher Bestandteil der technischen Ausstattung bei modernen minimal-invasiven chirurgischen Eingriffen. Diese Entwicklung gilt besonders für die Herzchirurgie. Transkatheter Aortenklappen-Implantation (TAKI) ist eine neue entwickelte Operationstechnik zur Behandlung der schweren Aortenklappen-Stenose bei alten und Hochrisiko-Patienten. Die Platzierung der Aortenklappenprothese ist entscheidend und wird in der Regel unter live-2D-fluoroskopischen Bildgebung durchgeführt. Zur Unterstützung der Platzierung der Prothese während des chirurgischen Eingriffs wurde in dieser Arbeit ein neues Fluoroskopie-basiertes TAKI Assistenzsystem entwickelt.
Das entwickelte Assistenzsystem überlagert eine 3D-Geometrie des Aorten-Netzmodells und anatomischen Landmarken auf live-2D-fluoroskopische Bilder. Das 3D-Aorten-Netzmodell und die Landmarken werden auf Basis der interventionellen Angiographie und Fluoroskopie mittels eines C-Arm-CT-Systems rekonstruiert. Unter Verwendung dieser Aorten-Netzmodelle wird das Zielgebiet der Klappen-Implantation automatisch geschätzt. Mit Hilfe eines auf Template Matching basierenden Tracking-Ansatzes wird die Überlagerung des visualisierten 3D-Aorten-Netzmodells, der berechneten Landmarken und der Zielbereich der Implantation auf fluoroskopischen Bildern korrekt überlagert. Eine kompensation der Aortenwurzelbewegung erfolgt durch Bewegungsverfolgung eines Pigtail-Katheters in Bildsequenzen ohne Kontrastmittel. Eine starrere Intensitätsbasierte Registrierungsmethode wurde verwendet, um kontinuierlich die Aortenwurzelbewegung in Bildsequenzen mit Kontrastmittelgabe zu detektieren. Die Aortenklappenprothese wird in die fluoroskopischen Bilder eingeblendet und dient dem Chirurg als Leitfaden für die richtige Platzierung der realen Prothese. Eine interaktive Benutzerschnittstelle für den Chirurg wurde zur Initialisierung der Systemsalgorithmen, zur Steuerung der Visualisierung und für manuelle Korrektur eventueller Überlagerungsfehler entwickelt.
Retrospektive Experimente wurden an mehreren Patienten-Datensätze aus der klinischen Routine der TAKI in einem Hybrid-OP durchgeführt. Hohe Erfolgsraten des entwickelten Assistenzsystems wurden für alle getesteten Patienten-Datensätze erzielt.
Die Ergebnisse zeigen, dass das entwickelte chirurgische Assistenzsystem ein hilfreiches Werkzeug für den Chirurg bei der Platzierung Position der Prothese während des chirurgischen Eingriffs der TAKI bietet
Fast catheter segmentation and tracking based on x-ray fluoroscopic and echocardiographic modalities for catheter-based cardiac minimally invasive interventions
X-ray fluoroscopy and echocardiography imaging (ultrasound, US) are two imaging modalities that are widely used in cardiac catheterization. For these modalities, a fast, accurate and stable algorithm for the detection and tracking of catheters is required to allow clinicians to observe the catheter location in real-time. Currently X-ray fluoroscopy is routinely used as the standard modality in catheter ablation interventions. However, it lacks the ability to visualize soft tissue and uses harmful radiation. US does not have these limitations but often contains acoustic artifacts and has a small field of view. These make the detection and tracking of the catheter in US very challenging.
The first contribution in this thesis is a framework which combines Kalman filter and discrete optimization for multiple catheter segmentation and tracking in X-ray images. Kalman filter is used to identify the whole catheter from a single point detected on the catheter in the first frame of a sequence of x-ray images. An energy-based formulation is developed that can be used to track the catheters in the following frames. We also propose a discrete optimization for minimizing the energy function in each frame of the X-ray image sequence. Our approach is robust to tangential motion of the catheter and combines the tubular and salient feature measurements into a single robust and efficient framework.
The second contribution is an algorithm for catheter extraction in 3D ultrasound images based on (a) the registration between the X-ray and ultrasound images and (b) the segmentation of the catheter in X-ray images. The search space for the catheter extraction in the ultrasound images is constrained to lie on or close to a curved surface in the ultrasound volume. The curved surface corresponds to the back-projection of the extracted catheter from the X-ray image to the ultrasound volume. Blob-like features are detected in the US images and organized in a graphical model. The extracted catheter is modelled as the optimal path in this graphical model.
Both contributions allow the use of ultrasound imaging for the improved visualization of soft tissue. However, X-ray imaging is still required for each ultrasound frame and the amount of X-ray exposure has not been reduced. The final contribution in this thesis is a system that can track the catheter in ultrasound volumes automatically without the need for X-ray imaging during the tracking. Instead X-ray imaging is only required for the system initialization and for recovery from tracking failures. This allows a significant reduction in the amount of X-ray exposure for patient and clinicians.Open Acces
Biplanar Fluoroscopic Analysis of in vivo Hindfoot Kinematics During Ambulation
The overall goal of this project was to develop and validate a biplanar fluoroscopic system and integrated software to assess hindfoot kinematics. Understanding the motion of the foot and ankle joints may lead to improved treatment methods in persons with foot and ankle pathologies. During gait analysis, skin markers are placed on the lower extremities, which are defined as four rigid-body segments with three joints representing the hip, knee and ankle. This method introduces gross assumptions on the foot and severely limits the analysis of in depth foot mechanics. Multi-segmental models have been developed, but are susceptible to skin motion artifact error. Intra-cortical bone pins studies provide higher accuracy, but are invasive. This dissertation developed and validated a noninvasive biplane fluoroscopy system to overcome the skin motion artifacts and rigid-body assumptions of conventional foot motion analysis. The custom-built biplane fluoroscopy system was constructed from two fluoroscopes separated by 60°, attached to a custom walkway with an embedded force plate. Open source software was incorporated to correct the image distortion and calibrate the capture volume. This study was the first that quantified the cross-scatter contamination in a biplane fluoroscopic system and its effects on the accuracy of marker-based tracking. A cadaver foot study determined the static and dynamic error of the biplane fluoroscopic system using both marker-based and model-based tracking algorithms. The study also developed in vivo 3D kinematic models of the talocrural and subtalar joints during the stance phase of gait. Cross-scatter degradation showed negligible effects in the smallest phantom, suggesting negligible motion tracking error due to cross scatter for distal extremities. Marker-based tracking error had a maximum absolute mean error of 0.21 (± 0.15) in dynamic trials. Model-based tracking results compared to marker-based had an overall dynamic RMS average error of 0.59 mm. Models were developed using custom algorithms to determine talocrural and subtalar joint 3D kinematics. The models offer a viable, noninvasive method suitable for quantifying hindfoot kinematics. Patients with a variety of adult and pediatric conditions which affect foot and ankle dynamics during walking may benefit from this work
Automatic Spatiotemporal Analysis of Cardiac Image Series
RÉSUMÉ
Ă€ ce jour, les maladies cardiovasculaires demeurent au premier rang des principales causes de
décès en Amérique du Nord. Chez l’adulte et au sein de populations de plus en plus jeunes,
la soi-disant épidémie d’obésité entraînée par certaines habitudes de vie tels que la mauvaise
alimentation, le manque d’exercice et le tabagisme est lourde de conséquences pour les personnes
affectées, mais aussi sur le système de santé. La principale cause de morbidité et de
mortalité chez ces patients est l’athérosclérose, une accumulation de plaque à l’intérieur des
vaisseaux sanguins à hautes pressions telles que les artères coronaires. Les lésions athérosclérotiques
peuvent entraîner l’ischémie en bloquant la circulation sanguine et/ou en provoquant
une thrombose. Cela mène souvent à de graves conséquences telles qu’un infarctus. Outre les
problèmes liés à la sténose, les parois artérielles des régions criblées de plaque augmentent la
rigidité des parois vasculaires, ce qui peut aggraver la condition du patient. Dans la population
pédiatrique, la pathologie cardiovasculaire acquise la plus fréquente est la maladie de
Kawasaki. Il s’agit d’une vasculite aigüe pouvant affecter l’intégrité structurale des parois des
artères coronaires et mener à la formation d’anévrismes. Dans certains cas, ceux-ci entravent
l’hémodynamie artérielle en engendrant une perfusion myocardique insuffisante et en activant
la formation de thromboses.
Le diagnostic de ces deux maladies coronariennes sont traditionnellement effectués à l’aide
d’angiographies par fluoroscopie. Pendant ces examens paracliniques, plusieurs centaines de
projections radiographiques sont acquises en séries suite à l’infusion artérielle d’un agent de
contraste. Ces images révèlent la lumière des vaisseaux sanguins et la présence de lésions
potentiellement pathologiques, s’il y a lieu. Parce que les séries acquises contiennent de l’information
très dynamique en termes de mouvement du patient volontaire et involontaire (ex.
battements cardiaques, respiration et déplacement d’organes), le clinicien base généralement
son interprétation sur une seule image angiographique où des mesures géométriques sont effectuées
manuellement ou semi-automatiquement par un technicien en radiologie. Bien que
l’angiographie par fluoroscopie soit fréquemment utilisé partout dans le monde et souvent
considéré comme l’outil de diagnostic “gold-standard” pour de nombreuses maladies vasculaires,
la nature bidimensionnelle de cette modalité d’imagerie est malheureusement très
limitante en termes de spécification géométrique des différentes régions pathologiques. En effet,
la structure tridimensionnelle des sténoses et des anévrismes ne peut pas être pleinement
appréciée en 2D car les caractéristiques observées varient selon la configuration angulaire de
l’imageur. De plus, la présence de lésions affectant les artères coronaires peut ne pas refléter
la véritable santé du myocarde, car des mécanismes compensatoires naturels (ex. vaisseaux----------ABSTRACT
Cardiovascular disease continues to be the leading cause of death in North America. In adult
and, alarmingly, ever younger populations, the so-called obesity epidemic largely driven by
lifestyle factors that include poor diet, lack of exercise and smoking, incurs enormous stresses
on the healthcare system. The primary cause of serious morbidity and mortality for these
patients is atherosclerosis, the build up of plaque inside high pressure vessels like the coronary
arteries. These lesions can lead to ischemic disease and may progress to precarious blood
flow blockage or thrombosis, often with infarction or other severe consequences. Besides
the stenosis-related outcomes, the arterial walls of plaque-ridden regions manifest increased
stiffness, which may exacerbate negative patient prognosis. In pediatric populations, the
most prevalent acquired cardiovascular pathology is Kawasaki disease. This acute vasculitis
may affect the structural integrity of coronary artery walls and progress to aneurysmal lesions.
These can hinder the blood flow’s hemodynamics, leading to inadequate downstream
perfusion, and may activate thrombus formation which may lead to precarious prognosis.
Diagnosing these two prominent coronary artery diseases is traditionally performed using
fluoroscopic angiography. Several hundred serial x-ray projections are acquired during selective
arterial infusion of a radiodense contrast agent, which reveals the vessels’ luminal
area and possible pathological lesions. The acquired series contain highly dynamic information
on voluntary and involuntary patient movement: respiration, organ displacement and
heartbeat, for example. Current clinical analysis is largely limited to a single angiographic
image where geometrical measures will be performed manually or semi-automatically by a
radiological technician. Although widely used around the world and generally considered
the gold-standard diagnosis tool for many vascular diseases, the two-dimensional nature of
this imaging modality is limiting in terms of specifying the geometry of various pathological
regions. Indeed, the 3D structures of stenotic or aneurysmal lesions may not be fully appreciated
in 2D because their observable features are dependent on the angular configuration of
the imaging gantry. Furthermore, the presence of lesions in the coronary arteries may not
reflect the true health of the myocardium, as natural compensatory mechanisms may obviate
the need for further intervention. In light of this, cardiac magnetic resonance perfusion
imaging is increasingly gaining attention and clinical implementation, as it offers a direct
assessment of myocardial tissue viability following infarction or suspected coronary artery
disease. This type of modality is plagued, however, by motion similar to that present in fluoroscopic
imaging. This issue predisposes clinicians to laborious manual intervention in order
to align anatomical structures in sequential perfusion frames, thus hindering automation o
Automatic Spatiotemporal Analysis of Cardiac Image Series
RÉSUMÉ
Ă€ ce jour, les maladies cardiovasculaires demeurent au premier rang des principales causes de
décès en Amérique du Nord. Chez l’adulte et au sein de populations de plus en plus jeunes,
la soi-disant épidémie d’obésité entraînée par certaines habitudes de vie tels que la mauvaise
alimentation, le manque d’exercice et le tabagisme est lourde de conséquences pour les personnes
affectées, mais aussi sur le système de santé. La principale cause de morbidité et de
mortalité chez ces patients est l’athérosclérose, une accumulation de plaque à l’intérieur des
vaisseaux sanguins à hautes pressions telles que les artères coronaires. Les lésions athérosclérotiques
peuvent entraîner l’ischémie en bloquant la circulation sanguine et/ou en provoquant
une thrombose. Cela mène souvent à de graves conséquences telles qu’un infarctus. Outre les
problèmes liés à la sténose, les parois artérielles des régions criblées de plaque augmentent la
rigidité des parois vasculaires, ce qui peut aggraver la condition du patient. Dans la population
pédiatrique, la pathologie cardiovasculaire acquise la plus fréquente est la maladie de
Kawasaki. Il s’agit d’une vasculite aigüe pouvant affecter l’intégrité structurale des parois des
artères coronaires et mener à la formation d’anévrismes. Dans certains cas, ceux-ci entravent
l’hémodynamie artérielle en engendrant une perfusion myocardique insuffisante et en activant
la formation de thromboses.
Le diagnostic de ces deux maladies coronariennes sont traditionnellement effectués à l’aide
d’angiographies par fluoroscopie. Pendant ces examens paracliniques, plusieurs centaines de
projections radiographiques sont acquises en séries suite à l’infusion artérielle d’un agent de
contraste. Ces images révèlent la lumière des vaisseaux sanguins et la présence de lésions
potentiellement pathologiques, s’il y a lieu. Parce que les séries acquises contiennent de l’information
très dynamique en termes de mouvement du patient volontaire et involontaire (ex.
battements cardiaques, respiration et déplacement d’organes), le clinicien base généralement
son interprétation sur une seule image angiographique où des mesures géométriques sont effectuées
manuellement ou semi-automatiquement par un technicien en radiologie. Bien que
l’angiographie par fluoroscopie soit fréquemment utilisé partout dans le monde et souvent
considéré comme l’outil de diagnostic “gold-standard” pour de nombreuses maladies vasculaires,
la nature bidimensionnelle de cette modalité d’imagerie est malheureusement très
limitante en termes de spécification géométrique des différentes régions pathologiques. En effet,
la structure tridimensionnelle des sténoses et des anévrismes ne peut pas être pleinement
appréciée en 2D car les caractéristiques observées varient selon la configuration angulaire de
l’imageur. De plus, la présence de lésions affectant les artères coronaires peut ne pas refléter
la véritable santé du myocarde, car des mécanismes compensatoires naturels (ex. vaisseaux----------ABSTRACT
Cardiovascular disease continues to be the leading cause of death in North America. In adult
and, alarmingly, ever younger populations, the so-called obesity epidemic largely driven by
lifestyle factors that include poor diet, lack of exercise and smoking, incurs enormous stresses
on the healthcare system. The primary cause of serious morbidity and mortality for these
patients is atherosclerosis, the build up of plaque inside high pressure vessels like the coronary
arteries. These lesions can lead to ischemic disease and may progress to precarious blood
flow blockage or thrombosis, often with infarction or other severe consequences. Besides
the stenosis-related outcomes, the arterial walls of plaque-ridden regions manifest increased
stiffness, which may exacerbate negative patient prognosis. In pediatric populations, the
most prevalent acquired cardiovascular pathology is Kawasaki disease. This acute vasculitis
may affect the structural integrity of coronary artery walls and progress to aneurysmal lesions.
These can hinder the blood flow’s hemodynamics, leading to inadequate downstream
perfusion, and may activate thrombus formation which may lead to precarious prognosis.
Diagnosing these two prominent coronary artery diseases is traditionally performed using
fluoroscopic angiography. Several hundred serial x-ray projections are acquired during selective
arterial infusion of a radiodense contrast agent, which reveals the vessels’ luminal
area and possible pathological lesions. The acquired series contain highly dynamic information
on voluntary and involuntary patient movement: respiration, organ displacement and
heartbeat, for example. Current clinical analysis is largely limited to a single angiographic
image where geometrical measures will be performed manually or semi-automatically by a
radiological technician. Although widely used around the world and generally considered
the gold-standard diagnosis tool for many vascular diseases, the two-dimensional nature of
this imaging modality is limiting in terms of specifying the geometry of various pathological
regions. Indeed, the 3D structures of stenotic or aneurysmal lesions may not be fully appreciated
in 2D because their observable features are dependent on the angular configuration of
the imaging gantry. Furthermore, the presence of lesions in the coronary arteries may not
reflect the true health of the myocardium, as natural compensatory mechanisms may obviate
the need for further intervention. In light of this, cardiac magnetic resonance perfusion
imaging is increasingly gaining attention and clinical implementation, as it offers a direct
assessment of myocardial tissue viability following infarction or suspected coronary artery
disease. This type of modality is plagued, however, by motion similar to that present in fluoroscopic
imaging. This issue predisposes clinicians to laborious manual intervention in order
to align anatomical structures in sequential perfusion frames, thus hindering automation o
Learning to extract features for 2D – 3D multimodal registration
The ability to capture depth information form an scene has greatly increased in the recent years. 3D sensors, traditionally high cost and low resolution sensors, are being democratized and 3D scans of indoor and outdoor scenes are becoming more and more common.
However, there is still a great data gap between the amount of captures being performed with 2D and 3D sensors. Although the 3D sensors provide more information about the scene, 2D sensors are still more accessible and widely used. This trade-off between availability and information between sensors brings us to a multimodal scenario of mixed 2D and 3D data.
This thesis explores the fundamental block of this multimodal scenario: the registration between a single 2D image and a single unorganized point cloud. An unorganized 3D point cloud is the basic representation of a 3D capture. In this representation the surveyed points are represented only by their real word coordinates and, optionally, by their colour information. This simplistic representation brings multiple challenges to the registration, since most of the state of the art works leverage the existence of metadata about the scene or prior knowledges.
Two different techniques are explored to perform the registration: a keypoint-based technique and an edge-based technique. The keypoint-based technique estimates the transformation by means of correspondences detected using Deep Learning, whilst the edge-based technique refines a transformation using a multimodal edge detection to establish anchor points to perform the estimation.
An extensive evaluation of the proposed methodologies is performed. Albeit further research is needed to achieve adequate performances, the obtained results show the potential of the usage of deep learning techniques to learn 2D and 3D similarities. The results also show the good performance of the proposed 2D-3D iterative refinement, up to the state of the art on 3D-3D registration.La capacitat de captar informació de profunditat d’una escena ha augmentat molt els darrers anys. Els sensors 3D, tradicionalment d’alt cost i baixa resolució, s’estan democratitzant i escà nners 3D d’escents interiors i exteriors són cada vegada més
comuns.
Tot i això, encara hi ha una gran bretxa entre la quantitat de captures que s’estan realitzant amb sensors 2D i 3D. Tot i que els sensors 3D proporcionen més informació sobre l’escena, els sensors 2D encara són més accessibles i à mpliament utilitzats.
Aquesta diferència entre la disponibilitat i la informació entre els sensors ens porta a un escenari multimodal de dades mixtes 2D i 3D.
Aquesta tesi explora el bloc fonamental d’aquest escenari multimodal: el registre entre una sola imatge 2D i un sol núvol de punts no organitzat. Un núvol de punts 3D no organitzat és la representació bà sica d’una captura en 3D. En aquesta representació, els punts mesurats es representen només per les seves coordenades i, opcionalment, per la informació de color. Aquesta representació simplista aporta múltiples reptes al registre, ja que la majoria dels algoritmes aprofiten l’existència de metadades sobre l’escena o coneixements previs.
Per realitzar el registre s’exploren dues tècniques diferents: una tècnica basada en punts clau i una tècnica basada en contorns. La tècnica basada en punts clau estima la transformació mitjançant correspondències detectades mitjançant Deep Learning, mentre que la tècnica basada en contorns refina una transformació mitjançant una detecció multimodal de la vora per establir punts d’ancoratge per realitzar l’estimació.
Es fa una avaluació à mplia de les metodologies proposades. Tot i que es necessita més investigació per obtenir un rendiment adequat, els resultats obtinguts mostren el potencial de l’ús de tècniques d’aprenentatge profund per aprendre similituds 2D i 3D. Els resultats també mostren l’excel·lent rendiment del perfeccionament iteratiu 2D-3D proposat, similar al dels algoritmes de registre 3D-3D.La capacidad de captar información de profundidad de una escena ha aumentado mucho en los últimos años. Los sensores 3D, tradicionalmente de alto costo y baja resolución, se están democratizando y escáneres 3D de escents interiores y exteriores son cada vez más comunes.
Sin embargo, todavĂa hay una gran brecha entre la cantidad de capturas que se están realizando con sensores 2D y 3D. Aunque los sensores 3D proporcionan más informaciĂłn sobre la escena, los sensores 2D todavĂa son más accesibles y ampliamente utilizados. Esta diferencia entre la disponibilidad y la informaciĂłn entre los sensores nos lleva a un escenario multimodal de datos mixtos 2D y 3D.
Esta tesis explora el bloque fundamental de este escenario multimodal: el registro entre una sola imagen 2D y una sola nube de puntos no organizado. Una nube de puntos 3D no organizado es la representaciĂłn básica de una captura en 3D. En esta representaciĂłn, los puntos medidos se representan sĂłlo por sus coordenadas y, opcionalmente, por la informaciĂłn de color. Esta representaciĂłn simplista aporta mĂşltiples retos en el registro, ya que la mayorĂa de los algoritmos aprovechan la existencia de metadatos sobre la escena o conocimientos previos.
Para realizar el registro se exploran dos técnicas diferentes: una técnica basada en puntos clave y una técnica basada en contornos. La técnica basada en puntos clave estima la transformación mediante correspondencias detectadas mediante Deep Learning, mientras que la técnica basada en contornos refina una transformación mediante una detección multimodal del borde para establecer puntos de anclaje para realizar la estimación.
Se hace una evaluaciĂłn amplia de las metodologĂas propuestas. Aunque se necesita más investigaciĂłn para obtener un rendimiento adecuado, los resultados obtenidos muestran el potencial del uso de tĂ©cnicas de aprendizaje profundo para aprender similitudes 2D y 3D. Los resultados tambiĂ©n muestran el excelente rendimiento del perfeccionamiento iterativo 2D-3D propuesto, similar al de los algoritmos de registro 3D-3D
Learning to extract features for 2D – 3D multimodal registration
The ability to capture depth information form an scene has greatly increased in the recent years. 3D sensors, traditionally high cost and low resolution sensors, are being democratized and 3D scans of indoor and outdoor scenes are becoming more and more common.
However, there is still a great data gap between the amount of captures being performed with 2D and 3D sensors. Although the 3D sensors provide more information about the scene, 2D sensors are still more accessible and widely used. This trade-off between availability and information between sensors brings us to a multimodal scenario of mixed 2D and 3D data.
This thesis explores the fundamental block of this multimodal scenario: the registration between a single 2D image and a single unorganized point cloud. An unorganized 3D point cloud is the basic representation of a 3D capture. In this representation the surveyed points are represented only by their real word coordinates and, optionally, by their colour information. This simplistic representation brings multiple challenges to the registration, since most of the state of the art works leverage the existence of metadata about the scene or prior knowledges.
Two different techniques are explored to perform the registration: a keypoint-based technique and an edge-based technique. The keypoint-based technique estimates the transformation by means of correspondences detected using Deep Learning, whilst the edge-based technique refines a transformation using a multimodal edge detection to establish anchor points to perform the estimation.
An extensive evaluation of the proposed methodologies is performed. Albeit further research is needed to achieve adequate performances, the obtained results show the potential of the usage of deep learning techniques to learn 2D and 3D similarities. The results also show the good performance of the proposed 2D-3D iterative refinement, up to the state of the art on 3D-3D registration.La capacitat de captar informació de profunditat d’una escena ha augmentat molt els darrers anys. Els sensors 3D, tradicionalment d’alt cost i baixa resolució, s’estan democratitzant i escà nners 3D d’escents interiors i exteriors són cada vegada més
comuns.
Tot i això, encara hi ha una gran bretxa entre la quantitat de captures que s’estan realitzant amb sensors 2D i 3D. Tot i que els sensors 3D proporcionen més informació sobre l’escena, els sensors 2D encara són més accessibles i à mpliament utilitzats.
Aquesta diferència entre la disponibilitat i la informació entre els sensors ens porta a un escenari multimodal de dades mixtes 2D i 3D.
Aquesta tesi explora el bloc fonamental d’aquest escenari multimodal: el registre entre una sola imatge 2D i un sol núvol de punts no organitzat. Un núvol de punts 3D no organitzat és la representació bà sica d’una captura en 3D. En aquesta representació, els punts mesurats es representen només per les seves coordenades i, opcionalment, per la informació de color. Aquesta representació simplista aporta múltiples reptes al registre, ja que la majoria dels algoritmes aprofiten l’existència de metadades sobre l’escena o coneixements previs.
Per realitzar el registre s’exploren dues tècniques diferents: una tècnica basada en punts clau i una tècnica basada en contorns. La tècnica basada en punts clau estima la transformació mitjançant correspondències detectades mitjançant Deep Learning, mentre que la tècnica basada en contorns refina una transformació mitjançant una detecció multimodal de la vora per establir punts d’ancoratge per realitzar l’estimació.
Es fa una avaluació à mplia de les metodologies proposades. Tot i que es necessita més investigació per obtenir un rendiment adequat, els resultats obtinguts mostren el potencial de l’ús de tècniques d’aprenentatge profund per aprendre similituds 2D i 3D. Els resultats també mostren l’excel·lent rendiment del perfeccionament iteratiu 2D-3D proposat, similar al dels algoritmes de registre 3D-3D.La capacidad de captar información de profundidad de una escena ha aumentado mucho en los últimos años. Los sensores 3D, tradicionalmente de alto costo y baja resolución, se están democratizando y escáneres 3D de escents interiores y exteriores son cada vez más comunes.
Sin embargo, todavĂa hay una gran brecha entre la cantidad de capturas que se están realizando con sensores 2D y 3D. Aunque los sensores 3D proporcionan más informaciĂłn sobre la escena, los sensores 2D todavĂa son más accesibles y ampliamente utilizados. Esta diferencia entre la disponibilidad y la informaciĂłn entre los sensores nos lleva a un escenario multimodal de datos mixtos 2D y 3D.
Esta tesis explora el bloque fundamental de este escenario multimodal: el registro entre una sola imagen 2D y una sola nube de puntos no organizado. Una nube de puntos 3D no organizado es la representaciĂłn básica de una captura en 3D. En esta representaciĂłn, los puntos medidos se representan sĂłlo por sus coordenadas y, opcionalmente, por la informaciĂłn de color. Esta representaciĂłn simplista aporta mĂşltiples retos en el registro, ya que la mayorĂa de los algoritmos aprovechan la existencia de metadatos sobre la escena o conocimientos previos.
Para realizar el registro se exploran dos técnicas diferentes: una técnica basada en puntos clave y una técnica basada en contornos. La técnica basada en puntos clave estima la transformación mediante correspondencias detectadas mediante Deep Learning, mientras que la técnica basada en contornos refina una transformación mediante una detección multimodal del borde para establecer puntos de anclaje para realizar la estimación.
Se hace una evaluaciĂłn amplia de las metodologĂas propuestas. Aunque se necesita más investigaciĂłn para obtener un rendimiento adecuado, los resultados obtenidos muestran el potencial del uso de tĂ©cnicas de aprendizaje profundo para aprender similitudes 2D y 3D. Los resultados tambiĂ©n muestran el excelente rendimiento del perfeccionamiento iterativo 2D-3D propuesto, similar al de los algoritmos de registro 3D-3D.Postprint (published version
Recalage préservant la topologie des vaisseaux: application à la cardiologie interventionnelle
In percutaneous coronary interventions, integrating into the live fluoroscopic image vessel calcifications and occlusion information that are revealed in the pre-operative Computed Tomography Angiography can greatly improve guidance of the clinician. Fusing pre- and intra-operative information into a single space aims at taking advantage of two complementary modalities and requires a step of registration that must provide good alignment and relevant correspondences between them. Most of the existing 3D/2D vessel registration algorithms do not take into account the particular topology of the vasculature to be matched, resulting into pairings that may be topologically inconsistent along the vasculature.A first contribution consisted in a registration framework dedicated to curve matching, denoted the Iterative Closest Curve (ICC). Its main feature is to preserve the topological consistency along curves by taking advantage of the Frechet distance that not only computes the distance between two curves but also builds ordered pairings along them. A second contribution is a pairing procedure designed for the matching of a vascular tree structure that endorses its particular topology and that can easily take advantage of the ICC-framework. Centerlines of the 3D tree are matched to curves extracted from the 2D vascular graph while preserving the connectivity at 3D bifurcations. The matching criterion used to build the pairings takes into account the geometric distance and the resemblance between curves both based on a global formulation using the Frechet distance.To evaluate our approach we run experiments on a database composed of 63 clinical cases, measuring accuracy on real conditions and robustness with respect to a simulated displacement. Quantitative results have been obtained using two complementary measures that aim at assessing the results both geometrically and topologically, and quantify the resulting alignment error as well as the pairing error. The proposed method exhibits good results both in terms of pairing and alignment and demonstrates to be low sensitive to the rotations to be compensated (up to 30 degrees).Cette thèse s’inscrit dans le cadre de la cardiologie interventionnelle. Intégrer des informations telles que la position des calcifications ainsi que la taille et forme d’une occlusion dans les images fluoroscopiques constituerait un bénéfice pour le praticien. Ces informations, invisibles dans les images rayons-X pendant la procédure, sont présentes au sein du scanner CT préopératoire. La fusion de cette modalité avec la fluoroscopie apporterait une aide précieuse au guidage temps réel des outils interventionnels en bénéficiant des informations fournies par le CT. Cette fusion requiert une étape de recalage qui vise à aligner au mieux les deux modalités et fournir des correspondances pertinentes entre elles. La plupart des algorithmes de recalage 3D/2D de vaisseaux rencontrent des difficultés à construire des appariements anatomiquement pertinents, essentiellement à cause du manque de cohérence topologique le long du réseau vasculaire.Afin de résoudre ce problème, nous proposons dans cette thèse un cadre générique pour le recalage de structures curvilinéaires. L’algorithme qui en découle préserve la structure des courbes appariées. Les artères coronaires pouvant être représentées par un ensemble de courbes arrangées en arbre, nous proposons aussi une procédure d’appariement qui respecte cette structure. Le recalage d’un arbre 3D sur un graphe 2D est ainsi réalisé en assurant la préservation des connectivités aux bifurcations. Le choix de l’appariement est basé sur un critère prenant en compte la distance géométrique ainsi que la ressemblance entre courbes. Ce critère est évalué grâce à une forme modifiée de la distance de Fréchet.Une base de données de 63 cas cliniques a été utilisée à travers différentes expériences afin de prouver la robustesse et la précision de notre approche. Nous avons proposé deux mesures complémentaires visant à quantifier la qualité de l’alignement d’une part et des appariements engendrés d’autre part. La méthode proposée se montre précise pour les alignements de la projection du modèle CT et des artères coronaires observées dans les images angiographiques. De plus, les appariements obtenus sont anatomiquement pertinents et lálgorithme a prouvé sa robustesse face aux perturbations de la position initiale. Nous attribuons cette robustesse à la qualité des appariements construits au fur et à mesure des itérations
- …