Programa de Doutoramento en Sistemas de Software Intelixentes e Adaptables (RD 99/2011)
Abstract
This thesis focuses on the application of image and video generation models to predict the evolution of a biological element in biomedical contexts. The goal is to generate a sequence of images that represent the different stages through which a case study will evolve. Through a comprehensive analysis of these models, their potential to generate coherent biological developmental sequences will be explored. During the thesis work, the lack of metrics to evaluate the coherence of the sequences was identified, leading to the development of new statistical measures based on the analysis of stages in the generated videos. Using these metrics, a new model is created that demonstrates superior stage coherence in sequence generation. Giving the limitations of GAN-based models in effectively using real input images as conditions, the study shifts to architectures based on diffusion. This shift facilitates the performance of image sequence prediction tasks. The incorporation of the proposed metrics allows the generation of different predictions depending on the number of real images used for their generation, taking into account the stage coherence and the detection of movements or abrupt changes in neighboring images. Finally, this work also proposes a new model based on a siamese architecture to extend the duration of videos without degrading image quality. This leads to a significant increase in video length, thereby improving the detail of its evolution. Regarding future work, the primary goal is to improve image quality by increasing the resolution and the level of detail generated. In addition, the inclusion of new statistical measures and data from the studied cases will be explored to further benefit various biomedical analyses. This extension could pave the way for the
analysis of tumor evolution, skin lesion growth, and other cases that require indepth study of their evolution.Esta tesis se centra en la aplicación de modelos de generación de imágenes y vídeos para la predicción de la evolución de un elemento biológico en contextos biomédicos. El objetivo es generar una secuencia de imágenes que muestren los diferentes estadíos por los que evolucionará un caso de estudio. A través de un análisis exhaustivo de estos modelos, se explora su potencial para generar secuencias biológicas de desarrollo coherentes. Durante el proceso del trabajo de tesis, se detectó la ausencia de métricas para evaluar la coherencia de las secuencias, por lo que se elaboran nuevas medidas estadísticas basadas en el análisis de etapas en los vídeos generados. Utilizando estas métricas, se desarrolla un nuevo modelo que demuestra una coherencia de estadíos superior en la generación de las secuencias. Ante las limitaciones de los modelos basados en GAN para utilizar de manera efectiva imágenes de entrada reales como condiciones, el estudio se traslada a arquitecturas basadas en difusión. Este cambio facilita la realización de tareas de predicción de secuencias de imágenes. La incorporación de las métricas propuestas permite la generación de diferentes predicciones dependiendo del número de imágenes reales utilizadas para su creación, teniendo en cuenta, además, la coherencia de etapas y la detección de movimientos o cambios abruptos en imágenes vecinas. Finalmente, en este trabajo se propone también un nuevo modelo basado en una arquitectura siamesa para extender la duración de los vídeos sin degradar la calidad de la imagen. Esto resulta en un aumento significativo en la longitud del vídeo, mejorando así el detalle de su evolución. En cuanto al trabajo futuro, el objetivo principal es mejorar la calidad de la imagen aumentando su resolución y el nivel de detalle generado. También se estudiará la inclusión de nuevas medidas estadísticas y datos de los casos estudiados para beneficiar aún más a diversos análisis biomédicos. Esta extensión podría abrir vías para el análisis del desarrollo de tumores, el crecimiento de manchas en la piel y otros casos que requieran un análisis en profundidad de su evolución.O obxectivo principal da tese é o desenvolvemento dunha nova técnica de xeración de imaxes biomédicas sintéticas que permita a extracción e visualización dunha evolución predictiva do estado do paciente. Partindo do estado inicial do paciente, representado por imaxes contidas no seu historial, as súas características persoais e un conxunto de casos previos doutros pacientes con atributos similares, o obxectivo é xerar unha colección de imaxes artificiais que permitan, seguindo una liña do tempo, amosar o progreso do estado de saúde dese paciente.Xunta de Galicia | Ref. ED481A 2021/286Universidade de Vigo | Ref. BDNS 67585