30 research outputs found

    Artificial Intelligence-Powered Chronic Wound Management System: Towards Human Digital Twins

    Get PDF
    Artificial Intelligence (AI) has witnessed increased application and widespread adoption over the past decade. AI applications to medical images have the potential to assist caregivers in deciding on a proper chronic wound treatment plan by helping them to understand wound and tissue classification and border segmentation, as well as visual image synthesis. This dissertation explores chronic wound management using AI methods, such as Generative Adversarial Networks (GAN) and Explainable AI (XAI) techniques. The wound images are collected, grouped, and processed. One primary objective of this research is to develop a series of AI models, not only to present the potential of AI in wound management but also to develop the building blocks of human digital twins. First of all, motivations, contributions, and the dissertation outline are summarized to introduce the aim and scope of the dissertation. The first contribution of this study is to build a chronic wound classification and its explanation utilizing XAI. This model also benefits from a transfer learning methodology to improve performance. Then a novel model is developed that achieves wound border segmentation and tissue classification tasks simultaneously. A Deep Learning (DL) architecture, i.e., the GAN, is proposed to realize these tasks. Another novel model is developed for creating lifelike wounds. The output of the previously proposed model is used as an input for this model, which generates new chronic wound images. Any tissue distribution could be converted to lifelike wounds, preserving the shape of the original wound. The aforementioned research is extended to build a digital twin for chronic wound management. Chronic wounds, enabling technologies for wound care digital twins, are examined, and a general framework for chronic wound management using the digital twin concept is investigated. The last contribution of this dissertation includes a chronic wound healing prediction model using DL techniques. It utilizes the previously developed AI models to build a chronic wound management framework using the digital twin concept. Lastly, the overall conclusions are drawn. Future challenges and further developments in chronic wound management are discussed by utilizing emerging technologies

    Metaverse-IDS: Deep learning-based intrusion detection system for Metaverse-IoT networks

    Get PDF
    Combining the metaverse and the Internet of Things (IoT) will lead to the development of diverse, virtual, and more advanced networks in the future. The integration of IoT networks with the metaverse will enable more meaningful connections between the 'real' and 'virtual' worlds, allowing for real-time data analysis, access, and processing. However, these metaverse-IoT networks will face numerous security and privacy threats. Intrusion Detection Systems (IDS) offer an effective means of early detection for such attacks. Nevertheless, the metaverse generates substantial volumes of data due to its interactive nature and the multitude of user interactions within virtual environments, posing a computational challenge for building an intrusion detection system. To address this challenge, this paper introduces an innovative intrusion detection system model based on deep learning. This model aims to detect most attacks targeting metaverse-IoT communications and combines two techniques: KPCA (Kernel Principal Component Analysis which was used for attack feature extraction and CNN (Convolutional Neural Networks for attack recognition and classification. The efficiency of this proposed IDS model is assessed using two widely recognized benchmark datasets, BoT-IoT and ToN-IoT, which contain various IoT attacks potentially targeting IoT communications. Experimental results confirmed the effectiveness of the proposed IDS model in identifying 12 classes of attacks relevant to metaverse-IoT, achieving a remarkable accuracy of and a False Negative Rate FNR less than . Furthermore, when compared with other models in the literature, our IDS model demonstrates superior performance in attack detection accuracy

    Predictive Techniques for Scene Understanding by using Deep Learning in Autonomous Driving

    Get PDF
    La conducci贸n aut贸noma es considerada uno de los m谩s grandes retos tecnol贸gicos de la actualidad. Cuando los coches aut贸nomos conquisten nuestras carreteras, los accidentes se reducir谩n notablemente, hasta casi desaparecer, ya que la tecnolog铆a estar谩 testada y no incumplir谩 las normas de conducci贸n, entre otros beneficios sociales y econ贸micos. Uno de los aspectos m谩s cr铆ticos a la hora de desarrollar un veh铆culo aut贸nomo es percibir y entender la escena que le rodea. Esta tarea debe ser tan precisa y eficiente como sea posible para posteriormente predecir el futuro de esta misma y ayudar a la toma de decisiones. De esta forma, las acciones tomadas por el veh铆culo garantizar谩n tanto la seguridad del veh铆culo en s铆 mismo y sus ocupantes, como la de los obst谩culos circundantes, tales como viandantes, otros veh铆culos o infraestructura de la carretera. En ese sentido, esta tesis doctoral se centra en el estudio y desarrollo de distintas t茅cnicas predictivas para el entendimiento de la escena en el contexto de la conducci贸n aut贸noma. Durante la tesis, se observa una incorporaci贸n progresiva de t茅cnicas de aprendizaje profundo en los distintos algoritmos propuestos para mejorar el razonamiento sobre qu茅 est谩 ocurriendo en el escenario de tr谩fico, as铆 como para modelar las complejas interacciones entre la informaci贸n social (distintos participantes o agentes del escenario, tales como veh铆culos, ciclistas o peatones) y f铆sica (es decir, la informaci贸n geom茅trica, sem谩ntica y topol贸gica del mapa de alta definici贸n) presente en la escena. La capa de percepci贸n de un veh铆culo aut贸nomo se divide modularmente en tres etapas: Detecci贸n, Seguimiento (Tracking), y Predicci贸n. Para iniciar el estudio de las etapas de seguimiento y predicci贸n, se propone un algoritmo de Multi-Object Tracking basado en t茅cnicas cl谩sicas de estimaci贸n de movimiento y asociaci贸n validado en el dataset KITTI, el cual obtiene m茅tricas del estado del arte. Por otra parte, se propone el uso de un filtro inteligente basado en informaci贸n contextual de mapa, cuyo objetivo es monitorizar los agentes m谩s relevantes de la escena en el tiempo, representando estos agentes filtrados la entrada preliminar para realizar predicciones unimodales basadas en un modelo cinem谩tico. Para validar esta propuesta de filtro inteligente se usa CARLA (CAR Learning to Act), uno de los simuladores hiperrealistas para conducci贸n aut贸noma m谩s prometedores en la actualidad, comprobando c贸mo al usar informaci贸n contextual de mapa se puede reducir notablemente el tiempo de inferencia de un algoritmo de tracking y predicci贸n basados en m茅todos f铆sicos, prestando atenci贸n a los agentes realmente relevantes del escenario de tr谩fico. Tras observar las limitaciones de un modelo de predicci贸n basado en cinem谩tica para la predicci贸n a largo plazo de un agente, los distintos algoritmos de la tesis se centran en el m贸dulo de predicci贸n, usando los datasets Argoverse 1 y Argoverse 2, donde se asume que los agentes proporcionados en cada escenario de tr谩fico ya est谩n monitorizados durante un cierto n煤mero de observaciones. En primer lugar, se introduce un modelo basado en redes neuronales recurrentes (particularmente redes LSTM, Long-Short Term Memory) y mecanismo de atenci贸n para codificar las trayectorias pasadas de los agentes, y una representaci贸n simplificada del mapa en forma de posiciones finales potenciales en la carretera para calcular las trayectorias futuras unimodales, todo envuelto en un marco GAN (Generative Adversarial Network), obteniendo m茅tricas similares al estado del arte en el caso unimodal. Una vez validado el modelo anterior en Argoverse 1, se proponen distintos modelos base (s贸lo social, incorporando mapa, y una mejora final basada en Transformer encoder, redes convolucionales 1D y mecanismo de atenci贸n cruzada para la fusi贸n de caracter铆sticas) precisos y eficientes basados en el modelo de predicci贸n anterior, introduciendo dos nuevos conceptos. Por un lado, el uso de redes neuronales gr谩ficas (particularmente GCN, Graph Convolutional Network) para codificar de una forma potente las interacciones de los agentes. Por otro lado, se propone el preprocesamiento de trayectorias preliminares a partir de un mapa con un m茅todo heur铆stico. Gracias a estas entradas y una arquitectura m谩s potente de codificaci贸n, los modelos base ser谩n capaces de predecir distintas trayectorias futuras multimodales, es decir, cubriendo distintos posibles futuros para el agente de inter茅s. Los modelos base propuestos obtienen m茅tricas de regresi贸n del estado del arte tanto en el caso multimodal como unimodal manteniendo un claro compromiso de eficiencia con respecto a otras propuestas. El modelo final de la tesis, inspirado en los modelos anteriores y validado en el m谩s reciente dataset para algoritmos de predicci贸n en conducci贸n aut贸noma (Argoverse 2), introduce varias mejoras para entender mejor el escenario de tr谩fico y decodificar la informaci贸n de una forma precisa y eficiente. Se propone incorporar informaci贸n topol贸gica y sem谩ntica de los carriles futuros preliminares con el m茅todo heur铆stico antes mencionado, codificaci贸n de mapa basada en aprendizaje profundo con redes GCN, ciclo de fusi贸n de caracter铆sticas f铆sicas y sociales, estimaci贸n de posiciones finales en la carretera y agregaci贸n de su entorno circundante con aprendizaje profundo y finalmente m贸dulo de refinado para mejorar la calidad de las predicciones multimodales finales de un modo elegante y eficiente. Comparado con el estado del arte, nuestro m茅todo logra m茅tricas de predicci贸n a la par con los m茅todos mejor posicionados en el Leaderboard de Argoverse 2, reduciendo de forma notable el n煤mero de par谩metros y operaciones de coma flotante por segundo. Por 煤ltimo, el modelo final de la tesis ha sido validado en simulaci贸n en distintas aplicaciones de conducci贸n aut贸noma. En primer lugar, se integra el modelo para proporcionar predicciones a un algoritmo de toma de decisiones basado en aprendizaje por refuerzo en el simulador SMARTS (Scalable Multi-Agent Reinforcement Learning Training School), observando en los estudios como el veh铆culo es capaz de tomar mejores decisiones si conoce el comportamiento futuro de la escena y no solo el estado actual o pasado de esta misma. En segundo lugar, se ha realizado un estudio de adaptaci贸n de dominio exitoso en el simulador hiperrealista CARLA en distintos escenarios desafiantes donde el entendimiento de la escena y predicci贸n del entorno son muy necesarios, como una autopista o rotonda con gran densidad de tr谩fico o la aparici贸n de un usuario vulnerable de la carretera de forma repentina. En ese sentido, el modelo de predicci贸n ha sido integrado junto con el resto de capas de la arquitectura de navegaci贸n aut贸noma del grupo de investigaci贸n donde se desarrolla la tesis como paso previo a su implementaci贸n en un veh铆culo aut贸nomo real

    Visual and Camera Sensors

    Get PDF
    This book includes 13 papers published in Special Issue ("Visual and Camera Sensors") of the journal Sensors. The goal of this Special Issue was to invite high-quality, state-of-the-art research papers dealing with challenging issues in visual and camera sensors

    LookBook: pioneering Inclusive beauty with artificial intelligence and machine learning algorithms

    Get PDF
    Technology's imperfections and biases inherited from historical norms are crucial to acknowledge. Rapid perpetuation and amplification of these biases necessitate transparency and proactive measures to mitigate their impact. The online visual culture reinforces Eurocentric beauty ideals through prioritized algorithms and augmented reality filters, distorting reality and perpetuating unrealistic standards of beauty. Narrow beauty standards in technology pose a significant challenge to overcome. Algorithms personalize content, creating "filter bubbles" that reinforce these ideals and limit exposure to diverse representations of beauty. This cycle compels individuals to conform, hindering the embrace of their unique features and alternative definitions of beauty. LookBook counters prevalent narrow beauty standards in technology. It promotes inclusivity and representation through self-expression, community engagement, and diverse visibility. LookBook comprises three core sections: Dash, Books, and Community. In Dash, users curate their experience through personalization algorithms. Books allow users to collect curated content for inspiration and creativity, while Community fosters connections with like-minded individuals. Through LookBook, users create a reality aligned with their unique vision. They control consumed content, nurturing individualism through preferences and creativity. This personalization empowers individuals to break free from narrow beauty standards and embrace their distinctiveness. LookBook stands out with its algorithmic training and data representation. It offers transparency on how personalization algorithms operate and ensures a balanced and diverse representation of physicalities and ethnicities. By addressing biases and embracing a wide range of identities, LookBook sparks a conversation for a technology landscape that amplifies all voices, fostering an environment celebrating diversity and prioritizing inclusivity
    corecore