15 research outputs found

    Deteccion de plaquitas en un cabezal de fresado usando correspondencia de plantillas

    Get PDF
    El objetivo de este trabajo ha sido determinar si el método de correspondencia de plantillas (template matching), usando como métrica de correspondencias la correlación cruzada normalizada, proporciona buenos resultados detectando una serie de plaquitas de corte que forman los cabezales de una máquina de fresado. El conjunto de imágenes de prueba (dataset) empleado está formado por 144 imágenes procedentes de cabezales de fresado utilizados en las máquinas de corte TRF de la empresa TECOI. Cada imagen del cabezal contiene unas 9 plaquitas de corte por lo que el dataset está compuesto de unas 1300 plaquitas. Utilizando 10 imágenes del cabezal, 96 plaquitas, como conjunto de entrenamiento se ha obtenido un F-Score del 86%

    Interfaz humano-computador basada en gestos faciales y orientada a la aplicación WhatsApp para personas con limitación motriz de miembros superiores

    Get PDF
    People with reduced upper-limb mobility depend mainly on facial gestures to communicate with the world; nonetheless, current facial gesture-based interfaces do not take into account the reduction in mobility that most people with motor limitations experience during recovery periods. This study presents an alternative to overcome this limitation, a human-computer interface based on computer vision techniques over two types of images: images of the user’s face captured by a webcam and screenshots of a desktop application running on the foreground. The first type is used to detect, track, and estimate gestures, facial patterns in order to move and execute commands with the cursor, while the second one is used to ensure that the cursor moves to specific interaction areas of the desktop application. The interface was fully programmed in Python 3.6 using open source libraries and runs in the background in Windows operating systems. The performance of the interface was evaluated with videos of people using four interaction commands in WhatsApp Desktop. We conclude that the interface can operate with various types of lighting, backgrounds, camera distances, body postures, and movement speeds; and the location and size of the WhatsApp window does not affect its effectiveness. The interface operates at a speed of 1 Hz and uses 35 % of the capacity a desktop computer with an Intel Core i5 processor and 1.5 GB of RAM for its execution; therefore, this solution can be implemented in ordinary, low-end personal computers.En el caso de personas con limitación motriz de miembros superiores, los gestos faciales son la principal forma de comunicarse con el mundo. Sin embargo, las interfaces actuales basadas en gestos no tienen en cuenta la reducción de movilidad que la mayoría de las personas con limitación motriz experimentan durante sus periodos de recuperación. Como alternativa para superar esta limitación, se presenta una interfaz humana-computador basada en técnicas de visión por computador sobre dos tipos de imagen: la imagen del rostro capturada mediante webcam y la captura de pantalla de una aplicación de escritorio en primer plano. La primera imagen es utilizada para detectar, seguir y estimar la pose del rostro con el fin de desplazar y ejecutar comandos con el cursor; la segunda imagen es utilizada para lograr que los desplazamientos del cursor sean realizados a zonas específicas de interacción de la aplicación de escritorio. La interfaz es programada totalmente en Python 3.6 utilizando bibliotecas de código abierto y se ejecuta en segundo plano dentro del sistema operativo Windows. El desempeño de la interfaz se evalúa con videos de personas utilizando cuatro comandos de interacción con la aplicación WhatsApp versión de escritorio. Se encontró que la interfaz puede operar con varios tipos de iluminación, fondos, distancias a la cámara, posturas y velocidades de movimiento; la ubicación y el tamaño de la ventana de WhatsApp no afecta la efectividad de la interfaz. La interfaz opera a una velocidad de 1 Hz y utiliza el 35 % de la capacidad de un procesador Intel Core i5 y 1,5 GB de RAM para su ejecución lo que permite concebir esta solución en equipos de cómputo personales

    Software de comunicación para personas con parálisis cerebral

    Get PDF
    El objetivo de este Trabajo de Fin de Grado es la creación de un software para la comunicación de personas con discapacidad exclusivamente motriz, incluyendo el habla, pero sin tener afectada la cognición; concretamente va dirigido a un niño que padece una parálisis cerebral. Dicho software se ha desarrollado en dos programas separados. El primero es un software de seguimiento de pupila basado en la tecnología de EyeTracking, para lo que se usa un ratón de mirada proporcionado por un programa ya existente. La aportación en este apartado ha sido crear una interfaz, como capa superior, mediante botones que ejecutan las acciones correspondientes a seleccionar el método de comunicación y las opciones correspondientes a cada método que ofrece el sistema. Nuestro niño, Moisés, sufre disponía, lo que implica fluctuación ene el tono muscular, unas veces hipertónico y otras hipotónico en distintas partes de su cuerpo, afectándole a la sujeción de la cabeza. Por ese motivo se ha desarrollado un segundo programa que funciona con ratón y teclado, al cual se le ha añadido un pulsador. Incluye un menú para seleccionar distintas formas de comunicación. Las opciones de este menú se le ofrecen al usuario de forma secuencial ya que solo podrá comunicarse con el sistemas mediante clicks de ratón o pulsaciones de teclado. En España la empresa Vía Libre de la fundación ONCE vende materiales ortopédicos y de comunicación, todos con licencia de uso, como el usado por Stephen Hawking, no asequibles a familias que ya tienen gastos en sillas, adaptadores, y material ortopédico. Este segundo programa ha sido probado y modificado según las principales necesidades de comunicación de Moisés, es de código abierto y puede ser descargable desde https://sourceforge.net/p/clickspeak

    Detección de malezas mediante el análisis de imágenes tomadas desde un vehículo aéreo no tripulado

    Get PDF
    En este trabajo se propone un método para la detección de malezas en imágenes aéreas de campos agrícolas. Las imágenes fueron obtenidas desde un vehículo aéreo no tripulado con una cámara RGB en un campo de frijol. El objetivo final fue la obtención de un mapa georeferenciado de densidad de malezas a partir de las imágenes obtenidas. El método propuesto consiste en cuatro pasos principales: 1) segmentación de la vegetación, 2) estimación de la orientación media de las filas de cultivos, 3) identificación de las filas de cultivo, y 4) segmentación de las malezas y generación del mapa de densidad de malezas. La detección de malezas se llevó a cabo de manera completamente autónoma, empleando un árbol de decisión como algoritmo de clasificación en la etapa final, pero sin requerir la selección manual de muestras para el entrenamiento. Los resultados obtenidos en la evaluación del desempeño del método propuesto fueron satisfactorios. El modelo de regresión lineal entre las densidades de maleza estimadas y observadas arrojó un coeficiente de determinación de 0.987 y un error cuadrático medio de 0.075. Del ´area total del campo de estudio, se estimó un 84% con menos del 1% de cobertura malezas, lo cual indica un alto potencial para la reducción del volumen de herbicidas aplicados

    Portuguese sign language recognition via computer vision and depth sensor

    Get PDF
    Sign languages are used worldwide by a multitude of individuals. They are mostly used by the deaf communities and their teachers, or people associated with them by ties of friendship or family. Speakers are a minority of citizens, often segregated, and over the years not much attention has been given to this form of communication, even by the scientific community. In fact, in Computer Science there is some, but limited, research and development in this area. In the particular case of sign Portuguese Sign Language-PSL that fact is more evident and, to our knowledge there isn’t yet an efficient system to perform the automatic recognition of PSL signs. With the advent and wide spreading of devices such as depth sensors, there are new possibilities to address this problem. In this thesis, we have specified, developed, tested and preliminary evaluated, solutions that we think will bring valuable contributions to the problem of Automatic Gesture Recognition, applied to Sign Languages, such as the case of Portuguese Sign Language. In the context of this work, Computer Vision techniques were adapted to the case of Depth Sensors. A proper gesture taxonomy for this problem was proposed, and techniques for feature extraction, representation, storing and classification were presented. Two novel algorithms to solve the problem of real-time recognition of isolated static poses were specified, developed, tested and evaluated. Two other algorithms for isolated dynamic movements for gesture recognition (one of them novel), have been also specified, developed, tested and evaluated. Analyzed results compare well with the literature.As Línguas Gestuais são utilizadas em todo o Mundo por uma imensidão de indivíduos. Trata-se na sua grande maioria de surdos e/ou mudos, ou pessoas a eles associados por laços familiares de amizade ou professores de Língua Gestual. Tratando-se de uma minoria, muitas vezes segregada, não tem vindo a ser dada ao longo dos anos pela comunidade científica, a devida atenção a esta forma de comunicação. Na área das Ciências da Computação existem alguns, mas poucos trabalhos de investigação e desenvolvimento. No caso particular da Língua Gestual Portuguesa - LGP esse facto é ainda mais evidente não sendo nosso conhecimento a existência de um sistema eficaz e efetivo para fazer o reconhecimento automático de gestos da LGP. Com o aparecimento ou massificação de dispositivos, tais como sensores de profundidade, surgem novas possibilidades para abordar este problema. Nesta tese, foram especificadas, desenvolvidas, testadas e efectuada a avaliação preliminar de soluções que acreditamos que trarão valiosas contribuições para o problema do Reconhecimento Automático de Gestos, aplicado às Línguas Gestuais, como é o caso da Língua Gestual Portuguesa. Foram adaptadas técnicas de Visão por Computador ao caso dos Sensores de Profundidade. Foi proposta uma taxonomia adequada ao problema, e apresentadas técnicas para a extração, representação e armazenamento de características. Foram especificados, desenvolvidos, testados e avaliados dois algoritmos para resolver o problema do reconhecimento em tempo real de poses estáticas isoladas. Foram também especificados, desenvolvidos, testados e avaliados outros dois algoritmos para o Reconhecimento de Movimentos Dinâmicos Isolados de Gestos(um deles novo).Os resultados analisados são comparáveis à literatura.Las lenguas de Signos se utilizan en todo el Mundo por una multitud de personas. En su mayoría son personas sordas y/o mudas, o personas asociadas con ellos por vínculos de amistad o familiares y profesores de Lengua de Signos. Es una minoría de personas, a menudo segregadas, y no se ha dado en los últimos años por la comunidad científica, la atención debida a esta forma de comunicación. En el área de Ciencias de la Computación hay alguna pero poca investigación y desarrollo. En el caso particular de la Lengua de Signos Portuguesa - LSP, no es de nuestro conocimiento la existencia de un sistema eficiente y eficaz para el reconocimiento automático. Con la llegada en masa de dispositivos tales como Sensores de Profundidad, hay nuevas posibilidades para abordar el problema del Reconocimiento de Gestos. En esta tesis se han especificado, desarrollado, probado y hecha una evaluación preliminar de soluciones, aplicada a las Lenguas de Signos como el caso de la Lengua de Signos Portuguesa - LSP. Se han adaptado las técnicas de Visión por Ordenador para el caso de los Sensores de Profundidad. Se propone una taxonomía apropiada para el problema y se presentan técnicas para la extracción, representación y el almacenamiento de características. Se desarrollaran, probaran, compararan y analizan los resultados de dos nuevos algoritmos para resolver el problema del Reconocimiento Aislado y Estático de Posturas. Otros dos algoritmos (uno de ellos nuevo) fueran también desarrollados, probados, comparados y analizados los resultados, para el Reconocimiento de Movimientos Dinámicos Aislados de los Gestos

    Determinación de distancia de seguridad en aglomeraciones de personas

    Get PDF
    Desarrollar un sistema de conteo de personas en multitud es utilizando un método de aprendizaje por computadora, bajo una plataforma de software libre.El principal objetivo de este proyecto es desarrollar un software basado en visión artificial para identificar el número de peatones y distinguir la distancia de seguridad en veredas, parques o salones. De la imagen se extraerá algunas características, tales como el número de personas, la posición relativa para posteriormente calcular la distancia de las personas entre sí. La información del entorno se puede conseguir gracias a la ayuda de una cámara. Para evaluar el correcto funcionamiento del algoritmo se utilizó una base de datos con imágenes diferentes al que se utilizó para entrenar. Para comenzar el proyecto se estudió las diferentes técnicas existentes de visión artificial sobre la identificación de multitudes de peatones, para estar informado de los nuevos y últimos avances que existe. Posteriormente se eligió que camino sería el más adecuado para culminar con éxito el desarrollo del proyecto. Luego de haber elegido el método a seguir, se realizó un filtrado y acondicionamiento de la imagen para eliminar el ruido y otros factores que provoca falsos positivos en la imagen. Finalmente, al obtener el reconocimiento correcto de los peatones, se calcula los centros de masa de estos para conocer la posición relativa. Y calcular las distancias de seguridad correcta entre sí, además, con los datos obtenidos de este algoritmo se podría utilizar para implementar en otros proyectos que necesiten identificar o detectar personas.Ingenierí

    Sentinel: help system for visual pathologies derived from eye fatigue

    Get PDF
    Trabajo de Fin de Grado en Ingeniería Informática, Facultad de Informática UCM, Departamento de Arquitectura de Computadores y Automática, Curso 2019/2020.Este trabajo tiene como objetivo final conseguir detectar el parpadeo incompleto y relacionarlo con patologías. En un principio se pensó en utilizar varios sensores en una misma montura, pero esta idea se descartó al ser demasiado pesada y poco fiable. Seguidamente, se pensó en utilizar un sensor infrarrojo para aprovechar el efecto Doppler de interferencia de ondas para determinar mejor el parpadeo. Para ello, se optó por reducir la montura para sólo detectar bien los párpados y poner un sensor infrarrojo en la parte inferior de la misma. Con este proyecto se quiere prediagnosticar las siguientes patologías: Conjuntivitis alérgica. Ojo seco. Patologías relacionadas con la fatiga ocular. Para llegar al proyecto final se pasaron por cuatro fases. La primera fase fue la creación de la montura, ya que, como dicho anteriormente no se concedió como en la fase final. Seguidamente, se pensó como realizar el guardado de los datos. Primero se pensó realizar de manera offline, pero esa idea fue desechada a quedar expuestos los datos. Por lo que se decidió guardar en una nube tipo AWS o ThingSpeak, ya que, se podría actualizar los datos y dar un informe en tiempo real. Finalmente, se tiene pensado aplicar este proyecto en el prediagnóstico de la medicina y de la optometría.This work aims to finally detect the incomplete flicker and relate it to pathologies. Initially it was thought to use several sensors in the same frame, but this idea was dismissed as it was too heavy and unreliable. Next, it was thought to use an infrared sensor to take advantage of the Doppler effect of wave interference to better determine flicker. To do this, it was chosen to reduce the frame to only detect the eyelids well and put an infrared sensor on the bottom of it. With this project you want to prediagnose the following pathologies: Allergic conjuntivitis. Dry eye. Pathologies linked to the ocular fatigue. To reach the final project they went through four phases. The first phase was the creation of the mount, since, as stated above it was not granted as in the final phase. Next, it was thought like saving the data. First it was thought to perform offline, but that idea was dismissed to be exposed the data. So it was decided to save to an AWS or ThingSpeak-like cloud, because you could update the data and report in real time. Finally, it is planned to apply this project in the pre-diagnosis of medicine and optometryDepto. de Arquitectura de Computadores y AutomáticaFac. de InformáticaTRUEunpu

    Conteo de personas mediante videocámaras

    Get PDF
    El conteo automatizado de personas es una tarea utilizada principalmente en plazas comerciales, lugares muy concurridos y cerrados, pues las aglomeraciones pueden ser difíciles de manejar, por lo que es necesario realizar una estimación del número de personas que hay para actuar de acuerdo a las circunstancias. Aunque en la actualidad existen sistemas especializados para esta tarea, se requiere de un gasto adicional para la adquisición del equipo, por ello se propone la utilización de cámaras de video, pues en la mayoría de los lugares donde se requiere tener un estimado del número de personas, ya cuenta con cámaras de vigilancia. En este trabajo se propone un sistema de conteo de personas con videocámaras para video secuencias con flujo peatonal moderado. En el módulo de detección de personas se ha utilizado el método de detección de rostros de Viola-Jones. Por otro lado, para realizar el conteo de una persona a la salida de la video secuencia, se utiliza el Filtro de Kalman. Además, se propone un método de asociación de datos para casos de múltiples rostros o problemas de oclusión. Los resultados son favorables ya que se obtuvo hasta un 92 % de aciertos durante el conteo. En el análisis ROC del seguimiento se obtuvo una precisión de hasta 0.92, una razón de verdaderos positivos de 0.9379 y una razón de falsos positivos de 0.1524. Este proyecto ha sido presentado en el congreso internacional First North American Meeting On Industrial And Applied Mathematics, Oaxaca, Méx., 2010 y en el XLIV Congreso Nacional De La Sociedad Matemática Mexicana, San Luis Potosí, Méx., 2011

    Metodología para el análisis y desarrollo de un sistema de información basado en imágen : un caso práctico de implementación en un servicio de hemodinámica

    Get PDF
    [Resumen] Las patologías asociadas al corazón constituyen uno de los mayores problemas de salud en el mundo occidental, De entre ellas, la oclusión coronaria es una de las enfermedades de mayor relevancia, debido a su índice de mortalidad y morbilidad. Ante síntomas evidentes de problemas cardiovasculares, la técnica de diagnóstico más utilizada es la angiografía. Dicho estudio permite al clínico observar el flujo sanguíneo en las arterias coronarias, detectando los estrechamientos acusados o "estenosis". En función de la severidad, extensión y ubicación de las estenosis, el clínico realiza el diagnóstico del paciente, define un tratamiento y establece el pronóstico de la enfermedad. Actualmente, los clínicos observan las secuencias de imágenes y, en función de su conocimiento empírico, toman las decisiones oportunas. La implantación de la radiología digital, la información asociada a los pacientes, el creciente número de estudios de imagen que se realizan y la necesidad de disponer de un acceso rápido y eficaz a esta información de forma ubicua ha puesto de manifiesto la importancia de los sistemas de información en el ámbito clínico, como pueden ser los Sistemas de Archivo y Comunicación de Imágenes Médicas. En este trabajo, se presenta un sistema de información de apoyo a la toma de decisión clínica de cardiopatías basado en estudios de angiografía

    Desarrollo de un sistema avanzado de asistencia a la conducción en tiempo real para la detección de peatones en entornos urbanos complejos

    Get PDF
    Hoy en día, todavía son muchas las personas que pierden la vida en accidentes de tráfico. A pesar de que los vehículos que se desarrollan ahora son mucho más seguros que los que se fabricaban en un principio, también son más rápidos y más numerosos. Los nuevos sistemas de seguridad van más allá de la implantación de materiales que absorban mejor los impactos o componentes que reduzcan las lesiones de los ocupantes del vehículo producidas durante el accidente. En la actualidad, los ingenieros de la industria automovilística tratan de evitar que se produzcan estos accidentes. El presente proyecto se centra en proteger a los peatones de las vías urbanas, pues son los mayores afectados en los accidentes producidos en este tipo de carreteras. El objetivo es diseñar un algoritmo basado en la visión estéreo capaz de detectar a los usuarios de vías urbanas complejas de forma rápida y precisa de tal forma que el conductor tenga constancia en todo momento de los peatones que se encuentran delante de su vehículo. La técnica que se va a utilizar para la localización de los peatones se basa en los histogramas de gradientes orientados (HOG). Se trata de un método que ofrece resultados robustos gracias a su invariancia ante cambios en la iluminación, en el fondo o en las posturas de los peatones. Mediante una serie de operaciones previas se busca conseguir que esta detección se realice en tiempo real. Es necesario realizar un estudio de los distintos parámetros del sistema para alcanzar buenos resultados tanto en el tiempo de cómputo del algoritmo como en la eficacia de la detección. Para el desarrollo del algoritmo se recurre a las librerías OpenCV, muy útiles para el procesamiento de imágenes y la visión artificial. __________________________________________________________________________________________________________________Nowadays, there are still many people who lose their lives in crash accidents. Although modern vehicles are safer than older ones, they are faster and more numerous. New security systems go further than only the introduction of materials that could better absorb the impacts or components that can reduce injuries to the passengers of the vehicle during an accident. The aim of this project is to protect pedestrians in urban roads, because they are the most affected people in accidents that occur in this kind of roads. An algorithm has been designed based on stereovision, which is able to detect people walking in complex urban roads in a quick and precise manner, so the driver can be aware at every moment of the pedestrians that are in front of his or her vehicle. The technic used to locate pedestrians is based on Histograms of Orientated Gradients. This method offers strong results thanks to its invariance with light changes, backgrounds or the pedestrians postures. By means of some previous operations, detection will be in real time. It is necessary to make a survey of the different parameters of the system to get good results, as much in the algorithm calculation time as in the efficacy of detection. The OpenCV libraries has been used to develop the algorithm, as they are very useful for processing images and artificial vision.Ingeniería Industria
    corecore