7 research outputs found

    Detection of severe obstructive sleep apnea through voice analysis

    Get PDF
    tThis paper deals with the potential and limitations of using voice and speech processing to detect Obstruc-tive Sleep Apnea (OSA). An extensive body of voice features has been extracted from patients whopresent various degrees of OSA as well as healthy controls. We analyse the utility of a reduced set offeatures for detecting OSA. We apply various feature selection and reduction schemes (statistical rank-ing, Genetic Algorithms, PCA, LDA) and compare various classifiers (Bayesian Classifiers, kNN, SupportVector Machines, neural networks, Adaboost). S-fold crossvalidation performed on 248 subjects showsthat in the extreme cases (that is, 127 controls and 121 patients with severe OSA) voice alone is able todiscriminate quite well between the presence and absence of OSA. However, this is not the case withmild OSA and healthy snoring patients where voice seems to play a secondary role. We found that thebest classification schemes are achieved using a Genetic Algorithm for feature selection/reduction

    A Preliminary Review of Behavioural Biometrics for Health Monitoring in the Elderly

    Get PDF
    This article explores the potential of ICT-based biometrics for monitoring the health status of the elderly people. It departs from specific ageing and biometric traits to then focus on behavioural biometric traits like handwriting, speech and gait to finally explore their practical application in health monitoring of elderly

    Classification techniques on computerized systems to predict and/or to detect Apnea: A systematic review

    Get PDF
    Sleep apnea syndrome (SAS), which can significantly decrease the quality of life is associated with a major risk factor of health implications such as increased cardiovascular disease, sudden death, depression, irritability, hypertension, and learning difficulties. Thus, it is relevant and timely to present a systematic review describing significant applications in the framework of computational intelligence-based SAS, including its performance, beneficial and challenging effects, and modeling for the decision-making on multiple scenarios.info:eu-repo/semantics/publishedVersio

    Análisis y estudio de ronquidos para la detección de trastronos respiratorios durante el sueño

    Full text link
    El Síndrome de Apnea-Hipoapnea del Sueño (SAHS) es un trastorno bastante común, con una prevalencia del 2% al 7% de la población. Se estima que el 90% de los enfermos no están diagnosticados, ya que la prueba diagnóstica de Polisomnografía es cara y limitada por el número de camas disponibles en la Unidad del Sueño de los Hospitales. El SAHS presenta un alto impacto social y económico debido a la falta de un descanso adecuado durante el sueño que produce estados de somnolencia durante la vigilia que pueden provocar descenso en la productividad en el trabajo y accidentes en el manejo de maquinaria y vehículos. Así mismo, la situación de hipoxia durante el sueño puede inducir diversas enfermedades circulatorias, neurocognitivas y metabólicas en función de su severidad. Por lo tanto, el poder disponer de un sistema de recomendación de diagnóstico de SAHS de bajo coste, sencillo y que alcance a un gran porcentaje de la población sería de gran utilidad para los Servicios Médicos implicados en el diagnóstico y tratamiento del SAHS. En este Trabajo de Fin de Máster se ha propuesto un método de análisis de los sonidos respiratorios durante el sueño (silencio – respiración – ronquido), registrados fuera de un entorno controlado de laboratorio. Los registros nocturnos fueron realizados por voluntarios en sus domicilios, utilizando sus propios Smartphones o un grabador MP3, sin supervisión directa. De los registros nocturnos, se extrajeron segmentos de audio con los sonidos de actividad respiratoria que contuvieran poco ruido de fondo (ruidos de vehículos, conversaciones, cantos de pájaros, sonidos de mecanismos), siempre que fuera posible. Estos segmentos se dividieron a su vez en ventanas de 100 ms, que fueron clasificadas manualmente en tres clases: Silencio – Respiración – Ronquido. Así mismo, para cada ventana se extrajeron cuatro características a partir de la señal de audio: Zero Crossing Rate, Short Time Energy, Coeficiente de autocorrelación normalizado a 1 ms de retardo y Primer Coeficiente predictor de análisis LPC (Linear Prediction Coding) de 12 polos. Se ha diseñado un método para calcular una recomendación de diagnóstico de SAHS basado en las cuatro características de audio expuestas. Se han evaluado distintos métodos de clasificación, buscando el que mejor rendimiento ofreciera en este problema de clasificación. En este caso, un modelo de RandomForest aplicado a las características extraídas de la señal de audio de los registros nocturnos proporciona una clasificación correcta del diagnóstico SAHS / No-SAHS del 97.33%, con una sensibilidad del 0.973, una especificidad de 0.973 y una AUC (área bajo la curva ROC) de 0.996. Así mismo, las características de audio registradas permiten una clasificación on-line de los eventos respiratorios, ya sean Respiración/Silencio/Ronquido, o No-ronquido/Ronquido. En ambos casos, el modelo de clasificación con mejor rendimiento de los evaluados es RandomForest. La clasificación correcta de Respiración/Silencio/ronquido se produce con un 85.26% de éxito, con una sensibilidad de 0.853, una especificidad de 0.892 y una AUC de 0.944. La clasificación correcta en Ronquido/No-ronquido se produce con un 92.84% de éxito, una sensibilidad de 0.928, una especificidad de 0.859 y AUC de 0.959. Adicionalmente, se ha comprobado que la incorporación de datos biométricos de los voluntarios recogidos mediante formularios STOP-BANG al modelo de clasificación mejora los resultados. En la clasificación de eventos respiratorios Respiración/Silencio/Ronquido se obtiene un 87.09% de éxito con una sensibilidad de 0.871, una especificidad de 0.903 y AUC de 0.953 al añadir el peso, altura y edad del voluntario. En la clasificación de eventos Noronquido/ Ronquido, se mejora la clasificación con RandomForest hasta un 93.54% de éxito, con especificidad de 0.935, sensibilidad de 0.867 y AUC de 0.962 al añadir también peso, altura y edad. Respecto a la clasificación de diagnóstico SAHS/No-SAHS, usando RandomForest de obtiene un 97.95% de éxito, con sensibilidad de 0.98, especificidad de 0.979 y AUC de 0.997 al añadir el género del paciente. Debido al bajo número de voluntarios (7), no se pudieron evaluar todos los datos biométricos recogidos, por lo que habrá que seguir estudiando su aporte en futuros trabajos cuando se disponga de una población de experimentación mayor. Los resultados de diagnóstico de SAHS constituyen un primer paso para el desarrollo futuro de una aplicación de Smartphone que puede ser distribuida como una herramienta de cribado entre la población, de manera que analice los sonidos respiratorios durante el sueño y realice una recomendación de visita al médico especialista si se calcula una alta probabilidad de sufrir SAHS. Los resultados de la clasificación de eventos respiratorios abren la puerta a desarrollar sistemas que estimulen al usuario cuando ronca para intentar evitar que se produzca este hecho. Algunos tipos de apneas son posicionales (se ronca en posición supino), por lo que se podría estimular al paciente cuando ronca para que realizara un cambio de postura a una lateral o prono. Actualmente se realiza con métodos físicos, como por ejemplo, colocando pelotas de tenis cosidas a lo largo de la espalda en una camiseta y poniéndosela para dormir, pero es rechazada por un elevado número de pacientes por ser incómoda. En las apneas posicionales se podría llegar a eliminar totalmente el problema manteniendo la postura adecuada. Todos los datos recogidos y generados a lo largo de este TFM, se incorporaron a una base de datos relacional diseñada exprofeso. El motor de base de datos elegido es PostgreSQL 9.4. Se decidió crear una base de datos con los siguientes objetivos: • Almacenamiento de los datos y resultados de una forma estructurada • Automatización de la entrada de datos y su validación • Posibilitar la carga de datos desde la futura aplicación que se desarrolle para dispositivos móviles • Acceso concurrente a los datos por distintos investigadores • Facilitar el manejo de los datos y su extracción para la realización de análisis • Facilitar la incorporación de nuevos métodos de análisis de la señal de audio y nuevos atributos o características en el futuro • Posibilidad de escalado del sistema en el futuro • Facilitar la copia de seguridad de los datos • Controlar los privilegios de acceso a los datos, así como disponer de una auditoria de accesos, para cumplir con los requisitos de la LOPD en cuanto a tratamiento de datos de carácter personal. Se ha implementado la infraestructura necesaria para que todas las herramientas utilizadas en el análisis, transformación y clasificación de los datos obtenidos puedan acceder directamente a la base de datos. Se han desarrollado varios módulos para automatizar los procesos de análisis y transformación de los datos en Matlab®. Para el análisis de los datos se ha utilizado la herramienta WEKA. Por último, para la validación de los métodos y resultados obtenidos para su aplicación clínica, y la generación automática de patrones de entrenamiento, se han iniciado contactos con diversos hospitales de la Comunidad de Madrid.The Obstructive Sleep Apnea (OSA) is a fairly common sleep disorder, with a prevalence of 2% to 7% of the population. It is estimated that 90% of patients are not diagnosed. The diagnostic test, nocturnal polysomnography (PSG), is expensive and limited by the number of beds available in the Hospital Sleep Unit. OSA has a high social and economic impact due to lack of adequate rest during sleep, thus producing sleepiness states during the vigil that can cause decreased productivity at work and accidents in the handling of machinery and vehicles. Likewise, the situation of hypoxia during sleep can induce various circulatory, neurocognitive and metabolic diseases according to their severity. Therefore, the possibility to have a low cost, simple OSA diagnostic recommendation system, able to reach a large percentage of the population, would be useful for medical services involved in the diagnosis and treatment of OSA. This Master Thesis proposes a method for analyzing breath sounds during sleep (silent - breathing - snoring), recorded outside of a controlled laboratory environment in order to make a recommendation of OSA diagnostic. Night recordings were conducted by volunteers at their homes, using their own smartphones or a MP3 recorder, without direct supervision. Audio segments containing the desired sounds were extracted, trying that segment contained few background sounds (noise of cars, conversations, bird songs, sounds of mechanisms), whenever possible. These segments were divided in turn in 100 ms windows, which were manually classified into three classes: Silence - Breathing – Snore. Also, for each window, four features were calculated from the extracted audio signal: Zero Crossing Rate, Short Time Energy, autocorrelation coefficient normalized to 1 ms delay, and first predictor coefficient of LPC (Linear Prediction Coding) analysis with 12 poles. To issue a recommendation for OSA diagnosis, a method for analyzing the audio signal based on the four described audio features has been developed. Different classification methods were evaluated, seeking to offer the best performance in this problem. A RandomForest model applied to features extracted from the audio signal of nocturnal records allowed a correct classification of OSA / No-OSA of 97.33% with a sensitivity of 0.973, specificity of 0.973 and an AUC (area under the curve) of 0.996. The registered audio features allow online classification of respiratory events, whether Breathing / Silence / Snore, or Non-snore / Snore. In both cases, the classification model with the best performance is a RandomForest. The correct classification of Breathing / Silence / Snore occurs with 85.26% success rate, with a sensitivity of 0.853, specificity of 0.892 and an AUC of 0.944. The classification into Snore / Non-snore occurs with 92.84% success rate, sensitivity of 0.928, specificity of 0.859 and AUC of 0.959. Additionally, the inclusion of volunteers’ biometric data collected through STOP-BANG forms to the classification improved the results. Classification of respiratory events Breathing / Silence / Snore improves to 87.09% of success rate, with sensitivity of 0.871, specificity of 0.903 and AUC of 0.953 by adding the weight, height and age of the volunteer. In the classification of events Non-Snore / Snore, the RandomForest classification improves to a 93.54% success rate, with specificity of 0.935, sensitivity of 0.867 and 0.962 AUC also by adding weight, height and age. Regarding the OSA diagnostic classification on OSA / No-OSA, the RandomForest improves to 97.95% success rate, with sensitivity of 0.98, specificity of 0.979 and 0.997 AUC by adding the gender of the volunteer. Due to the low number of volunteers (7), we were unable to evaluate all collected biometric data, so we will have to continue studying their contribution in future works, when a larger experimentation population will be available. Results from diagnosis of OSA allow the future development of a Smartphone application that could be distributed as a screening tool among the population to analyze respiratory sounds and issue a recommendation to visit the doctor if a high probability of suffering OSA is estimated. The results from the classification of respiratory events open the door to develop systems that deliver stimuli to the user to try to prevent snoring. Some types of apnea are positional (snoring is produced in supine position). It is possible to stimulate the patient when snoring to conduct a change to a lateral or prone posture. Currently this is done with physical methods, such as placing tennis balls sewn on the back in a shirt. However, this is discarded by a large number of patients because it is uncomfortable. Positional apnea can be fully eliminated by maintaining proper posture. All data collected and generated during this TFM were incorporated into a relational database designed ad-hoc. The chosen database engine is PostgreSQL 9.4. The data base was designed with the following requirements: • Storage of data and results is done in a structured way • Automating data entry and validation is automatized • The system will facilitate the loading of data from the future application that will be developed for mobile devices • Concurrent access to data by different researchers • The system facilitates data management and extraction for the analysis • The system allows the introduction of new methods of analysis of the audio signal and new attributes or features in the future. • Possibility of scaling the system in the future • The system allows backup of data • The system incorporates access control privileges to data and have access audit, to meet the requirements of the Data Protection Act regarding treatment of personal data. All necessary infrastructure was implemented to allow the direct access of the database by the tools used in the analysis, processing and classification of data Several modules have been developed in Matlab® to automate the analysis process and data transformation. WEKA was used for data analysis. Finally, to validate the methods and results for clinical application, we have initiated contacts with various hospitals at Comunidad de Madrid

    Procesos cognitivos y afectivos en adultos mayores medidos por medio del habla

    Get PDF
    Tesis por compendio de publicaciones[ES] El análisis automático del habla es una técnica que permite extraer información lingüística objetivamente de la señal de sonido emitida al hablar. En la producción de habla se interrelacionan numerosos sistemas para seleccionar y planificar el mensaje, dotarlo de una estructura adecuada, y enviar las señales neuromusculares a los órganos implicados en la producción del sonido. Estos procesos determinan las características de la onda sonora que se emite, de modo que el análisis del habla ha sido utilizado para detectar diversas alteraciones que afectan a estos sistemas lingüísticos como son la demencia tipo Alzheimer y el deterioro cognitivo leve. Esta tesis indaga sobre cómo se alteran los parámetros del habla en adultos mayores afectados por diferentes deterioros cognitivos y/o afectivos. Podemos distinguir en este trabajo dos fases: En la primera se llevan a cabo dos estudios con el objetivo de hallar factores cognitivos previos a los cambios en el habla durante el proceso de envejecimiento. En la segunda, se realizan cuatro estudios que tratan de obtener combinaciones de parámetros del habla susceptibles de ser utilizados como algoritmos en la detección de varios trastornos mediante la manipulación del proceso utilizado para elicitar habla. En el primer estudio se concluye que diversos parámetros del habla relacionados con la duración, el ritmo, las frecuencias y el análisis espectral, sufren cambios que se relacionan con el estado cognitivo general y que de hecho podrían ser sensibles a varias etapas de un deterioro. En el segundo, se examina si esos parámetros se explican mediante procesos cognitivos específicos, encontrando una relación con el acceso lingüístico a la memoria semántica, al léxico y la función ejecutiva. A continuación, los resultados demuestran que dentro de las personas con deterioro cognitivo leve podría haber perfiles de habla correspondientes a aquellos cuya causa subyacente es la Enfermedad de Alzheimer, y que podrían ser identificados a través de medidas del ritmo del habla. Se han utilizado dos tareas, una de lectura y otra de fluidez verbal, que permitan por medio del análisis del habla detectar con un nivel de éxito aceptable a personas con deterioro cognitivo leve y/o Alzheimer. Finalmente, se trató de extender el método del análisis del habla a la detección de depresión en mayores como un primer paso hacia el diagnóstico diferencial de depresión y demencia. [EN] Automatic speech analysis is a technique that allows linguistic information to be extracted objectively from the sound signal emitted during the act of speaking. Numerous systems are interrelated in speech production to select and plan the message, provide it with an appropriate structure, and send the neuromuscular signals to the organs involved in sound production. These processes determine the characteristics of the sound wave that is emitted, thus, speech analysis has been used to detect various disorders involving these systems, such as Alzheimer's dementia and mild cognitive impairment. This thesis investigates the alteration of speech parameters in older adults affected by cognitive and/or affective impairments. We can distinguish two phases in this work. In the first one, two studies are carried out with the aim of finding cognitive factors of speech changes during the aging process. In the second, four studies are carried out in an attempt to obtain combinations of speech parameters that can be used as algorithms in the detection of various disorders by manipulating the process used to elicit speech. The first study concludes that various speech parameters related to duration, rhythm, frequencies and spectral analysis undergo changes that are related to general cognitive state and may in fact be sensitive to various stages of impairment. In the second, we examine whether these parameters are explained by specific cognitive processes, finding a relationship with linguistic access to semantic memory, lexicon and executive function. Next, the results show that within people with mild cognitive impairment there could be speech profiles corresponding to those whose underlying cause is Alzheimer's disease and that could be identified through measures of rhythm. Two tasks, reading and verbal fluency, are proposed. Speech analysis on these tasks can be used with an acceptable level of success to detect people with mild cognitive impairment and/or Alzheimer's disease. Finally, an attempt was made to extend the method to the detection of depression in older adults as a first step towards the differential diagnosis of depression and dementia
    corecore