7 research outputs found

    Use of the harmonic phase in synthetic speech detection

    Get PDF
    Special Session paper: recent PhD thesis descriptionThis PhD dissertation was written by Jon Sanchez and supervised by Inma Hernáez and Ibon Saratxaga. It was defended at the University of the Basque Country the 5th of February 2016. The committee members were Dr. Alfonso Ortega Giménez (UniZar), Dr. Daniel Erro Eslava (UPV/EHU) and Dr. Enric Monte Moreno (UPC). The dissertation was awarded a "sobresaliente cum laude” qualification.This work has been partially funded by the Spanish Ministry of Economy and Competitiveness with FEDER support (RESTORE project,TEC2015-67163-C2-1-R) and the Basque Government (ELKAROLA project, KK-2015/00098)

    Use of the harmonic phase in synthetic speech detection

    Get PDF
    Special Session paper: recent PhD thesis descriptionThis PhD dissertation was written by Jon Sanchez and supervised by Inma Hernáez and Ibon Saratxaga. It was defended at the University of the Basque Country the 5th of February 2016. The committee members were Dr. Alfonso Ortega Giménez (UniZar), Dr. Daniel Erro Eslava (UPV/EHU) and Dr. Enric Monte Moreno (UPC). The dissertation was awarded a "sobresaliente cum laude” qualification.This work has been partially funded by the Spanish Ministry of Economy and Competitiveness with FEDER support (RESTORE project,TEC2015-67163-C2-1-R) and the Basque Government (ELKAROLA project, KK-2015/00098)

    Procesamiento, análisis y modelado de señales biomédicas: un enfoque integrador

    Get PDF
    Este proyecto se centra en el estudio, desarrollo y aplicación de técnicas de procesamiento, modelado y análisis de señales que permitan abordar los casos de señales biomédicas. Abordaremos métodos adaptativos de análisis de señales, principalmente la descomposición empírica en modos y sus variantes. Se avanzará en el desarrollo de modelos de las señales relacionadas con el aparato fonador. Se continuará el estudio de modelos en espacio de estados que permiten extraer información sobre el estado instantáneo del tracto vocal y de la fuente glótica. Se estudiará la factibilidad de extraer nuevos parámetros acústicos de utilidad clínica. Investigaremos técnicas y herramientas provenientes de la teoría de la información estudiando medidas basadas en la integral de correlación asistida por ruido y la integral de correlación U, propuestas por nuestro grupo, para la estimación de los invariantes dimensión, entropía y ruido, en sistemas simulados y reales de variadas dimensiones. Finalmente, se continuará con la formación de recursos humanos, a través de la realización de becas postdoctorales y doctorales CONICET, y el fortalecimiento de un grupo de investigación en el área de las TICs en el procesamiento de señales biomédicas, en el contexto del Instituto de Bioinformática y Bioingeniería en vías de creación. ARK/CAICYT: http://id.caicyt.gov.ar/ark:/s22504559/rd18ww2h

    No-estacionariedad, multifractalidad y limpieza de ruido en señales reales

    Get PDF
    Las señales biomédicas, como el electrocardiograma, el electroencefalograma, o la señal de voz, tienen en común características de no estacionariedad y no linealidad. Aunque enmuchas aplicaciones se considera que se trata de señales estacionarias procedentes de sistemas lineales, ésta simplificación constituye una hipótesis de trabajo válida sólo como una aproximación que permite la aplicación de técnicas clásicas deanálisis de señales. Muchos trastornos que afectan a uno o varios órganos pueden ser detectados a través de un correcto análisis de las señales en cuya producción están involucrados. Sin embargo, debe atenderse al hecho de que una señal procedente de un sistema patológico se aleja aún más de las condiciones hipotéticas de estacionariedad y linealidad. Se desprende de esta circunstancia la necesidad de abordar el análisis de las señales biomédicas mediante técnicas no convencionales que permitan su tratamiento en un marco que tenga en cuenta sus características de no estacionariedad y no linealidad. Sobre la base de la experiencia del grupo de trabajo en las áreas del análisis tiempo-frecuencia/escala, análisis y modelado estadístico, análisis multifractal, complejidad y métodos guiados por los datos (adaptativos), a partir de problemas reales se han propuesto y estudiado nuevas técnicas que posibiliten su solución

    Utilización de la fase armónica en la detección de voz sintética.

    Get PDF
    156 p.Los sistemas de verificación de locutor (SV) tienen que enfrentarse a la posibilidad de ser atacados mediante técnicas de spoofing. Hoy en día, las tecnologías de conversión de voces y de síntesis de voz adaptada a locutor han avanzado lo suficiente para poder crear voces que sean capaces de engañar a un sistema SV. En esta tesis se propone un módulo de detección de habla sintética (SSD) que puede utilizarse como complemento a un sistema SV, pero que es capaz de funcionar de manera independiente. Lo conforma un clasificador basado en GMM, dotado de modelos de habla humana y sintética. Cada entrada se compara con ambos, y, si la diferencia de verosimilitudes supera un determinado umbral, se acepta como humana, rechazándose en caso contrario. El sistema desarrollado es independiente de locutor. Para la generación de modelos se utilizarán parámetros RPS. Se propone una técnica para reducir la complejidad del proceso de entrenamiento, evitando generar TTSs adaptados o un conversor de voz para cada locutor. Para ello, como la mayoría de los sistemas de adaptación o síntesis modernos hacen uso de vocoders, se propone transcodificar las señales humanas mediante vocoders para obtener de esta forma sus versiones sintéticas, con las que se generarán los modelos sintéticos del clasificador. Se demostrará que se pueden detectar señales sintéticas detectando que se crearon mediante un vocoder. El rendimiento del sistema prueba en diferentes condiciones: con las propias señales transcodificadas o con ataques TTS. Por último, se plantean estrategias para el entrenamiento de modelos para sistemas SSD
    corecore