4 research outputs found

    DISCRETE S-TRANSFORM BASED SPEECH ENHANCEMENT

    Get PDF

    Técnicas de detecção da frequência fundamental da voz em entornos reais

    Get PDF
    Introduction: This review article was prepared as part of a graduate thesis at Universidad del Cauca in 2017. It sought to find the most appropriate methods for detecting voice fundamental frequency to be implemented in real environments. This is part of a solution to improve the communication of people with hearing disabilities and include them in society, since most of the proposals only aim to improve the communication channel in which the hearing-impaired individual is the transmitter. Methodology: An updated review of the literature was carried out, based mainly on scientific articles published in the last five years.  For the inclusion of articles, a systematic mapping was performed on the different methods for detecting voice fundamental frequency. Results: the phenomena considered by the various algorithms to define the environment range from noise and interference to reverberation; the performance of the algorithm depends on the quality of the recorded audio, which is observed in the variations obtained which depend on the database used; up to two different fundamental frequencies can be detected. Conclusions: Novel methods have been implemented to make the detection of voice fundamental frequency more efficient; however, there is still much work to be done in this area.Introducción: este artículo de revisión se desarrolló como parte de un trabajo de maestría de la Universidad del Cauca en el 2017. Buscó encontrar los métodos de detección de la frecuencia fundamental de la voz más propicios para implementar en entornos reales como parte de una solución para mejorar la comunicación de las personas con discapacidad auditiva e incluirlas en la sociedad, ya que la mayoría de las propuestas solo plantean mejorar el canal de comunicación en el que la persona con discapacidad auditiva es el transmisor. Metodología: se realizó una revisión actualizada de la literatura, por lo que se basó principalmente en artículos científicos publicados en los últimos cinco años. Para la inclusión de artículos se hizo un mapeo sistemático sobre los diferentes métodos de detección de la frecuencia fundamental de la voz. Resultados: los fenómenos contemplados por los diferentes algoritmos para definir el entorno van desde el ruido y la interferencia hasta la reverberación; el desempeño del algoritmo depende de la calidad del audio grabado, lo que se ve en las variaciones obtenidas que dependen de la base de datos utilizada; se pueden detectar hasta dos frecuencias fundamentales diferentes. Conclusiones: se han implementado novedosos métodos para hacer más eficiente la detección de la frecuencia fundamental de la voz; sin embargo, aún queda mucho trabajo por hacer en esta área.Introdução: o artigo de revisão foi desenvolvido como parte de um trabalho de mestrado da Universidade de Cauca em 2017. Buscou-se encontrar os métodos de detecção da frequência fundamental da voz mais propícios para implementar em entornos reais como parte de uma solução para melhorar a comunicação das pessoas com deficiência auditiva e incluí-las na sociedade, já que a maioria das propostas enfocam apenas em melhorar o canal de comunicação no qual a pessoa com deficiência auditiva é o transmissor. Metodologia: é realizada uma revisão atualizada da literatura, baseada principalmente em artigos científicos publicados nos últimos cinco anos. Para a inclusão de artigos, foi feito um mapeamento sistemático sobre os diferentes métodos de detecção da frequência fundamental da voz. Resultados: mostram que os fenômenos contemplados pelos diferentes algoritmos para definir o entorno vão desde o ruído e a interferência até a reverberação; o desempenho do algoritmo depende da qualidade do áudio gravado, o que se vê refletido nas variações obtidas que dependem da base de dados utilizada; é possível detectar até duas frequências fundamentais diferentes. Conclusões: métodos inovadores foram implementados para tornar a detecção da frequência fundamental da voz mais eficiente; no entanto, ainda há muito trabalho a ser feito nessa área
    corecore