59 research outputs found

    Анализ спСктра гласных Π½Π° основС Π½Π΅Ρ€Π°Π²Π½ΠΎΠΌΠ΅Ρ€Π½ΠΎΠΉ психоакустичСской ΡˆΠΊΠ°Π»Ρ‹ эрбов для опрСдСлСния словСсного ударСния

    Get PDF
    The paper presents a possibility to determine the stressed syllable in the word by examining features of the vowel formant structure. Based on the analysis of the array of logatoms the vowel formant structure is identified. The energy characteristics of individual formants of different vowels in one word are compared. Spectrum is split by the vowels psychoacoustic ERB scale. For ease of handling of the material resulting array of partial dispersions is codified. To determine the stressed vowel the resulting array codes are broken on the basis of the stressed/unstressed vowel characteristic and phoneme type. Partial arrays comparison enables to confirm the existence of the stress feature characteristic and identify phonetic features of this phenomenon, existing in the vowel formant structure. The vowel stress characteristic is defined by the vowel formant pattern and can effectively complement the determination of stressed syllables being added to conventional stressed vowel characteristics.РассматриваСтся Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ опрСдСлСния Π² словС ΡƒΠ΄Π°Ρ€Π½ΠΎΠ³ΠΎ слога ΠΏΡƒΡ‚Π΅ΠΌ изучСния особСнностСй Ρ„ΠΎΡ€ΠΌΠ°Π½Ρ‚Π½ΠΎΠΉ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½Ρ‹. На основС Π°Π½Π°Π»ΠΈΠ·Π° массива Π»ΠΎΠ³Π°Ρ‚ΠΎΠΌΠΎΠ² Π²Ρ‹ΡΠ²Π»ΡΡŽΡ‚ΡΡ особСнности Ρ„ΠΎΡ€ΠΌΠ°Π½Ρ‚Π½ΠΎΠΉ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½Ρ‹, ΠΏΡ€ΠΈΡ‡Π΅ΠΌ ΡΡ€Π°Π²Π½ΠΈΠ²Π°ΡŽΡ‚ΡΡ энСргСтичСскиС характСристики ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌΠ°Π½Ρ‚. ΠžΠΏΠΈΡ€Π°ΡΡΡŒ Π½Π° Π΄ΠΎΠΏΡƒΡ‰Π΅Π½ΠΈΠ΅ ΠΎΠ± ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ способа формирования Π΄ΠΈΠΊΡ‚ΠΎΡ€ΠΎΠΌ Ρ€Π΅Ρ‡Π΅Π²ΠΎΠΉ посылки, спСктр гласных разбиваСтся ΠΏΠΎ психоакустичСской шкалС эрбов. Для удобства ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ ΠΌΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»Π° ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΉ массив частичных диспСрсий кодифицируСтся. Для выявлСния ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ° ударности ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΉ массив ΠΊΠΎΠ΄ΠΎΠ² разбиваСтся ΠΏΠΎ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΡƒ гласной ΠΈ ΠΏΠΎ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΡƒ ударности. Π‘Ρ€Π°Π²Π½Π΅Π½ΠΈΠ΅ частичных массивов Π΄Π°Π΅Ρ‚ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΏΠΎΠ΄Ρ‚Π²Π΅Ρ€Π΄ΠΈΡ‚ΡŒ сущСствованиС исслСдуСмого ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ° ударности ΠΈ Π²Ρ‹ΡΠ²ΠΈΡ‚ΡŒ фонСтичСскиС особСнности этого явлСния, ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ Π² Ρ„ΠΎΡ€ΠΌΠ°Π½Ρ‚Π½ΠΎΠΉ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½Π΅. Π‘Π΄Π΅Π»Π°Π½ Π²Ρ‹Π²ΠΎΠ΄ ΠΎ возмоТности примСнСния ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ° ударности ΠΏΠΎ особСнностям Ρ„ΠΎΡ€ΠΌΠ°Π½Ρ‚Π½ΠΎΠΉ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½Ρ‹ гласной ΠΊΠ°ΠΊ эффСктивно Π΄ΠΎΠΏΠΎΠ»Π½ΡΡŽΡ‰Π΅Π³ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ ударности слога Π² словС ΠΏΠΎ ΠΈΠ½Ρ‹ΠΌ общСпринятым ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌ

    A Review: Voice Pathology Classification Using Machine Learning

    Get PDF
    Voice pathology detection requires the presence of a specialist doctor and time to treat each patient, but it is not always possible to have a doctor who can treat all patients at once and at one precise time. For residents of remote areas, it is all expensive equipment that must be provided. Or even for people who may not be aware of having any voice pathology. Our goal is to design a diagnostic aid system to detect whether the voice is pathological or healthy, so that the patient can be referred to a doctor or not without being moved from the start. Our system is based on the classification, by SVM "Support Vector Machine", using MFCCs "Mel Frequency Cepstral Coefficients" extracted from the patient's voice. The learning and testing of our system are done using the SVD database "Saarbruecken Voice Database

    ΠžΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ ΠΏΠ°Ρ‚ΠΎΠ»ΠΎΠ³ΠΈΠΈ голосового Π°ΠΏΠΏΠ°Ρ€Π°Ρ‚Π° Π½Π° основС Π°Π½Π°Π»ΠΈΠ·Π° модуляционного спСктра Ρ€Π΅Ρ‡ΠΈ Π² критичСских полосах

    Get PDF
    ΠŸΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½ ΠΌΠ΅Ρ‚ΠΎΠ΄ опрСдСлСния патологичСских ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠΉ голоса Π½Π° основС Π°Π½Π°Π»ΠΈΠ·Π° модуляционного спСктра Ρ€Π΅Ρ‡Π΅Π²ΠΎΠ³ΠΎ сигнала. ΠœΠΎΠ΄ΡƒΠ»ΡΡ†ΠΈΠΎΠ½Π½Ρ‹ΠΉ спСктр вычисляСтся ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ Π΄Π²ΡƒΡ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… частотно-Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠΉ: ΠΏΠ΅Ρ€Π²ΠΎΠ΅ ΠΏΠ΅Ρ€Π΅Π²ΠΎΠ΄ΠΈΡ‚ сигнал Π² Ρ‡Π°ΡΡ‚ΠΎΡ‚Π½ΡƒΡŽ ΠΎΠ±Π»Π°ΡΡ‚ΡŒ, Π²Ρ‚ΠΎΡ€ΠΎΠ΅ – Π² ΠΌΠΎΠ΄ΡƒΠ»ΡΡ†ΠΈΠΎΠ½Π½ΡƒΡŽ. ΠžΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΡŒΡŽ ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½ΠΎΠ³ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° являСтся использованиС Π½Π΅Ρ€Π°Π²Π½ΠΎΠΌΠ΅Ρ€Π½ΠΎΠ³ΠΎ частотно-Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠ³ΠΎ ΠΏΠ»Π°Π½Π° ΠΏΡ€ΠΈ ΠΏΠ΅Ρ€Π΅Π²ΠΎΠ΄Π΅ сигнала Π² Ρ‡Π°ΡΡ‚ΠΎΡ‚Π½ΡƒΡŽ ΠΎΠ±Π»Π°ΡΡ‚ΡŒ. ΠŸΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½ способ ΠΎΡ†Π΅Π½ΠΊΠΈ модуляционного спСктра, основанный Π½Π° ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΠ°Ρ… антропоморфичСской ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ сигналов, ΠΈΠΌΠΈΡ‚ΠΈΡ€ΡƒΡŽΡ‰ΠΈΠΉ Π½Π΅Ρ€Π°Π²Π½ΠΎΠΌΠ΅Ρ€Π½ΠΎΠ΅ частотно-Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠ΅ Ρ€Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ слуховой систСмы Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°. Использован нСравнополосный Π±Π°Π½ΠΊ Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ² ΠΌΠΎΠ΄ΡƒΠ»ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΉ дискрСтным ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠΉ Π€ΡƒΡ€ΡŒΠ΅, Π°ΠΏΠΏΡ€ΠΎΠΊΡΠΈΠΌΠΈΡ€ΡƒΡŽΡ‰ΠΈΠΉ ΡˆΠΊΠ°Π»Ρƒ критичСских частот ΠΈ ΠΏΠΎΠ²Ρ‹ΡˆΠ°ΡŽΡ‰ΠΈΠΉ Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠ΅ Ρ€Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ Π² ΡˆΠΈΡ€ΠΎΠΊΠΈΡ… полосах. Π‘Π°Π½ΠΊ Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ² ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ Ρ„Π°Π·ΠΎΠ²Ρ‹Π΅ (Π²ΡΠ΅ΠΏΡ€ΠΎΠΏΡƒΡΠΊΠ°ΡŽΡ‰ΠΈΠ΅) звСнья Π² качСствС элСмСнтов Π·Π°Π΄Π΅Ρ€ΠΆΠΊΠΈ, Ρ‡Ρ‚ΠΎ позволяСт ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ Π½Π΅Ρ€Π°Π²Π½ΠΎΠΌΠ΅Ρ€Π½Ρ‹ΠΉ частотно-Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ ΠΏΠ»Π°Π½. Π’Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ΠΎ сравнСниС ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½ΠΎΠ³ΠΎ способа с Π±ΠΎΠ»Π΅Π΅ Ρ‚Ρ€Π°Π΄ΠΈΡ†ΠΈΠΎΠ½Π½Ρ‹ΠΌ способом вычислСния модуляционного спСктра Π² критичСских полосах с фиксированным Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹ΠΌ Ρ€Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ΠΌ. ΠŸΡ€ΠΈΠ²Π΅Π΄Π΅Π½Ρ‹ Π΄Π°Π½Π½Ρ‹Π΅ экспСримСнтов ΠΏΠΎ использованию ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² модуляционного спСктра для опрСдСлСния патологичСских ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠΉ голоса, обусловлСнных: 1) Π±ΠΎΠΊΠΎΠ²Ρ‹ΠΌ амиотрофичСским склСрозом (БАБ); 2) заболСваниями Π³ΠΎΡ€Ρ‚Π°Π½ΠΈ. ΠžΡ‚Π±ΠΎΡ€ ΠΈ Ρ€Π°Π½ΠΆΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² модуляционного спСктра, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½Π½Ρ‹Ρ… Π² качСствС ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² для классификации, Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° LASSO. ΠšΠ»Π°ΡΡΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΡ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π½Π° основС Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠ³ΠΎ дискриминантного Π°Π½Π°Π»ΠΈΠ·Π° обСспСчила Π²Ρ‹ΡΠΎΠΊΡƒΡŽ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ опрСдСлСния ΠΏΠ°Ρ‚ΠΎΠ»ΠΎΠ³ΠΈΠΈ (Π±ΠΎΠ»Π΅Π΅ 97%). ΠŸΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΡΠ²ΠΈΠ΄Π΅Ρ‚Π΅Π»ΡŒΡΡ‚Π²ΡƒΡŽΡ‚ ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ использованиС Π½Π΅Ρ€Π°Π²Π½ΠΎΠΌΠ΅Ρ€Π½ΠΎΠ³ΠΎ частотного-Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠ³ΠΎ ΠΏΠ»Π°Π½Π° являСтся ΠΏΡ€Π΅Π΄ΠΏΠΎΡ‡Ρ‚ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ Π² случаС, ΠΊΠΎΠ³Π΄Π° Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΡƒΠ΅ΠΌΡ‹ΠΉ сигнал являСтся протяТным гласным Π·Π²ΡƒΠΊΠΎΠΌ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ обСспСчиваСт Π±ΠΎΠ»Π΅Π΅ Π²Ρ‹ΡΠΎΠΊΡƒΡŽ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ обнаруТСния ΠΏΠ°Ρ‚ΠΎΠ»ΠΎΠ³ΠΈΠΈ ΠΏΡ€ΠΈ мСньшСм числС модуляционных ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ²

    ΠžΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ ΠΏΠ°Ρ‚ΠΎΠ»ΠΎΠ³ΠΈΠΈ голосового Π°ΠΏΠΏΠ°Ρ€Π°Ρ‚Π° Π½Π° основС Π°Π½Π°Π»ΠΈΠ·Π° модуляционного спСктра Ρ€Π΅Ρ‡ΠΈ Π² критичСских полосах

    Get PDF
    The paper presents an approach to the analysis of the modulation spectrum of a voice signal, in which the primary acoustic analysis is performed in bands of unequal width. Nonuniform analysis corresponds to the psychoacoustic laws of human perception of sound information. In the context of the analysis of the modulation spectrum, the considered approach can significantly reduce the resulting number of parameters, which greatly simplifies the task of detecting pathological changes in the voice signal based on the analysis of the parameters of the modulation spectrum. For frequency decomposition of a signal into bands of unequal width, two methods are considered: 1) DFT with channel combination and 2) the use of an nonuniform filter bank. The first method is characterized by a fixed time window for the analysis of all frequency components, while in the second method the time-frequency analysis plan is consistent with the critical frequency scale of the barks. For each method, a practical signal analysis circuit has been developed and described. The paper presents the experimental data on the application of the developed schemes for the analysis of the modulation spectrum to the problem of detecting pathology in a speech signal. The parameters of the modulation spectrum acted as information signs for a classifier built on the basis of linear discriminant analysis. Three different voice bases were used in the experiment (in two cases, the pathology was neurological ALS disease (amyotrophic lateral sclerosis), and in the third case, diseases of the larynx). The parameters of the modulation spectrum obtained in the DFT-based scheme with channel combining turned out to be more preferable for classification with a small number of features, however, greater accuracy (with an increase in the number of features) made it possible to obtain the parameters obtainedin the scheme based on an unequal filter bank. In all cases, the obtained classifiers were highly accurate (more than 97%). The obtained results show that the use of nonuniform time-frequency representation is preferable in the case when the analyzed signal is a sustained vowel phonation, since it provides higher accuracy of pathology detection using fewer modulation parametersΠŸΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½ ΠΌΠ΅Ρ‚ΠΎΠ΄ опрСдСлСния патологичСских ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠΉ голоса Π½Π° основС Π°Π½Π°Π»ΠΈΠ·Π° модуляционного спСктра Ρ€Π΅Ρ‡Π΅Π²ΠΎΠ³ΠΎ сигнала. ΠœΠΎΠ΄ΡƒΠ»ΡΡ†ΠΈΠΎΠ½Π½Ρ‹ΠΉ спСктр вычисляСтся ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ Π΄Π²ΡƒΡ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… частотно-Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠΉ: ΠΏΠ΅Ρ€Π²ΠΎΠ΅ ΠΏΠ΅Ρ€Π΅Π²ΠΎΠ΄ΠΈΡ‚ сигнал Π² Ρ‡Π°ΡΡ‚ΠΎΡ‚Π½ΡƒΡŽ ΠΎΠ±Π»Π°ΡΡ‚ΡŒ, Π²Ρ‚ΠΎΡ€ΠΎΠ΅ – Π² ΠΌΠΎΠ΄ΡƒΠ»ΡΡ†ΠΈΠΎΠ½Π½ΡƒΡŽ. ΠžΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΡŒΡŽ ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½ΠΎΠ³ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° являСтся использованиС Π½Π΅Ρ€Π°Π²Π½ΠΎΠΌΠ΅Ρ€Π½ΠΎΠ³ΠΎ частотно-Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠ³ΠΎ ΠΏΠ»Π°Π½Π° ΠΏΡ€ΠΈ ΠΏΠ΅Ρ€Π΅Π²ΠΎΠ΄Π΅ сигнала Π² Ρ‡Π°ΡΡ‚ΠΎΡ‚Π½ΡƒΡŽ ΠΎΠ±Π»Π°ΡΡ‚ΡŒ. ΠŸΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½ способ ΠΎΡ†Π΅Π½ΠΊΠΈ модуляционного спСктра, основанный Π½Π° ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΠ°Ρ… антропоморфичСской ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ сигналов, ΠΈΠΌΠΈΡ‚ΠΈΡ€ΡƒΡŽΡ‰ΠΈΠΉ Π½Π΅Ρ€Π°Π²Π½ΠΎΠΌΠ΅Ρ€Π½ΠΎΠ΅ частотно-Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠ΅ Ρ€Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ слуховой систСмы Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°. Использован нСравнополосный Π±Π°Π½ΠΊ Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ² ΠΌΠΎΠ΄ΡƒΠ»ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΉ дискрСтным ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠΉ Π€ΡƒΡ€ΡŒΠ΅,Π°ΠΏΠΏΡ€ΠΎΠΊΡΠΈΠΌΠΈΡ€ΡƒΡŽΡ‰ΠΈΠΉ ΡˆΠΊΠ°Π»Ρƒ критичСских частот ΠΈ ΠΏΠΎΠ²Ρ‹ΡˆΠ°ΡŽΡ‰ΠΈΠΉ Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠ΅ Ρ€Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ Π² ΡˆΠΈΡ€ΠΎΠΊΠΈΡ… полосах. Π‘Π°Π½ΠΊ Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ² ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ Ρ„Π°Π·ΠΎΠ²Ρ‹Π΅ (Π²ΡΠ΅ΠΏΡ€ΠΎΠΏΡƒΡΠΊΠ°ΡŽΡ‰ΠΈΠ΅) звСнья Π² качСствС элСмСнтов Π·Π°Π΄Π΅Ρ€ΠΆΠΊΠΈ, Ρ‡Ρ‚ΠΎ позволяСт ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ Π½Π΅Ρ€Π°Π²Π½ΠΎΠΌΠ΅Ρ€Π½Ρ‹ΠΉ частотно-Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ ΠΏΠ»Π°Π½. Π’Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ΠΎ сравнСниС ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½ΠΎΠ³ΠΎ способа с Π±ΠΎΠ»Π΅Π΅ Ρ‚Ρ€Π°Π΄ΠΈΡ†ΠΈΠΎΠ½Π½Ρ‹ΠΌ способом вычислСния модуляционного спСктра Π² критичСских полосах с фиксированным Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹ΠΌ Ρ€Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ΠΌ. ΠŸΡ€ΠΈΠ²Π΅Π΄Π΅Π½Ρ‹ Π΄Π°Π½Π½Ρ‹Π΅ экспСримСнтов ΠΏΠΎ использованию ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² модуляционного спСктра для опрСдСлСния патологичСских ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠΉ голоса, обусловлСнных: 1) Π±ΠΎΠΊΠΎΠ²Ρ‹ΠΌ амиотрофичСским склСрозом (БАБ); 2) заболСваниями Π³ΠΎΡ€Ρ‚Π°Π½ΠΈ. ΠžΡ‚Π±ΠΎΡ€ ΠΈ Ρ€Π°Π½ΠΆΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² модуляционного спСктра, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½Π½Ρ‹Ρ… Π² качСствС ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² для классификации, Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° LASSO. ΠšΠ»Π°ΡΡΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΡ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π½Π° основС Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠ³ΠΎ дискриминантного Π°Π½Π°Π»ΠΈΠ·Π° обСспСчила Π²Ρ‹ΡΠΎΠΊΡƒΡŽ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ опрСдСлСния ΠΏΠ°Ρ‚ΠΎΠ»ΠΎΠ³ΠΈΠΈ (Π±ΠΎΠ»Π΅Π΅ 97%). ΠŸΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΡΠ²ΠΈΠ΄Π΅Ρ‚Π΅Π»ΡŒΡΡ‚Π²ΡƒΡŽΡ‚ ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ Π½Π΅Ρ€Π°Π²Π½ΠΎΠΌΠ΅Ρ€Π½ΠΎΠ³ΠΎ частотного-Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠ³ΠΎ ΠΏΠ»Π°Π½Π° являСтся ΠΏΡ€Π΅Π΄ΠΏΠΎΡ‡Ρ‚ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ Π² случаС, ΠΊΠΎΠ³Π΄Π° Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΡƒΠ΅ΠΌΡ‹ΠΉ сигнал являСтся протяТным гласным Π·Π²ΡƒΠΊΠΎΠΌ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ обСспСчиваСт Π±ΠΎΠ»Π΅Π΅ Π²Ρ‹ΡΠΎΠΊΡƒΡŽ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ обнаруТСния ΠΏΠ°Ρ‚ΠΎΠ»ΠΎΠ³ΠΈΠΈ ΠΏΡ€ΠΈ мСньшСм числС модуляционных ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ²

    Roundoff errors analysis in fixed-point allpass chain implementation

    Get PDF
    ΠΠ΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎΡΡ‚ΡŒ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ Ρ†Π΅ΠΏΠΎΡ‡ΠΊΠΈ (каскада) Ρ„Π°Π·ΠΎΠ²Ρ‹Ρ…, Π²ΡΠ΅ΠΏΡ€ΠΎΠΏΡƒΡΠΊΠ°ΡŽΡ‰ΠΈΡ… звСньСв Π²ΠΎΠ·Π½ΠΈΠΊΠ°Π΅Ρ‚ ΠΏΡ€ΠΈ построСнии систСм ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π·Π²ΡƒΠΊΠΎΠ²Ρ‹Ρ… сигналов Π½Π° основС Ρ„Π°Π·ΠΎΠ²ΠΎΠ³ΠΎ прСобразования. ИспользованиС Ρ„Π°Π·ΠΎΠ²ΠΎΠ³ΠΎ прСобразования позволяСт ΠΏΠΎΠ»ΡƒΡ‡Π°Ρ‚ΡŒ дискрСтныС систСмы, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… прСдставлСниС ΡΠΏΠ΅ΠΊΡ‚Ρ€Π°Π»ΡŒΠ½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ΅Π½ΠΎ ΠΊ Ρ‚ΠΎΠΌΡƒ, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ формируСтся Π² ΡƒΡ…Π΅ Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°. ЦСлью Π΄Π°Π½Π½ΠΎΠΉ Ρ€Π°Π±ΠΎΡ‚Ρ‹ являлось исслСдованиС ΡˆΡƒΠΌΠΎΠ² квантования Π²ΠΎΠ·Π½ΠΈΠΊΠ°ΡŽΡ‰ΠΈΡ… ΠΏΡ€ΠΈ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ Ρ†Π΅ΠΏΠΎΡ‡ΠΊΠΈ Ρ„Π°Π·ΠΎΠ²Ρ‹Ρ… звСньСв Π² Π°Ρ€ΠΈΡ„ΠΌΠ΅Ρ‚ΠΈΠΊΠ΅ с фиксированной запятой. ИсслСдовались Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ схСмы квантования Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² арифмСтичСских ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΉ: усСчСниС, Π΄Π΅Ρ‚Π΅Ρ€ΠΌΠΈΠ½ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠ΅ ΠΈ вСроятностноС ΠΎΠΊΡ€ΡƒΠ³Π»Π΅Π½ΠΈΠ΅, Π° Ρ‚Π°ΠΊΠΆΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄ формирования спСктра ошибки. Анализировался ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ ошибок округлСния, Π²ΠΎΠ·Π½ΠΈΠΊΠ°ΡŽΡ‰ΠΈΡ… ΠΏΡ€ΠΈ использовании Π΄Π°Π½Π½Ρ‹Ρ… Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΎΠΉ разрядности. Показано, Ρ‡Ρ‚ΠΎ Π½Π°ΠΈΠ»ΡƒΡ‡ΡˆΠΈΡ… Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² удаСтся Π΄ΠΎΡΡ‚ΠΈΠ³Π½ΡƒΡ‚ΡŒ ΠΏΡ€ΠΈ использовании ΠΌΠ΅Ρ‚ΠΎΠ΄Π° формирования спСктра ошибки, Π° Π½Π°ΠΈΡ…ΡƒΠ΄ΡˆΠΈΡ… ΠΏΡ€ΠΈ использовании усСчСния

    Acoustic Detection, Source Separation, and Classification Algorithms for Unmanned Aerial Vehicles in Wildlife Monitoring and Poaching

    Full text link
    This work focuses on the problem of acoustic detection, source separation, and classification under noisy conditions. The goal of this work is to develop a system that is able to detect poachers and animals in the wild by using microphones mounted on unmanned aerial vehicles (UAVs). The classes of signals used to detect wildlife and poachers include: mammals, birds, vehicles and firearms. The noise signals under consideration include: colored noises, UAV propeller and wind noises. The system consists of three sub-systems: source separation (SS), signal detection, and signal classification. Non-negative Matrix Factorization (NMF) is used for source separation, and random forest classifiers are used for detection and classification. The source separation algorithm performance was evaluated using Signal to Distortion Ratio (SDR) for multiple signal classes and noises. The detection and classification algorithms where evaluated for accuracy of detection and classification for multiple signal classes and noises. The performance of the sub-systems and system as a whole are presented and discussed

    A music cognition-guided framework for multi-pitch estimation.

    Get PDF
    As one of the most important subtasks of automatic music transcription (AMT), multi-pitch estimation (MPE) has been studied extensively for predicting the fundamental frequencies in the frames of audio recordings during the past decade. However, how to use music perception and cognition for MPE has not yet been thoroughly investigated. Motivated by this, this demonstrates how to effectively detect the fundamental frequency and the harmonic structure of polyphonic music using a cognitive framework. Inspired by cognitive neuroscience, an integration of the constant Q transform and a state-of-the-art matrix factorization method called shift-invariant probabilistic latent component analysis (SI-PLCA) are proposed to resolve the polyphonic short-time magnitude log-spectra for multiple pitch estimation and source-specific feature extraction. The cognitions of rhythm, harmonic periodicity and instrument timbre are used to guide the analysis of characterizing contiguous notes and the relationship between fundamental frequency and harmonic frequencies for detecting the pitches from the outcomes of SI-PLCA. In the experiment, we compare the performance of proposed MPE system to a number of existing state-of-the-art approaches (seven weak learning methods and four deep learning methods) on three widely used datasets (i.e. MAPS, BACH10 and TRIOS) in terms of F-measure (F1) values. The experimental results show that the proposed MPE method provides the best overall performance against other existing methods

    ΠŸΠ ΠžΠ•ΠšΠ’Π˜Π ΠžΠ’ΠΠΠ˜Π• ΠŸΠ•Π Π•Π”Π˜Π‘ΠšΠ Π•Π’Π˜Π—Π˜Π ΠžBΠΠΠΠžΠ“Πž ΠΠ•Π ΠΠ’ΠΠžΠŸΠžΠ›ΠžΠ‘ΠΠžΠ“Πž КОБИНУБНО-ΠœΠžΠ”Π£Π›Π˜Π ΠžΠ’ΠΠΠΠžΠ“Πž Π‘ΠΠΠšΠ Π€Π˜Π›Π¬Π’Π ΠžΠ’

    Get PDF
    ΠŸΡ€Π΅Π΄Π»Π°Π³Π°Π΅Ρ‚ΡΡ ΠΌΠ΅Ρ‚ΠΎΠ΄ проСктирования нСравнополосного косинусно-ΠΌΠΎΠ΄ΡƒΠ»ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ Π±Π°Π½ΠΊΠ°Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ² с ΠΌΠ°Π»Ρ‹ΠΌ ΡƒΡ€ΠΎΠ²Π½Π΅ΠΌ искаТСний, вносимых Π² рСконструированный сигнал. Π‘ΡƒΡ‚ΡŒ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² использовании для расчСта коэффициСнтов Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°-ΠΏΡ€ΠΎΡ‚ΠΎΡ‚ΠΈΠΏΠ° ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρ‹, ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‰Π΅ΠΉ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ искаТСния, вносимыС ΠΏΡ€ΠΈ Π΄Π΅Ρ†ΠΈΠΌΠ°Ρ†ΠΈΠΈ/интСрполяции сигналов Π² ΠΊΠ°Π½Π°Π»Π°Ρ… Π±Π°Π½ΠΊΠ° Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ². РассматриваСтся вопрос Π²Ρ‹Π±ΠΎΡ€Π° коэффициСнтов Π΄Π΅Ρ†ΠΈΠΌΠ°Ρ†ΠΈΠΈ/интСрполяции,Β ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ‚Π°ΠΊΠΆΠ΅ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°ΡŽΡ‚ΡΡ ΠΏΡ€ΠΈ расчСтС Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°-ΠΏΡ€ΠΎΡ‚ΠΎΡ‚ΠΈΠΏΠ°. Π­Ρ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ ΠΏΡ€Π΅Π΄Π»Π°Π³Π°Π΅ΠΌΠΎΠ³ΠΎΒ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° подтвСрТдаСтся практичСскими ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°ΠΌΠΈ
    • …
    corecore