29 research outputs found
COMPARISON FOR SPEECH CODING ALGORITHMS FOR TOTAL LARYNGECTOMIES
Electrolarynx is used as a noninvasive supporting device for speech restoration in people who have undergone resection operation over their larynxes. This work aims to develop a signal processing method to neutralize the mechanical vibration noise of this device. We investigate the effect of this noise on the speech signal and analyze the performances of various algorithms in a single input system to minimize this noise
A Novel Voice Activity Detection for Multi-Channel Noise Reduction
In this study, a voice activity detection technique is designed using features such as short-term energy, periodicity and spectral flatness. The desired results are obtained by using these three features, even at low signal to noise ratio values. In addition, performance of multi-channel noise reduction algorithms such as Wiener speech distortion weighted, spatial prediction, minimum variance distortion-less response are compared using the proposed voice activity detection. Two different audio signals and three different noise types are used in the experiment. Noisy speech and only detection of noisy areas have been performed by proposed voice activity detection algorithm. The filter coefficients have been calculated for each filter algorithm used after detection of noisy speech and only noisy areas. The calculated filter coefficients have been multiplied by the frequency components of the signal received from the reference microphone to obtain an enhanced signal. Segmental signal to noise ratio, an objective method, and mean opinion score as a subjective method have been used to evaluate the performance of the filters. Speech distortion weighted Wiener filter has been found to be the best filter for noise reduction performance.[NKUBAP.06]; [YL.18.156]This work was supported by the Tekirda Namk Kemal University Scienti~c Research Project Commission under Grant NKUBAP.06.YL.18.156
Image Coding By Klt Method
DergiPark: 246046trakyafbdBu çalışmada çokluortamda veri sıkıştırma amacıyla yoğun olarak kullanılan KLT (Karhunen Loewe Dönüşümü) yöntemi ayrıntılı bir biçimde incelenmiş, farklı imge ve farklı çerçeve uzunlukları için kodlama gerçekleştirilmiştir. PSNR ile sonuçlar değerlendirilmiş ve çerçeve uzunlukları arttıkça kodlama başarımının düştüğü tesbit edilmiştir.In this work, images which have different frame length are modeled by KLT (Karhunen Loeve Transform). PSNR is used as the performance criteria. It has been shown that, short frame length performs better than long frame length in image data compression
DETECTING GLASS SURFACE CORROSION WITH IMAGE PROCESSING TECHNIQUE
Glass is a kind of amorphous materials that exhibits a transition from rigid to viscous state and finally liquid state when heated. For daily usage, it is desirable to have different forms and differenttransparencies for different purposes. Most widely used one is the one with high transparency and flat surface.One of the detrimental effects that glass is undergone during the storage or usage periods is corrosion. In this work, a way for detecting corrosion on the glass surface by image processing methodis presented
Resources Management in Wireless Network
DergiPark: 245995trakyafbdBu çalışmada, çokluservis kablosuz ağlarda, servis kalitesi sağlamak için etkili radyo kaynak yönetim tekniklerinden arama izin şemaları incelenmiştir. Yeni nesil kablosuz ağlar (3G, 4G) daha fazla sayıda kullanıcıyı ve multimedya servislerini destekleyecektir. Artan kullanıcı ve multimedya servisi ihtiyacı ile birlikte servis kalitesinden ödün vermeden kısıtlı kaynakları en verimli biçimde kullanabilmek için, etkili radyo kaynak yönetimine gereksinim duyulur, bu gereksinim için farklı arama izin şemaları ve bu şemaların değerlendirilmesinde Markov zinciri modeli incelenmiştirIn this study, for providing quality of service, call admission control shemes, one of the most important methods in efficient radio resource management techniques, have been reviewed. Next generation wireless Networks (3G, 4G) will be support more users and multimedia services. With increasing user number and multimedia service needs, for using limited resources in a efficient way, it is needed efficient radio resource management, differrent call admission schemes and evaluation of these schemes with Markov Chain model has been explained for this requirement
A New Approach to Speech Coding
DergiPark: 242118trakyafbdBu çalışmada, Türkçe seslerin yapısına uygun doğrusal dizilerle konuşma işaretlerini etkin bir şekilde modelleyen bir yaklaşım sunulmuştur. Söz konusu ses işaretlerini modellemede kullanılan uygun doğrusal diziler bir, iki ve üç harfli ana seslerden oluşan bir tablodan seçilmektedir. Yöntemi daha etkin kılmak üzere tabloda yer alan benzer sesler bazı tolerans kriterleri ile indirgenebilmektedir. Nitekim %10 toleransla benzer seslerin indirgenmesine gidilerek tablo elemanlarından %30 azaltım sağlanmıştır. Azaltılmış tablo ile modelleme yapıldığında konuşma işaretinin anlaşılırlığı bozulmamıştır. Bu çalışmanın amacı; etkin bir konuşma kodlama için Türkçe'ye özgü en az sayıda Temel Tanım Frekansı setinin elde edilmesidir.In this study, a new modeliing approach for reconstruction of speech signal by the Signature base Sequences is presented. The speech signal is defined as a linear combination of Signature Base Sequances. Signature Base Sequences generated from one, two and three-sound syllables of the Turkish language. Similar syllables have been omitted by tolerance of 10% for effective coding and then the number of syylables has been reduced by 30%. An attempt has been made to obtain speech signals by using the sets of syllables thus obtained. lt was found that the reduced number of syylable sets gave an error in the order of 0.0001 based on comparison of the speech signals. It was shown that this level of the error did not impair the comprehensibility of the speech signal. The aim of this study is to assign a reduced optimal minimum set of Signature Base Frequencies to Turkish sounds
A Novel Approach to Noise Reduction in Audio Signal
Ses etkinliği algılama, genelde konuşma tanıma, konuşma sıkıştırma gibi konuşma işleme süreçlerinin başında kullanılan bir uygulamadır. Konuşma sesinin olup olmadığını tespit etmede kullanılır ve buna göre uygulamanın devamına yön verir. Sesin varlığını tespit etmede kullanılan belli başlı özellikler vardır. Kullanılan özelliklerin fazla olması algoritmanın verimliliği ile doğrudan ilişkilidir. Klasik VAD algoritmaları genelde STE kullanılarak oluşturulduğundan, düşük sinyal gürültü oranı değerlerinde çok hassastır, bu yüzden istenilen sonuçları veremeyebilir. Çözümde kullanılan özellikler için gerçek zamanlı sesler kullanarak sesli bölge ve gürültülü bölge ayırt edilmeye çalışılmıştır. Bu çalışmada sesin varlığını tespit etmek için STE, periyodiklik ve Spektral düzlük gibi üç özellik kullanılmıştır, kullanılan bu üç özellik ile düşük SNR değerlerinde de istenilen sonuçlar elde edilmiştir. Bu yöntemin, özellikle düşük SNR değerlerinde klasik metotlara göre daha iyi performans elde ettiği gözlemlenmiştir.Voice activity detection is often used at the beginning of speech processes, such as speech recognition, and speech compression. It is used to detect the presence of a speaking voice, and it directs the execution of the application accordingly. There are certain features that are used to detect the presence of the voice. The efficiency of the algorithm is directly related to the number of the features used. Since the classical Voice activity detection algorithms are usually developed using Short Time Energy, they are very sensitive to the low signal-to-noise ratio values, therefore they may not provide the desired results. The parts with a speech and the parts with noise were attempted to be distinguished by using real-time sounds for the features used in the solution. In this study, three features, such as Short Time Energy, Periodicity, and the Spectral Flatness, were used to detect the voice. The desired results have been obtained by using these three features, even at low SNR values. This method has been observed to achieve better performance especially at low SNR values than conventional methods