'Kastamonu Universitesi Iktisadi ve Idari Bilimler Fakultesi Dergisi'
Abstract
Konuşma tanıma yada otomatik konuşma tanıma bilgisayar biliminin, mühendisliğin
ve bilişimsel dilbilimin ortak bir uygulama alanıdır. Bu alan, özellikle bilgisayarlar
için, konuşulan dilden otomatik olarak veri elde etmeyi sağlayan süreçlerin
araştırılmasıyla ve geliştirilmesiyle ilgilenir. Konuşma tanımanın bir biyometrik
kişisel tanıma yöntemi olan ses veya konuşmacıyı tanıma ile karıştırılmaması gerekir.
Ancak her iki uygulamanın realizasyonunda benzerlikler söz konusudur. Bu tezde
insanların konuşma sinyallerinden kelimeleri tanımada derin öğrenme yöntemi
kullanılmıştır. Önerilen yöntemin yürütülmesinde Python kullanılır ve bu adım adım
gerçekleştirilir. Çalışmamız neticesinde, konuşma tanıma için CNN’in (evrişimli sinir
ağları) oldukça başarılı bir araç olduğu görülmüştür, bu durum daha fazla etiketin söz
olması halinde daha sofistike bir mimari inşası yönünde cesaret verici olmuştur. Daha
farklı çözümleri denemek için Kaggle’ın TensorFlow Speech Recognition Challenge
platform kullanılmıştır