34 research outputs found
5IDER: Unified Query Rewriting for Steering, Intent Carryover, Disfluencies, Entity Carryover and Repair
Providing voice assistants the ability to navigate multi-turn conversations
is a challenging problem. Handling multi-turn interactions requires the system
to understand various conversational use-cases, such as steering, intent
carryover, disfluencies, entity carryover, and repair. The complexity of this
problem is compounded by the fact that these use-cases mix with each other,
often appearing simultaneously in natural language. This work proposes a
non-autoregressive query rewriting architecture that can handle not only the
five aforementioned tasks, but also complex compositions of these use-cases. We
show that our proposed model has competitive single task performance compared
to the baseline approach, and even outperforms a fine-tuned T5 model in
use-case compositions, despite being 15 times smaller in parameters and 25
times faster in latency.Comment: Interspeech 202
Результаты численного решения уравнения Лапласа для фигур вращения с формами от - 0,0025 до - 0,2500
Feature analysis for discriminative confidence estimation in spoken term detection
This is the author’s version of a work that was accepted for publication in Computer Speech & Language. Changes resulting from the publishing process, such as peer review, editing, corrections, structural formatting, and other quality control mechanisms may not be reflected in this document. Changes may have been made to this work since it was submitted for publication. A definitive version was subsequently published in Computer Speech & Language, 28, 5, (2014) DOI: 10.1016/j.csl.2013.09.008Discriminative confidence based on multi-layer perceptrons (MLPs) and multiple features has shown significant advantage compared to the widely used lattice-based confidence in spoken term detection (STD). Although the MLP-based framework can handle any features derived from a multitude of sources, choosing all possible features may lead to over complex models and hence less generality. In this paper, we design an extensive set of features and analyze their contribution to STD individually and as a group. The main goal is to choose a small set of features that are sufficiently informative while keeping the model simple and generalizable. We employ two established models to conduct the analysis: one is linear regression which targets for the most relevant features and the other is logistic linear regression which targets for the most discriminative features. We find the most informative features are comprised of those derived from diverse sources (ASR decoding, duration and lexical properties) and the two models deliver highly consistent feature ranks. STD experiments on both English and Spanish data demonstrate significant performance gains with the proposed feature sets.This work has been partially supported by project PriorSPEECH (TEC2009-14719-C02-01) from the Spanish Ministry of Science and Innovation and by project MAV2VICMR (S2009/TIC-1542) from the Community of Madrid
FTFN kullanan aktif devre uygulamaları
Bu tezin, veri tabanı üzerinden yayınlanma izni bulunmamaktadır.ÖZET Bu tez çalışması üç ana kısımdan oluşmaktadır. Birinci bölümde yeni geliştirilmiş bir devre elemanı olan FTFN elemanının iç yapısı tanıtılmaya çalışılmıştır. Bu amaçla FTFN'nin modellenmesinde kullanılan opamp'ın ve akım taşıyıcı elemanının iç yapısı ve matematiksel modelleri verilerek akün taşıyıcılı devrelere ait bazı örnekler sunulmuştur. Ardından akım taşıyıcılarla elde edilen FTFN elemanı ve bu elemanının nullor ve matematik modeli sunulmuştur. İkinci bölümde FTFN elemanının devre uygulamalarına ilişkin örnekler sunulmuştur. Bu Örneklerde çeşitli filtrelerin ikinci dereceden transfer fonksiyonları elde edilmiş ayrıca FTFN ile elde edilen osilatör devreleri tanıtılmıştır. Üçüncü bölümde bu devrelerin spıce simülasyonu yapılarak filtre karakteristikleri elde edilmiştir. IX,Keywords: FTFN, opamp, nulor, current conveyor This thesis consists of there main sections. In the first section, the inner structure of newly developed current element FTFN was tried to introduce. For this reason, by giving the inner structure and mathematical models of opamp and current conveyor element which were used in modelling FTFN, some examples were presented about the circuits with current conveyors. Then the FTFN element which was obtained with current conveyors and the nullor and mathematical models of this element were presented. In the second section, some examples were showed about circuit practices of FTFN element. In these examples, transfer functions of various filters were obtained and then oscilator circuits which were obtained with FTFN were introduced. In the third section, the filter characteristics were obtained by doing the SPICE simulations of these circuits
Comparison of gifted and non-gifted students’ attitudes towards english course
Bu araştırmada özel yetenekli olan ve olmayan öğrencilerin İngilizce dersine
ilişkin tutumlarının bazı demografik özelliklere göre değişip değişmediğini tespit
etmek amaçlanmıştır. Araştırma nicel araştırma yöntemlerinden ilişkisel tarama
modeline göre tasarlanmıştır. Araştırmanın çalışma grubu 2021-2022 eğitim öğretim
yılında Edirne Şehit Nefize Çetin Özsoy Bilim ve Sanat Merkezi 5. sınıfta eğitim gören
genel zihinsel alanında tanılanmış 41 özel yetenekli öğrenci ve Edirne il merkez
MEB’e bağlı Gazi Osman Paşa Ortaokulu 5. sınıfta eğitim gören 41 normal gelişim
gösteren öğrencilerden oluşmaktadır. Öğrencilerin İngilizce’ ye ilişkin tutumlarını
belirlemek amacıyla demografik bilgi formu ve “İngilizce Dersine Yönelik Tutum
Ölçeği” (Orakçı,2017) kullanılmıştır. Demografik bilgilerinin analizinde frekans ve
yüzdelik hesaplamalar kullanılmıştır. Tutum ölçeğinden elde edilen veriler ise SPSS25
paket
programına aktarılarak araştırmanın alt amaçlarına uygun parametrik veya
non-parametrik yöntemlerle analiz edilmiştir. Araştırmada öğrencilerin İngilizce
dersine ilişkin tutumlarının özel yetenekli ve normal gelişim gösterme durumuna göre
farklılık göstermediği bulunmuştur.In this study, it was aimed to determine whether the attitudes of gifted and non-gifted
students towards the English lesson change according to some demographic
characteristics. The research was designed according to the relational survey model,
one of the quantitative research methods. The study group of the research consist of
41 gifted students who were diagnosed in the general mental field, who were educated
in the 5th grade of Edirne Şehit Nefize Çetin Özsoy Science and Art Center in the
2021-2022 academic year, and 41 normal students who were educated in the 5th grade
of Gazi Osman Paşa Secondary School affiliated to the Edirne provincial center MEB.
Demographic information form and "Attitude Scale Towards English Lesson" (Orakçı,
2017) were used to determine students' attitudes towards English. Frequency and
percentage calculations were used in the analysis of demographic information. The
data obtained from the attitude scale were transferred to the SPSS-25 package program
and analyzed with parametric or non-parametric methods in accordance with the subpurposes
of
the
research.
In
the
study,
it
was
found
that
the
attitudes
of
the
students
towards
the English lesson did not differ according to the gifted and normal
development status
Multiple query image and video retrieval in the hash space based on deep learning and pareto optimality
İçerik tabanlı çok sorgulu görüntü erişimi ile ilgili gerçekleştirilmiş az sayıda çalışmabulunmaktadır. Mevcut çalışmalar, gerçek-değerli özellik vektörleri kullandıklarındanverimli ve hızlı değillerdir. Diğer taraftan, video erişimi ile ilgili yapılan çalışmalar heptek sorgu için geliştirilmiştir. Çoklu video sorguları ile içerik tabanlı video erişimiamacıyla geliştirilmiş herhangi bir çalışma mevcut değildir. Bu tezde, görüntü ve videosorguları farklı anlamlara sahip olduğunda, verimli ve hızlı görüntü ve video erişimisağlayan yöntemler önerilmiştir. Önerilen yöntemler, önceki çalışmalardan farklı olaraksınırsız sayıda sorguyu desteklemektedirler. Sorguların her biri tek veya çoklu anlamiçerebilir. Önerilen yöntemler, görüntü ve videoların ikili kodlarına dayalı olarakgeliştirilmişlerdir. Bu nedenle, daha az depolama alanı gerektirmektedirler ve dahahızlıdırlar. Veri tabanındaki elemanların ve sorguların ikili kodları derin ikili kodoluşturma bileşeni ile elde edilmektedir. Sorgular veri tabanı dışından seçildiğinde,etiketleri derin ikili kod bileşeni tarafından tahmin edilmektedir. Erişim için Pareto cepheve K-ortalamalar kümeleme yöntemleri kullanılmaktadır. Önerilen çok sorgulu görüntüerişim yönteminin erişim hızı ve doğruluğu bakımlarından benzer yöntemlerden üstünolduğu farklı iki veri tabanı üzerinde gerçekleştirilen benzetim sonuçlarıyla gösterilmiştir.İlk kez bu tezde gerçekleştirilen çok sorgulu video erişim yönteminin de hızlı ve verimliolduğu benzetim sonuçlarıyla doğrulanmıştır.--------------------There exist few studies developed for the content-based multi-query image retrievalproblem. Since existing methods use real-valued feature vectors, they are not efficientand fast. On the other hand, video retrieval studies conducted so far have been developedfor a single query. There does not exist a study developed for the purpose of content-based video retrieval via multiple video queries. In this dissertation, frameworksproviding efficient and fast image and video retrieval are proposed when the queries arerelated to more than one semantic. Unlike the previous studies, the frameworks supportan arbitrary number of queries. Each query can have single or multi-label. The proposedmethods are built upon binary hash codes. As a result, they require lower storage space,and they are faster. Hash codes of database items and queries are generated by deephashing component. Query labels are predicted by the deep hashing component when theyare chosen outside the database. Pareto front method and K-means algorithm are used forretrieval. The proposed multi query image retrieval method is shown to be superior to theexisting studies in terms of retrieval speed and accuracy by means of simulations carriedon two different databases. Also, the proposed multi query video retrieval methodimplemented for the first time in this dissertation is verified to be fast and efficient viasimulations