34 research outputs found

    5IDER: Unified Query Rewriting for Steering, Intent Carryover, Disfluencies, Entity Carryover and Repair

    Full text link
    Providing voice assistants the ability to navigate multi-turn conversations is a challenging problem. Handling multi-turn interactions requires the system to understand various conversational use-cases, such as steering, intent carryover, disfluencies, entity carryover, and repair. The complexity of this problem is compounded by the fact that these use-cases mix with each other, often appearing simultaneously in natural language. This work proposes a non-autoregressive query rewriting architecture that can handle not only the five aforementioned tasks, but also complex compositions of these use-cases. We show that our proposed model has competitive single task performance compared to the baseline approach, and even outperforms a fine-tuned T5 model in use-case compositions, despite being 15 times smaller in parameters and 25 times faster in latency.Comment: Interspeech 202

    Feature analysis for discriminative confidence estimation in spoken term detection

    Get PDF
    This is the author’s version of a work that was accepted for publication in Computer Speech & Language. Changes resulting from the publishing process, such as peer review, editing, corrections, structural formatting, and other quality control mechanisms may not be reflected in this document. Changes may have been made to this work since it was submitted for publication. A definitive version was subsequently published in Computer Speech & Language, 28, 5, (2014) DOI: 10.1016/j.csl.2013.09.008Discriminative confidence based on multi-layer perceptrons (MLPs) and multiple features has shown significant advantage compared to the widely used lattice-based confidence in spoken term detection (STD). Although the MLP-based framework can handle any features derived from a multitude of sources, choosing all possible features may lead to over complex models and hence less generality. In this paper, we design an extensive set of features and analyze their contribution to STD individually and as a group. The main goal is to choose a small set of features that are sufficiently informative while keeping the model simple and generalizable. We employ two established models to conduct the analysis: one is linear regression which targets for the most relevant features and the other is logistic linear regression which targets for the most discriminative features. We find the most informative features are comprised of those derived from diverse sources (ASR decoding, duration and lexical properties) and the two models deliver highly consistent feature ranks. STD experiments on both English and Spanish data demonstrate significant performance gains with the proposed feature sets.This work has been partially supported by project PriorSPEECH (TEC2009-14719-C02-01) from the Spanish Ministry of Science and Innovation and by project MAV2VICMR (S2009/TIC-1542) from the Community of Madrid

    FTFN kullanan aktif devre uygulamaları

    No full text
    Bu tezin, veri tabanı üzerinden yayınlanma izni bulunmamaktadır.ÖZET Bu tez çalışması üç ana kısımdan oluşmaktadır. Birinci bölümde yeni geliştirilmiş bir devre elemanı olan FTFN elemanının iç yapısı tanıtılmaya çalışılmıştır. Bu amaçla FTFN'nin modellenmesinde kullanılan opamp'ın ve akım taşıyıcı elemanının iç yapısı ve matematiksel modelleri verilerek akün taşıyıcılı devrelere ait bazı örnekler sunulmuştur. Ardından akım taşıyıcılarla elde edilen FTFN elemanı ve bu elemanının nullor ve matematik modeli sunulmuştur. İkinci bölümde FTFN elemanının devre uygulamalarına ilişkin örnekler sunulmuştur. Bu Örneklerde çeşitli filtrelerin ikinci dereceden transfer fonksiyonları elde edilmiş ayrıca FTFN ile elde edilen osilatör devreleri tanıtılmıştır. Üçüncü bölümde bu devrelerin spıce simülasyonu yapılarak filtre karakteristikleri elde edilmiştir. IX,Keywords: FTFN, opamp, nulor, current conveyor This thesis consists of there main sections. In the first section, the inner structure of newly developed current element FTFN was tried to introduce. For this reason, by giving the inner structure and mathematical models of opamp and current conveyor element which were used in modelling FTFN, some examples were presented about the circuits with current conveyors. Then the FTFN element which was obtained with current conveyors and the nullor and mathematical models of this element were presented. In the second section, some examples were showed about circuit practices of FTFN element. In these examples, transfer functions of various filters were obtained and then oscilator circuits which were obtained with FTFN were introduced. In the third section, the filter characteristics were obtained by doing the SPICE simulations of these circuits

    Comparison of gifted and non-gifted students’ attitudes towards english course

    No full text
    Bu araştırmada özel yetenekli olan ve olmayan öğrencilerin İngilizce dersine ilişkin tutumlarının bazı demografik özelliklere göre değişip değişmediğini tespit etmek amaçlanmıştır. Araştırma nicel araştırma yöntemlerinden ilişkisel tarama modeline göre tasarlanmıştır. Araştırmanın çalışma grubu 2021-2022 eğitim öğretim yılında Edirne Şehit Nefize Çetin Özsoy Bilim ve Sanat Merkezi 5. sınıfta eğitim gören genel zihinsel alanında tanılanmış 41 özel yetenekli öğrenci ve Edirne il merkez MEB’e bağlı Gazi Osman Paşa Ortaokulu 5. sınıfta eğitim gören 41 normal gelişim gösteren öğrencilerden oluşmaktadır. Öğrencilerin İngilizce’ ye ilişkin tutumlarını belirlemek amacıyla demografik bilgi formu ve “İngilizce Dersine Yönelik Tutum Ölçeği” (Orakçı,2017) kullanılmıştır. Demografik bilgilerinin analizinde frekans ve yüzdelik hesaplamalar kullanılmıştır. Tutum ölçeğinden elde edilen veriler ise SPSS25 paket programına aktarılarak araştırmanın alt amaçlarına uygun parametrik veya non-parametrik yöntemlerle analiz edilmiştir. Araştırmada öğrencilerin İngilizce dersine ilişkin tutumlarının özel yetenekli ve normal gelişim gösterme durumuna göre farklılık göstermediği bulunmuştur.In this study, it was aimed to determine whether the attitudes of gifted and non-gifted students towards the English lesson change according to some demographic characteristics. The research was designed according to the relational survey model, one of the quantitative research methods. The study group of the research consist of 41 gifted students who were diagnosed in the general mental field, who were educated in the 5th grade of Edirne Şehit Nefize Çetin Özsoy Science and Art Center in the 2021-2022 academic year, and 41 normal students who were educated in the 5th grade of Gazi Osman Paşa Secondary School affiliated to the Edirne provincial center MEB. Demographic information form and "Attitude Scale Towards English Lesson" (Orakçı, 2017) were used to determine students' attitudes towards English. Frequency and percentage calculations were used in the analysis of demographic information. The data obtained from the attitude scale were transferred to the SPSS-25 package program and analyzed with parametric or non-parametric methods in accordance with the subpurposes of the research. In the study, it was found that the attitudes of the students towards the English lesson did not differ according to the gifted and normal development status

    Multiple query image and video retrieval in the hash space based on deep learning and pareto optimality

    No full text
    İçerik tabanlı çok sorgulu görüntü erişimi ile ilgili gerçekleştirilmiş az sayıda çalışmabulunmaktadır. Mevcut çalışmalar, gerçek-değerli özellik vektörleri kullandıklarındanverimli ve hızlı değillerdir. Diğer taraftan, video erişimi ile ilgili yapılan çalışmalar heptek sorgu için geliştirilmiştir. Çoklu video sorguları ile içerik tabanlı video erişimiamacıyla geliştirilmiş herhangi bir çalışma mevcut değildir. Bu tezde, görüntü ve videosorguları farklı anlamlara sahip olduğunda, verimli ve hızlı görüntü ve video erişimisağlayan yöntemler önerilmiştir. Önerilen yöntemler, önceki çalışmalardan farklı olaraksınırsız sayıda sorguyu desteklemektedirler. Sorguların her biri tek veya çoklu anlamiçerebilir. Önerilen yöntemler, görüntü ve videoların ikili kodlarına dayalı olarakgeliştirilmişlerdir. Bu nedenle, daha az depolama alanı gerektirmektedirler ve dahahızlıdırlar. Veri tabanındaki elemanların ve sorguların ikili kodları derin ikili kodoluşturma bileşeni ile elde edilmektedir. Sorgular veri tabanı dışından seçildiğinde,etiketleri derin ikili kod bileşeni tarafından tahmin edilmektedir. Erişim için Pareto cepheve K-ortalamalar kümeleme yöntemleri kullanılmaktadır. Önerilen çok sorgulu görüntüerişim yönteminin erişim hızı ve doğruluğu bakımlarından benzer yöntemlerden üstünolduğu farklı iki veri tabanı üzerinde gerçekleştirilen benzetim sonuçlarıyla gösterilmiştir.İlk kez bu tezde gerçekleştirilen çok sorgulu video erişim yönteminin de hızlı ve verimliolduğu benzetim sonuçlarıyla doğrulanmıştır.--------------------There exist few studies developed for the content-based multi-query image retrievalproblem. Since existing methods use real-valued feature vectors, they are not efficientand fast. On the other hand, video retrieval studies conducted so far have been developedfor a single query. There does not exist a study developed for the purpose of content-based video retrieval via multiple video queries. In this dissertation, frameworksproviding efficient and fast image and video retrieval are proposed when the queries arerelated to more than one semantic. Unlike the previous studies, the frameworks supportan arbitrary number of queries. Each query can have single or multi-label. The proposedmethods are built upon binary hash codes. As a result, they require lower storage space,and they are faster. Hash codes of database items and queries are generated by deephashing component. Query labels are predicted by the deep hashing component when theyare chosen outside the database. Pareto front method and K-means algorithm are used forretrieval. The proposed multi query image retrieval method is shown to be superior to theexisting studies in terms of retrieval speed and accuracy by means of simulations carriedon two different databases. Also, the proposed multi query video retrieval methodimplemented for the first time in this dissertation is verified to be fast and efficient viasimulations
    corecore