5 research outputs found

    Temporal Reconstruction Methods in Self-Supervised Machine Learning

    Get PDF
    A Gépi Tanulás a Mesterséges Intelligencia egyik részterülete, amely példákból tanuló algoritmusokkal foglalkozik. Az elmúlt évtizedben a Felügyelt Tanulás, amely emberek által annotált bemenet-célváltozó párokat használ példákként, számos lenyűgöző eredményt ért el, azonban az emberi mintagyűjtési kapacitás behatárolja a lehetőségeit. Ezért a Felügyeletlen Tanulási technikák egyre nagyobb figyelmet kapnak, amelyek pusztán a bemenetekből is képesek tanulni. Speciálisan az Önfelügyelt Tanulás a bemenetekből automatikusan generált ál-bemenetekkel és ál-célváltozókkal dolgozik; ezen belül kitüntetett esetet képeznek a Rekonstrukciós Feladatok, amikor az ál-célváltozó maga a bemenet. Noha ezek az eljárások magukban is működőképesek – pl., helyreállítják a pontos bemenetet, vagy magas szintű rejtett változókat nyernek ki az adatokból – a kevés címkézett példával rendelkező Felügyelt Tanulási feladatokat is képesek jól kondicionálttá tenni közös megoldások kikényszerítésével. A Rekonstrukciós Feladatok iránti fokozott érdeklődés ellenére a publikált vizsgálatok nagy része strukturálatlan vagy képi változókra korlátozódik, figyelmen kívül hagyva az idősorokban és videókban természetes módon megjelenő időbeli összefüggéseket. Ezen felül az egyes módszerek gyakran egyetlen Rekonstrukciós Feladatra vannak specializálva, ahelyett, hogy több feladatból együttesen tanulnának. Ezek súlyos limitációknak tekintendőek, mivel a szekvenciális adatszerkezet valamint a különféle problémák közötti kapcsolatok kiaknázása jobb változók tanulását teszi lehetővé. Disszertációmban ezen hiányosságok pótlására törekszem 5 időbeli Önfelügyelt Rekonstrukciós Feladat és azok megoldásainak bemutatásával. Először két paraméter nélküli optimalizálási függvényt vezetek be idősor zajtalanításra, melyek jó eredményeket érnek el kiugró illetve trendváltási időpontok detektálásában. Másodszor egy Mély Neurális Hálózatot (egy Konvolúciós Rekurrens Autoenkódert) ismertetek videó osztályozás előtanítására, mely új, csoport k-ritka aktivációs függvényekkel dolgozik, és képes széles körben alkalmazott eljárásokat túlteljesíteni. Harmadszor két iterációkra bontott optimalizálási függvényt taglalok Mély Neurális Hálózatok által definiált prior költségekkel lineáris kép és videó visszaállításra; melyek ugyanazon háló paraméterekkel képesek többféle feladatot megoldani, hatékonyabban más hasonló metódusoknál. Az eljárások alkalmazhatóságát és előnyeit empirikus módon, több adatbázison végzett reprodukálható kísérletek formájában támasztom alá

    Speech de-identification with deep neural networks

    Get PDF
    Cloud-based speech services are powerful practical tools but the privacy of the speakers raises important legal concerns when exposed to the Internet. We propose a deep neural network solution that removes personal characteristics from human speech by converting it to the voice of a Text-to-Speech (TTS) system before sending the utterance to the cloud. The network learns to transcode sequences of vocoder parameters, delta and delta-delta features of human speech to those of the TTS engine. We evaluated several TTS systems, vocoders and audio alignment techniques. We measured the performance of our method by (i) comparing the result of speech recognition on the de-identified utterances with the original texts, (ii) computing the Mel-Cepstral Distortion of the aligned TTS and the transcoded sequences, and (iii) questioning human participants in A-not-B, 2AFC and 6AFC tasks. Our approach achieves the level required by diverse applications

    Iterative Calibration Method for Microscopic Road Traffic Simulators

    Get PDF
    Recently, computer simulation aided work has become a standard routine in all engineering fields. Accordingly, simulation plays a fundamental role even in road traffic engineering. A reliable simulator is able to provide effective analysis of a given traffic network if the applied simulation scenarios properly converge to the real-word situation. This requirement can be achieved based on the mixed use of prior real-world traffic measurements and proper simulation settings. The latter one, however, is not straightforward. Accordingly, the paper investigates a potential calibration technique to create realistic simulations. Basically, a tuning method with genetic algorithm is proposed to reproduce true-to-life traffic based on floating car speed data

    MADGAN: unsupervised medical anomaly detection GAN using multiple adjacent brain MRI slice reconstruction.

    Get PDF
    BACKGROUND: Unsupervised learning can discover various unseen abnormalities, relying on large-scale unannotated medical images of healthy subjects. Towards this, unsupervised methods reconstruct a 2D/3D single medical image to detect outliers either in the learned feature space or from high reconstruction loss. However, without considering continuity between multiple adjacent slices, they cannot directly discriminate diseases composed of the accumulation of subtle anatomical anomalies, such as Alzheimer's disease (AD). Moreover, no study has shown how unsupervised anomaly detection is associated with either disease stages, various (i.e., more than two types of) diseases, or multi-sequence magnetic resonance imaging (MRI) scans. RESULTS: We propose unsupervised medical anomaly detection generative adversarial network (MADGAN), a novel two-step method using GAN-based multiple adjacent brain MRI slice reconstruction to detect brain anomalies at different stages on multi-sequence structural MRI: (Reconstruction) Wasserstein loss with Gradient Penalty + 100 [Formula: see text] loss-trained on 3 healthy brain axial MRI slices to reconstruct the next 3 ones-reconstructs unseen healthy/abnormal scans; (Diagnosis) Average [Formula: see text] loss per scan discriminates them, comparing the ground truth/reconstructed slices. For training, we use two different datasets composed of 1133 healthy T1-weighted (T1) and 135 healthy contrast-enhanced T1 (T1c) brain MRI scans for detecting AD and brain metastases/various diseases, respectively. Our self-attention MADGAN can detect AD on T1 scans at a very early stage, mild cognitive impairment (MCI), with area under the curve (AUC) 0.727, and AD at a late stage with AUC 0.894, while detecting brain metastases on T1c scans with AUC 0.921. CONCLUSIONS: Similar to physicians' way of performing a diagnosis, using massive healthy training data, our first multiple MRI slice reconstruction approach, MADGAN, can reliably predict the next 3 slices from the previous 3 ones only for unseen healthy images. As the first unsupervised various disease diagnosis, MADGAN can reliably detect the accumulation of subtle anatomical anomalies and hyper-intense enhancing lesions, such as (especially late-stage) AD and brain metastases on multi-sequence MRI scans
    corecore