232 research outputs found

    Co-Training of Audio and Video Representations from Self-Supervised Temporal Synchronization

    Get PDF
    There is a natural correlation between the visual and auditive elements of a video. In this work, we use this correlation in order to learn strong and general features via cross-modal self-supervision with carefully chosen neural network architectures and calibrated curriculum learning. We suggest that this type of training is an effective way of pretraining models for further pursuits in video understanding, as they achieve on average 14.8% improvement over models trained from scratch. Furthermore, we demonstrate that these general features can be used for audio classification and perform on par with state-of-the-art results. Lastly, our work shows that using cross-modal self-supervision for pretraining is a good starting point for the development of multi-sensory models

    Put k suncu

    Get PDF

    Biostratigraphy of Turonian to (?)Coniacian Platform Carbonates: A Case Study from the Island of Cres (Northern Adriatic, Croatia)

    Get PDF
    The shallow marine carbonate deposits on the island of Cres, overlying deeper-water Cenomanianā€“Turonian limestones, are characterized by an assemblage of rudists, benthic foraminifera, and associated microfossils. The paucispecific character of the fossil association suggests deposition in shallow areas of a carbonate platform, with low current-energies and restricted circulation. Similar assemblages indicating similar palaeoenvironments, are common in the Upper Cretaceous deposits of the Adriatic Carbonate Platform and adjacent areas. The assemblage of rudists (hippuritids) and microfossils indicate the Turonian to (?)Coniacian age of the investigated carbonate succession. The biostratigraphic importance of the so-called ā€œprimitiveā€ hippuritids within the micropalaeontologically poorly defined biostratigraphy of deposits of this age, is accentuated

    Look, listen and recognise: character-aware audio-visual subtitling

    Get PDF
    The goal of this paper is automatic character-aware subtitle generation. Given a video and a minimal amount of metadata, we propose an audio-visual method that generates a full transcript of the dialogue, with precise speech timestamps, and the character speaking identified. The key idea is to first use audio-visual cues to select a set of high-precision audio exemplars for each character, and then use these exemplars to classify all speech segments by speaker identity. Notably, the method does not require face detection or tracking. We evaluate the method over a variety of TV sitcoms, including Seinfeld, Fraiser and Scrubs. We envision this system being useful for the automatic generation of subtitles to improve the accessibility of the vast amount of videos available on modern streaming services. Project page : https://www.robots.ox.ac.uk/~vgg/research/look-listen-recognise

    Analiza pulsirajućeg strujanja u cijevi

    Get PDF
    U radu je izvedeno analitičko rjeÅ”enje za slučaj pulsirajućeg laminarnog, nestlačivog strujanja u okrugloj cijevi pod djelovanjem poznatog gradijenta tlaka (zadanog harmonijskom funkcijom). Bezdimenzijsko rjeÅ”enje ovisi o bezdimenzijskom Womerslyjevom broju, koji označuje omjer inercijske i viskozne sile. Analiziran je utjecaj Womerslyjeva broja na protok i smično naprezanje na stijenci cijevi. Zaključuje se da su pri niskim vrijednostima Womerslyjeva broja (kad je utjecaj viskoznosti veći) sile tlaka uravnotežene uglavnom viskoznim silama, a pri visokim vrijednostima Womerslyjeva broja uravnotežene uglavnom inercijskim silama. Povećanjem Womerslyjeva broja dolazi do smanjenja amplituda smičnog naprezanja i protoka

    Prilog modeliranju koeficijenta otpora trenja u nestacionarnom strujanju fluida u cijevima

    Get PDF
    U proračunima nestacionarnog strujanja u cijevi sve čeŔće je potrebno precizno određivanje trenja fluida, Å”to uvjetuje da se uz 1D modele strujanja koriste i točniji kvazi-2D modeli. Za proračun hidrauličkog udara najčeŔće se koriste 2D modeli Vardy i Hwang (koji je točniji i pouzdaniji) i Pezzinga (koji zahtijeva manje računanja). Ovdje je predložen novi kvazi-2D model koji posjeduje točnost metode Vardy i Hwang i brzinu računanja metode Pezzinga. Ujedno je ponuđena i originalna numerička metoda koja je u osnovi metoda karakteristika, ali ima i neke elemente metode konačnih volumena. \Najprije se daje pregled postojećih modela za proračun hidrauličkog udara od složenijih prema jednostavnijima uz postupno uvođenje pretpostavki. Zatim je sustavno izložena metoda karakteristika za viÅ”edimenzijske situacije. Koristeći se karakterističnim jednadžbama, detaljnom analitičkom usporedbom predložene metode i metode Vardy i Hwang pokazuje se da obje metode moraju davati iste rezultate pod uvjetom da se koristi potpuno implicitna shema interpolacije za radijalnu brzinu. \Na kraju su rezultati predložene metode uspoređeni s eksperimentalnim rezultatima za slučaj laminarnog i turbulentnog strujanja, kao i s rezultatima proračuna pomoću metode Vardy i Hwang za te iste strujne situacije. U svim tim usporedbama predložena metoda pokazuje izvrsno poklapanje rezultata

    Paul Hindemith - sonate za violu i klavir

    Get PDF
    Diplomski rad analizira tri sonate za violu i klavir Paula Hindemitha nastalih u razdoblju od 1919. godine do 1939. godine. Rad se sastoji od nekoliko većih cjelina. Prvi dio diplomskog rada predstavlja biografiju kompozitora s naglaskom na violskom opusu. Drugi dio sastoji se od tri cjeline pri čemu svaka cjelina predstavlja analizu jedne sonate za violu i klavir uz notne primjere motivičkog i tematskog materijala
    • ā€¦
    corecore