232 research outputs found
Co-Training of Audio and Video Representations from Self-Supervised Temporal Synchronization
There is a natural correlation between the visual and auditive elements of a video. In this work, we use this correlation in order to learn strong and general features via cross-modal self-supervision with carefully chosen neural network architectures and calibrated curriculum learning. We suggest that this type of training is an effective way of pretraining models for further pursuits in video understanding, as they achieve on average 14.8% improvement over models trained from scratch. Furthermore, we demonstrate that these general features can be used for audio classification and perform on par with state-of-the-art results. Lastly, our work shows that using cross-modal self-supervision for pretraining is a good starting point for the development of multi-sensory models
Biostratigraphy of Turonian to (?)Coniacian Platform Carbonates: A Case Study from the Island of Cres (Northern Adriatic, Croatia)
The shallow marine carbonate deposits on the island of Cres, overlying deeper-water CenomanianāTuronian limestones, are characterized by an assemblage of rudists, benthic foraminifera, and associated microfossils. The paucispecific character of the fossil association suggests deposition in shallow areas of a carbonate platform, with low current-energies and restricted circulation. Similar assemblages indicating similar palaeoenvironments, are common in the Upper Cretaceous deposits of the Adriatic Carbonate Platform and adjacent areas.
The assemblage of rudists (hippuritids) and microfossils indicate the Turonian to (?)Coniacian age of the investigated carbonate succession. The biostratigraphic importance of the so-called āprimitiveā hippuritids within the micropalaeontologically poorly defined biostratigraphy of deposits of this age, is accentuated
Look, listen and recognise: character-aware audio-visual subtitling
The goal of this paper is automatic character-aware subtitle generation. Given a video and a minimal amount of metadata, we propose an audio-visual method that generates a full transcript of the dialogue, with precise speech timestamps, and the character speaking identified. The key idea is to first use audio-visual cues to select a set of high-precision audio exemplars for each character, and then use these exemplars to classify all speech segments by speaker identity. Notably, the method does not require face detection or tracking. We evaluate the method over a variety of TV sitcoms, including Seinfeld, Fraiser and Scrubs. We envision this system being useful for the automatic generation of subtitles to improve the accessibility of the vast amount of videos available on modern streaming services. Project page : https://www.robots.ox.ac.uk/~vgg/research/look-listen-recognise
Analiza pulsirajuÄeg strujanja u cijevi
U radu je izvedeno analitiÄko rjeÅ”enje za sluÄaj pulsirajuÄeg laminarnog, nestlaÄivog strujanja u okrugloj cijevi pod djelovanjem poznatog gradijenta tlaka (zadanog harmonijskom funkcijom). Bezdimenzijsko rjeÅ”enje ovisi o bezdimenzijskom Womerslyjevom broju, koji oznaÄuje omjer inercijske i viskozne sile. Analiziran je utjecaj Womerslyjeva broja na protok i smiÄno naprezanje na stijenci cijevi. ZakljuÄuje se da su pri niskim vrijednostima Womerslyjeva broja (kad je utjecaj viskoznosti veÄi) sile tlaka uravnotežene uglavnom viskoznim silama, a pri visokim vrijednostima Womerslyjeva broja uravnotežene uglavnom inercijskim silama. PoveÄanjem Womerslyjeva broja dolazi do smanjenja amplituda smiÄnog naprezanja i protoka
Prilog modeliranju koeficijenta otpora trenja u nestacionarnom strujanju fluida u cijevima
U proraÄunima nestacionarnog strujanja u cijevi sve ÄeÅ”Äe je potrebno precizno odreÄivanje trenja fluida, Å”to uvjetuje da se uz 1D modele strujanja koriste i toÄniji kvazi-2D modeli. Za proraÄun hidrauliÄkog udara najÄeÅ”Äe se koriste 2D modeli Vardy i Hwang (koji je toÄniji i pouzdaniji) i Pezzinga (koji zahtijeva manje raÄunanja). Ovdje je predložen novi kvazi-2D model koji posjeduje toÄnost metode Vardy i Hwang i brzinu raÄunanja metode Pezzinga. Ujedno je ponuÄena i originalna numeriÄka metoda koja je u osnovi metoda karakteristika, ali ima i neke elemente metode konaÄnih volumena. \Najprije se daje pregled postojeÄih modela za proraÄun hidrauliÄkog udara od složenijih prema jednostavnijima uz postupno uvoÄenje pretpostavki. Zatim je sustavno izložena metoda karakteristika za viÅ”edimenzijske situacije. KoristeÄi se karakteristiÄnim jednadžbama, detaljnom analitiÄkom usporedbom predložene metode i metode Vardy i Hwang pokazuje se da obje metode moraju davati iste rezultate pod uvjetom da se koristi potpuno implicitna shema interpolacije za radijalnu brzinu. \Na kraju su rezultati predložene metode usporeÄeni s eksperimentalnim rezultatima za sluÄaj laminarnog i turbulentnog strujanja, kao i s rezultatima proraÄuna pomoÄu metode Vardy i Hwang za te iste strujne situacije. U svim tim usporedbama predložena metoda pokazuje izvrsno poklapanje rezultata
Paul Hindemith - sonate za violu i klavir
Diplomski rad analizira tri sonate za violu i klavir Paula Hindemitha nastalih u razdoblju od 1919. godine do 1939. godine. Rad se sastoji od nekoliko veÄih cjelina. Prvi dio diplomskog rada predstavlja biografiju kompozitora s naglaskom na violskom opusu. Drugi dio sastoji se od tri cjeline pri Äemu svaka cjelina predstavlja analizu jedne sonate za violu i klavir uz notne primjere motiviÄkog i tematskog materijala
- ā¦