235 research outputs found

    Décompositions en éléments sonores et applications musicales

    Get PDF
    National audienceIn this paper is presented the DESAM project which was divided in two parts. The first one was devoted to the theoretical and experimental study of parametric and non-parametric techniques for decomposing audio signals into sound elements. The second part focused on some musical applications of these decompositions. Most aspects that have been considered in this project have led to the proposal of new methods which have been grouped together into the so-called DESAM Toolbox, a set of Matlab® functions dedicated to the estimation of widely used spectral models for music signals. Although those models can be used in Music Information Retrieval (MIR) tasks, the core functions of the toolbox do not focus on any specific application. It is rather aimed at providing a range of state-of-the-art signal processe soumission à Traitement du signalDans cet article sont présentés de manière synthétique les résultats du projet ANR DE-SAM (Décompositions en Éléments Sonores et Applications Musicales). Ce projet comportait deux parties, la première portant sur des avancées théoriques de techniques de décompositions de signaux audionumériques et la seconde traitant d'applications musicales de ces décompo-sitions. La plupart des aspects abordés dans le projet ont donné lieu à de nouvelles méthodes et algorithmes qui sont regroupés au sein d'une boîte à outils, la DESAM Toolbox. Celle-ci rassemble un ensemble de fonctions Matlab® dédiées à l'estimation de modèles spectraux très utilisés pour les signaux musicaux. Les méthodes étudiées dans ce projet peuvent bien sûr être utiles pour la recherche automatique d'informations dans les signaux musicaux, mais elles constituent avant tout une collection d'outils récents pour décomposer les signaux selon dif-férents modèles, avec pour résultat des représentations mi-niveau variées, pouvant être utiles dans d'autres domaines d'application

    Les origines biologiques de la musique

    Full text link
    La musique est un comportement humain incontestablement universel, elle demeure néanmoins peu abordée par l’anthropologie. Si les connaissances empiriques accumulées à ce jour ont permis de bien la caractériser à des niveaux proximaux d’analyse, la question de son origine évolutionniste est, en contrepartie, souvent délaissée. Or, toute tentative sérieuse de comprendre ce phénomène requiert une investigation de sa fonction adaptative et de sa phylogénèse. Le projet entrepris ici consiste en une tentative de définition du concept de musique en terme d’universaux, d’une comparaison interspécifique du phénomène et d’un résumé de l’histoire phylogénétique des comportements musicaux, ainsi que d’une analyse de deux modèles portant sur les origines de la musique (Miller, 2000; Mithen, 2006). De ces modèles sont extraites des prévisions qui sont confrontées à des données empiriques provenant de disciplines diverses afin d’évaluer leur valeur scientifique. L’analyse des données disponibles permet de produire un inventaire des universaux musicaux aux plans cognitif, structurel, émotionnel, fonctionnel et symbolique et d’identifier ainsi certaines des bases biologiques du phénomène. Plusieurs mécanismes évolutionnistes, dont la sélection naturelle, la sélection sexuelle, la sélection de groupe et la sélection parentale sont employés par les divers auteurs afin d’expliquer l’apparition du phénomène musical. Il appert que la musique a joué un rôle important dans la relation parent-enfant au cours de l’évolution humaine, de même que dans la cohésion sociale, la coordination des activités et la formation de l’identité de groupe. En ce qui a trait aux deux modèles analysés ici, chacun ne traite que d’une partie des invariants musicaux et leur comparaison permet d’établir qu’ils sont mutuellement exclusifs. En guise de conclusion, nous tentons de formuler un scénario évolutif qui concilie les différentes hypothèses abordées.Music is a universal and ubiquitous human behaviour, but it is still largely ignored by anthropology. While music is well characterised at proximate levels of explanation, the question of their evolutionary origins remains relatively unexplored. Nevertheless, any attempts to explain this phenomena needs to investigate its potential adaptive significance and phylogeny This project consists of an attempt to define music in terms of universals, of a interspecific comparison of the phenomena and of a summary of the phylogenetic history of musical behaviour as well as an analysis of two theories on origins of music (Miller, 2000 ; Mithen, 2006). Their predictions will be confronted to empirical data from a large array of disciplines to evaluate their scientific value. The analysis of the data available allows to produce an inventory of cognitive, structural, emotional, functional and symbolic music universals and to identify certain biological bases of the phenomena. Several evolutionist mechanisms, including natural selection, sexual selection, group selection and kin selection, have been employed by several authors to explain the emergence of music. It seems that music played an important role in the parent-infant relationship throughout evolution, as well as in social cohesion, coordination of social activities and formation of group identity. Regarding the two models analysed in this research, their comparison allows us to conclude that they are mutually exclusive and only discuss part of the musical invariants. In the end, an evolutionary framework that synthesizes and reconciles these hypotheses is proposed

    Architecture générique multicouche pour l'analyse de performances musicales polyphoniques

    Get PDF
    Cette thèse de doctorat, du domaine de la recherche applicative, propose un système informatique destiné au développement d'applications logicielles s'adressant aux musiciens. Le système proposé permet essentiellement de suivre un musicien en meilleur effort à travers une partition de musique, et ce, tout en évaluant les erreurs de performance qu'il a réalisées telles que des notes jouées trop tôt ou trop tard et des notes manquantes. Pour ce faire, le système utilise en entrée le signal audio numérique du jeu du musicien et la partition de musique en format numérique, soit le format MusicXML. Comparativement aux systèmes existants, le système proposé ne nécessite aucun entraînement et donne la liberté au musicien de jouer n'importe quel segment de la partition de musique sans avoir à préalablement informer le système de ses intentions. Ainsi, le système proposé a la capacité de retrouver le musicien partout à travers la partition de musique, et ce, pourvu que le musicien joue suffisamment de notes. Cette liberté permet au musicien de se concentrer sur l'exécution de la performance musicale puisque c'est l'application qui s'adapte au musicien et non le contraire. Le cœur du système proposé est composé de quatre couches, soit la couche de traitement du signal, la couche de transcription automatique, la couche d'alignement et la couche comparative. Le présent document révise d'abord l'état de l'art concernant le traitement du signal numérique et concernant les méthodes d'alignement, et ce, en lien avec le domaine de la musique. Par la suite, ce document présente en détail le fonctionnement ainsi que la performance de chacune des couches au cœur du système proposé

    Effets audionumériques adaptatifs : théorie, mise en œuvre et usage en création musicale numérique.

    No full text
    Présidente : Myriam Desainte-Catherine, LABRI, Université Bordeaux 1 Rapporteurs : Philippe Depalle, SPCL, Université McGill, Montréal (CANADA) Xavier Serra MTG, Université Pompeu Fabre, Barcelone (ESPAGNE) Invités : Emmanuel Favreau, INA-GRM, Paris Patrick Boussard, GENESIS S.A., Aix-en-ProvenceThis PhD thesis addresses the theory, the implementation and the musical use of adaptive digital audio effects. In the first part, we situate the subject in the context of sound transformations. There exist a great number of signal processing techniques that complete each other and provide a complete set of algorithms for sound transformations. These transformations are applied according to the sound perceptive dimensions, namely dynamics, duration, pitch, spatialisation and timbre. For some effects, the control evolves in an automatic or periodic way, and this control is integrated to the algorithm. The control let to the user is about some parameters of the algorithm. It is given by real controllers, such as knobs, switches, or by virtual controllers, such as the graphical interfaces on computer screens. A main interest in sound synthesis today is the mapping: the topic is to find how we can map the gesture transducer data to the parameters of the synthesis algorithm. Our study is situated at the intersection between digital audio effects, adaptive and gestural control, and sound features. In the second part, we present adaptive digital audio effects, in the way we formalised and developed them. These effects have their controls automated according to sound features. We studied and used a lot of processing algorithms, some in real-time and some out of real-time. We improved them in order to use varying control values. A reflexion was carried out in order to choose a meaningful classification to the musician: the perceptive taxonomy. In parallel, we studied sound features and descriptors, and the ways to control an effect, by the sound and by gestures. We brought together numerous sound features that are used in psycho-acoustics, for analysis-synthesis, for sound segmentation, for sound classification and retrieval, and for automatic transcription of music. We propose a generalised control for adaptive effects, structured with two levels. The first control level is the adaption level: sound features control the effect with mapping functions. We give a set of warping functions (non-linear transfer functions) allowing transformations of the evolution of sound feature curves; we also give feature combination functions and specific warping functions used to warp a control curve according to specific rules. The second control level is the gesture control, which is applied onto the mapping functions between sound features and controls, during combination or during specific warping. This study provides a generalisation of the control of digital audio effects, as well as the conception of toolboxes for composition, and their use in musical context. Numerous experiments and sound examples have been made, among which an adaptive spatialisation controlled by a dancer, and an adaptive stereophonic equaliser. The experiments confirm the interest of such an adaptive and gestural control, for example to change expressiveness of a musical sentence, or to create new sounds.Ce travail de thèse porte sur la théorie, la mise en œuvre et les applications musicales des effets audionumériques adaptatifs. Dans la première partie, nous plaçons le sujet dans le contexte des transformations sonores. Un grand nombre de techniques de traitement du signal sonore numérique se complètent et fournissent un ensemble d'algorithmes permettant de transformer le son. Ces transformations sont appliquées selon les dimensions perceptives du son musical, à savoir la dynamique, la durée, la hauteur, la spatialisation et le timbre. Pour quelques effets, les contrôles évoluent de manière automatique ou périodique, et ce contrôle est intégré à l'algorithme. Le contrôle offert à l'utilisateur porte sur les valeurs de certains paramètres de l'algorithme. Il se réalise à l'aide de contrôleurs réels, tels des potentiomètres, des interrupteurs, ou à l'aide de contrôleurs virtuels, telles les interfaces graphiques sur écran d'ordinateur. En synthèse sonore, l'un des sujets majeurs d'étude à l'heure actuelle est le mapping : il s'agit de savoir comment mettre en correspondance les paramètres d'un contrôleur gestuel et les paramètres d'un algorithme de synthèse. Notre étude se situe à l'intersection entre les effets audionumériques, le contrôle adaptatif et gestuel, et la description de contenu sonore. Dans la seconde partie, nous présentons les effets audionumériques adaptatifs tels que nous les avons formalisés et développés. Ce sont des effets dont le contrôle est automatisé en fonction de descripteurs sonores. Nous avons étudié puis utilisé de nombreux algorithmes de traitement, certains en temps-réel et d'autres hors temps-réel. Nous les avons améliorés afin de permettre l'utilisation de valeurs de contrôle variables. Une réflexion a été menée pour choisir une classification des effets qui ait du sens pour le musicien ; elle a logiquement abouti à la taxonomie perceptive. Parallèlement, nous avons étudié les descripteurs sonores et les moyens de contrôle d'un effet, par le son et par le geste. Nous avons rassemblé de nombreux descripteurs sonores, utilisés en psychoacoustique, en analyse-synthèse, pour la segmentation et la classification d'extraits sonores, et pour la transcription automatique de partition. Nous proposons un contrôle généralisé pour les effets adaptatifs, hiérarchisé en deux niveaux. Le premier niveau de contrôle est le niveau d'adaptation : le contrôle de l'effet est effectué par des descripteurs du son, à l'aide de fonctions de mapping. Nous indiquons des fonctions de conformation (fonctions de transfert non linéaires) permettant de transformer la courbe d'évolution temporelle d'un descripteur, des fonctions de combinaisons des descripteurs ainsi que des fonctions de conformations spécifiques des paramètres de contrôle. Le second niveau de contrôle est celui du contrôle gestuel : le geste agit sur les fonctions de mapping, soit sur la combinaison, soit sur la conformation spécifique des contrôles. De cette étude, il ressort non seulement une généralisation du contrôle des effets audionumériques, mais aussi la réalisation d'outils pour la composition, et leur utilisation en situation musicale. De nombreuses expériences et illustrations sonores ont été réalisées, parmi lesquelles une spatialisation adaptative contrôlée par une danseuse, et un équalisateur stéréophonique adaptatif. Les expériences confirment l'intérêt d'un tel contrôle adaptatif et gestuel, notamment pour modifier l'expressivité d'une phrase musicale, ou pour créer des sons inouïs

    Littératures numériques : tendances, perspectives, outils d’analyse

    Get PDF
    Depuis quelques années, les sites Web personnels, les blogues, journaux intimes, les sites de poésie, les chroniques personnelles prolifèrent en ligne : le succès des Skyblogs, supports de publication destinés aux adolescents, n’est que l’indicateur le plus médiatisé d’un phénomène qui touche toutes les couches de la population. Le statut d’auteur semble désormais accessible à tout le monde. La possibilité de toucher plusieurs millions d’internautes, l’espoir de se faire « repérer » un jour par un éditeur papier, motivent un grand nombre d’auteurs à mettre leurs productions textuelles sur le Web. L’on peut cependant constater que beaucoup de blogues, journaux intimes et romans-feuilletons « en réseau » se présentent sous des formats assez traditionnels : le lien hypertexte, outil syntaxique révolutionnaire, n’est utilisé qu’à l’intérieur d’un sommaire facilitant le « feuilletage » du matériel textuel ; l’animation textuelle, outil sémantique renouvelant profondément l’aspect graphique de l’écrit, est quasiment absente de ces créations, ou bien elle se trouve réduite à une fonction de gadget. Les codes de programmation informatiques, présents sous la surface lisse de l’écran, ne jouent qu’un rôle de langage secondaire. À côté de cette première forme de littérature en réseau s’est développée une deuxième, encore peu connue du grand public, et qui donne lieu à des trouvailles beaucoup plus surprenantes. Depuis une dizaine d’années, loin des circuits de publication et de diffusion des littératures papier, des cercles, des communautés d’écrivains se sont formées autour de l’idée d’une littérature numérique exploitant pleinement les potentialités du médium « ordinateur ». L’animation, l’interactivité et une programmation créative caractérisent ces nouvelles créations littéraires sur support numérique. C’est ainsi dans les calligrammes et métaphores animés et dans l’animation syntaxique, dans les relations intersémiotiques entre le texte animé et l’image fixe, entre le texte fixe et l’image animée que se dessine une première particularité de la littérature numérique. Deuxièmement, c’est la dynamisation de l’écrit par le lien hypertexte (que le lecteur active par clic) qui incite un nombre grandissant d’auteurs à expérimenter avec le support numérique. Un troisième « genre » de la nouvelle littérature numérique se fonde sur la réflexion concernant le rôle du programme. Le premier but de cet article est de présenter les convergences et les différences entre les trois principaux genres de la littérature numérique. À partir d’un certain nombre d’exemples représentatifs, je propose ensuite des outils d’analyse adaptés à ces nouvelles formes de création littéraire.The past few years have witnessed the online proliferation of personal websites, blogs, intimate diaries, poetry sites, and personal columns. The success of Skyblogs, publishing support geared to teenagers, is but the most mediatized indicator of a phenomenon that is affecting all levels of the population. Now anyone can be an author. The possibility of reaching a few million Web surfers, and the hope of discovery by a real (hard copy) publisher, motivates many authors to put their textual productions on the Web. The network is rife with blogs, intimate diaries and serial novels, presented in fairly traditional format: the hypertext link, a revolutionary syntactic tool, is used only inside a summary facilitating the serial reading/writing of textual material. Textual animation, the semantic tool that profoundly renews the graphic aspect of the written text, is virtually absent from these creations, being largely reduced to a gadget function. The programming computer codes present beneath the screen surface play only a secondary role. A second kind of network literature has also developed, as yet little known by the general public, but promising even more astonishing discoveries. For a dozen years, circles of writers distant from publication circuits and the dissemination of paper literature have gathered around the concept of a digital literature fully utilizing the potentialities of the computer medium. Animation, interactivity and creative programming characterize these new literary creations on digital support. Thus developed an initial particularity of Digital Literature, in calligrams and animated metaphors and in syntactic animation, in the inter-semiotic relations between the animated text and the fixed image, between the fixed text and the animated image, that draw on a prime feature of digital literature. As well, the dynamization of the written via the hypertext link, activated by a reader’s click, entices a growing number of authors to experiment with digital support. A third “genre” of the new digital literature involves a reflection on the role of the program. The main thrust of this article is to outline the convergences and the differences between the three principal genres of digital literature. Using a number of representative examples, I then present analytical tools adapted to these new forms of literary creation

    Musiquer : plaidoyer évolutionniste transdisciplinaire

    Full text link
    Le sujet prend appui sur une hypothèse : à l’origine, la musique est un phénomène culturel et biologique, social (et donc pas privé) et communautaire (et donc pas individuel). Les travaux de plusieurs théoriciens évolutionnistes du langage et/ou de la musique étayent l’hypothèse selon laquelle l’objet de la musique dépasse l’opposition nature-culture. Quelle est alors l’influence de ces caractéristiques sur l’apparition de la musicalité ou d’une faculté de musique ? Pour avancer dans notre réflexion, nous mesurons la contribution des recherches sur les amusies quant à la question des origines de la musique. Par la suite, nous étudions le rapport entre l’intentionnalité et l’évolution de la musique. Nous nous concentrons sur la nature sociale du phénomène musical, puis proposons l'intégration de la caractérisation biologique et sociale de la musique dans une conception institutionnelle et communautaire. Ainsi fondée philosophiquement, notre hypothèse de départ devient le véhicule du dépassement disciplinaire convoité. Enfin, certaines options proposées par différents auteurs décrivant la contribution de la musique au développement de réseaux neuronaux à la propriété miroir sont évoquées. Et nous tentons de répondre à cette question, inévitable : la musique peut-elle, étant donné son caractère irréductiblement culturel, social et communautaire, entretenir des connexions neuronales? Nous examinons notamment à cette fin les implications de la théorie du chaos et des résultats des simulations informatiques multi-agents.The subject is based on an assumption: originally, the music is a cultural and a biological phenomenon, it is social (and not private) and institutional (and not individual). Several evolutionary theorists of language and/or music support the hypothesis that the purpose of language/music is beyond the opposition between nature and culture. Assuming those characteristics, then what is their influence on the development of musicality or of a faculty of music? To advance our thinking, we point out researches on the musical brain. Precisely, we evaluate the contribution of researches on amusia to the question of the origin of music. Subsequently, we study the relationship between intentionality and the evolution of music. Then, we focus on the social nature of the musical phenomenon, and propose to integrate social and biological characterization of music in a community and institutional conception. From then on, our assumption is philosophically founded and we assume that it can be an appropriate vehicle to exceed the disciplinary’s limits. Finally, we present some options proposed by different authors describing the contribution of music to the development of neural networks with a “mirror” property. Then, we try to answer this inevitable question: can music, given its irreducibly cultural, social and institutional characteristics, maintain neural connections? About this part, we examine the implications of chaos theory and the results of computer simulations

    Le développement de la créativité dans la formation des enseignants

    Get PDF
    Dans le monde de la pédagogie et des enseignants, on associe presque naturellement la notion de créativité aux disciplines de type artistique. Or, s’il est vrai que ce domaine tombe immédiatement sous le sens, on oublie souvent que les esprits les plus créatifs, comme le relève très justement le journal Le MONDE dans son numéro du 16 septembre 2009, sont souvent des scientifiques

    Chanter avec les mains : interfaces chironomiques pour les instruments de musique numériques

    Get PDF
    This thesis deals with the real-time control of singing voice synthesis by a graphic tablet, based on the digital musical instrument Cantor Digitalis.The relevance of the graphic tablet for the intonation control is first considered, showing that the tablet provides a more precise pitch control than real voice in experimental conditions.To extend the accuracy of control to any situation, a dynamic pitch warping method for intonation correction is developed. It enables to play under the pitch perception limens preserving at the same time the musician's expressivity. Objective and perceptive evaluations validate the method efficiency.The use of new interfaces for musical expression raises the question of the modalities implied in the playing of the instrument. A third study reveals a preponderance of the visual modality over the auditive perception for the intonation control, due to the introduction of visual clues on the tablet surface. Nevertheless, this is compensated by the expressivity allowed by the interface.The writing or drawing ability acquired since early childhood enables a quick acquisition of an expert control of the instrument. An ensemble of gestures dedicated to the control of different vocal effects is suggested.Finally, an intensive practice of the instrument is made through the Chorus Digitalis ensemble, to test and promote our work. An artistic research has been conducted for the choice of the Cantor Digitalis' musical repertoire. Moreover, a visual feedback dedicated to the audience has been developed, extending the perception of the players' pitch and articulation.Le travail de cette thèse porte sur l'étude du contrôle en temps réel de synthèse de voix chantée par une tablette graphique dans le cadre de l'instrument de musique numérique Cantor Digitalis.La pertinence de l'utilisation d'une telle interface pour le contrôle de l'intonation vocale a été traitée en premier lieu, démontrant que la tablette permet un contrôle de la hauteur mélodique plus précis que la voix réelle en situation expérimentale.Pour étendre la justesse du jeu à toutes situations, une méthode de correction dynamique de l'intonation a été développée, permettant de jouer en dessous du seuil de perception de justesse et préservant en même temps l'expressivité du musicien. Des évaluations objective et perceptive ont permis de valider l'efficacité de cette méthode.L'utilisation de nouvelles interfaces pour la musique pose la question des modalités impliquées dans le jeu de l'instrument. Une troisième étude révèle une prépondérance de la perception visuelle sur la perception auditive pour le contrôle de l'intonation, due à l'introduction d'indices visuels sur la surface de la tablette. Néanmoins, celle-ci est compensée par l'important pouvoir expressif de l'interface.En effet, la maîtrise de l'écriture ou du dessin dès l'enfance permet l'acquisition rapide d'un contrôle expert de l'instrument. Pour formaliser ce contrôle, nous proposons une suite de gestes adaptés à différents effets musicaux rencontrés dans la musique vocale. Enfin, une pratique intensive de l'instrument est réalisée au sein de l'ensemble Chorus Digitalis à des fins de test et de diffusion. Un travail de recherche artistique est conduit tant dans la mise en scène que dans le choix du répertoire musical à associer à l'instrument. De plus, un retour visuel dédié au public a été développé, afin d'aider à la compréhension du maniement de l'instrument

    Optimisation de tournées de camions complets dans le secteur des travaux publics

    Get PDF
    In 2013, the transportation of materials for roads construction and earthwork represents more than half of the whole activity of in the public works sector. Optimization methods for vehicle routing problems allow to solve big-size problems with industrial sector constraints. In this thesis, we focus on solving the rich full truckload pickup and delivery problem with resource synchronization. First, we solve this vehicle routing problem with a two phase heuristic method. Then, we study the integration of regulation of drivers’ working hours and the addition of lunch breaks in routes of vehicles. These methods are tested on instances from the literature and real life instances from a public works company.Le transport de matériaux pour la réalisation d’infrastructures routières et le terrassement représente, en 2013, plus de la moitié de l’activité du secteur des travaux publics. Les méthodes d’optimisation de tournées de véhicules permettent aujourd’hui de résoudre des problèmes de grandes tailles en intégrant les contraintes liées au métier. Dans cette thèse, nous nous intéressons à la résolution du problème riche de collectes et livraisons en camions complets avec des contraintes de synchronisation sur les ressources. Dans un premier temps, nous résolvons le problème de tournées de véhicules avec une méthode heuristique en deux phases. Dans un second temps, nous étudions l’intégration des contraintes liées aux temps de conduite des chauffeurs ainsi que l’ajout des pauses déjeuners aux tournées. Nous testons les algorithmes proposés sur des instances de la littérature et des instances réelles issues d’une application industrielle d’une entreprise de Travaux Publics

    Représentations redondantes et hiérarchiques pour l'archivage et la compression de scènes sonores

    Get PDF
    L'objet de cette thèse est l'analyse et le traitement automatique de grands volumes de données audio. Plus particulièrement, on s'intéresse à l'archivage, tâche qui regroupe, au moins, deux problématiques: la compression des données, et l'indexation du contenu de celles-ci. Ces deux problématiques définissent chacune des objectifs, parfois concurrents, dont la prise en compte simultanée s'avère donc difficile. Au centre de cette thèse, il y a donc la volonté de construire un cadre cohérent à la fois pour la compression et pour l'indexation d'archives sonores. Les représentations parcimonieuses de signaux dans des dictionnaires redondants ont récemment montré leur capacité à remplir une telle fonction. Leurs propriétés ainsi que les méthodes et algorithmes permettant de les obtenir sont donc étudiés dans une première partie de cette thèse. Le cadre applicatif relativement contraignant (volume des données) va nous amener à choisir parmi ces derniers des algorithmes itératifs, appelés également gloutons. Une première contribution de cette thèse consiste en la proposition de variantes du célèbre Matching Pursuit basées sur un sous-échantillonnage aléatoire et dynamique de dictionnaires. L'adaptation au cas de dictionnaires temps-fréquence structurés (union de bases de cosinus locaux) nous permet d'espérer une amélioration significative des performances en compression de scènes sonores. Ces nouveaux algorithmes s'accompagnent d'une modélisation statistique originale des propriétés de convergence usant d'outils empruntés à la théorie des valeurs extrêmes. Les autres contributions de cette thèse s'attaquent au second membre du problème d'archivage: l'indexation. Le même cadre est cette fois-ci envisagé pour mettre à jour les différents niveaux de structuration des données. Au premier plan, la détection de redondances et répétitions. A grande échelle, un système robuste de détection de motifs récurrents dans un flux radiophonique par comparaison d'empreintes est proposé. Ses performances comparatives sur une campagne d'évaluation du projet QUAERO confirment la pertinence de cette approche. L'exploitation des structures pour un contexte autre que la compression est également envisagé. Nous proposons en particulier une application à la séparation de sources informée par la redondance pour illustrer la variété de traitements que le cadre choisi autorise. La synthèse des différents éléments permet alors d'envisager un système d'archivage répondant aux contraintes par la hiérarchisation des objectifs et des traitements.The main goal of this work is automated processing of large volumes of audio data. Most specifically, one is interested in archiving, a process that encompass at least two distinct problems: data compression and data indexing. Jointly addressing these problems is a difficult task since many of their objectives may be concurrent. Therefore, building a consistent framework for audio archival is the matter of this thesis. Sparse representations of signals in redundant dictionaries have recently been found of interest for many sub-problems of the archival task. Sparsity is a desirable property both for compression and for indexing. Methods and algorithms to build such representations are the first topic of this thesis. Given the dimensionality of the considered data, greedy algorithms will be particularly studied. A first contribution of this thesis is the proposal of a variant of the famous Matching Pursuit algorithm, that exploits randomness and sub-sampling of very large time frequency dictionaries. We show that audio compression (especially at low bit-rate) can be improved using this method. This new algorithms comes with an original modeling of asymptotic pursuit behaviors, using order statistics and tools from extreme values theory. Other contributions deal with the second member of the archival problem: indexing. The same framework is used and applied to different layers of signal structures. First, redundancies and musical repetition detection is addressed. At larger scale, we investigate audio fingerprinting schemes and apply it to radio broadcast on-line segmentation. Performances have been evaluated during an international campaign within the QUAERO project. Finally, the same framework is used to perform source separation informed by the redundancy. All these elements validate the proposed framework for the audio archiving task. The layered structures of audio data are accessed hierarchically by greedy decomposition algorithms and allow processing the different objectives of archival at different steps, thus addressing them within the same framework.PARIS-Télécom ParisTech (751132302) / SudocSudocFranceF
    corecore