316 research outputs found

    Risk bounds for purely uniformly random forests

    Get PDF
    Random forests, introduced by Leo Breiman in 2001, are a very effective statistical method. The complex mechanism of the method makes theoretical analysis difficult. Therefore, a simplified version of random forests, called purely random forests, which can be theoretically handled more easily, has been considered. In this paper we introduce a variant of this kind of random forests, that we call purely uniformly random forests. In the context of regression problems with a one-dimensional predictor space, we show that both random trees and random forests reach minimax rate of convergence. In addition, we prove that compared to random trees, random forests improve accuracy by reducing the estimator variance by a factor of three fourths

    A theoretical diagram for scientific activities with simulation software in physics learning

    Get PDF
    Les logiciels de simulation sont considérés a priori comme des outils privilégiés pour l'étude des théories et modÚles dans le cadre de l'enseignement secondaire et supérieur. Mais la diversité des logiciels est grande et les indications sur leur utilisation pédagogique sont souvent absentes. Sur la base d'études exploratoires, nous proposons un schéma théorique qui permet d'expliciter les spécificités de la simulation numérique et de ses utilisations pour l'apprentissage des modÚles en sciences. Il permet, en retour, d'interpréter les difficultés rencontrées par les élÚves et les étudiants, et de guider l'enseignant dans l'élaboration d'activités en cohérence avec les logiciels

    10 simple rules to create a serious game, illustrated with examples from structural biology

    Full text link
    Serious scientific games are games whose purpose is not only fun. In the field of science, the serious goals include crucial activities for scientists: outreach, teaching and research. The number of serious games is increasing rapidly, in particular citizen science games, games that allow people to produce and/or analyze scientific data. Interestingly, it is possible to build a set of rules providing a guideline to create or improve serious games. We present arguments gathered from our own experience ( Phylo , DocMolecules , HiRE-RNA contest and Pangu) as well as examples from the growing literature on scientific serious games

    Manifold-driven Grouping of Skeletal Muscle Fibers

    Get PDF
    In this report, we present a manifold clustering method for the classification of fibers obtained from diffusion tensor images (DTI) of the human skeletal muscle. To this end, we propose the use of angular Hilbertian metrics between multivariate normal distributions to define a family of distances between tensors that we generalize to fibers. The obtained metrics between fiber tracts encompasses both diffusion and localization information. As far as clustering is concerned, we use two methods. The first approach is based on diffusion maps and k-means clustering in the spectral embedding space. The second approach uses a linear programming formulation of prototype-based clustering. This formulation allows for classification over manifolds without the necessity to embed the data in low dimensional spaces and determines automatically the number of clusters. The experimental validation of the proposed framework is done using a manually annotated significant dataset of DTI of the calf muscle for healthy and diseased subjects

    Network Flow Algorithms for Structured Sparsity

    Get PDF
    We consider a class of learning problems that involve a structured sparsity-inducing norm defined as the sum of ℓ∞\ell_\infty-norms over groups of variables. Whereas a lot of effort has been put in developing fast optimization methods when the groups are disjoint or embedded in a specific hierarchical structure, we address here the case of general overlapping groups. To this end, we show that the corresponding optimization problem is related to network flow optimization. More precisely, the proximal problem associated with the norm we consider is dual to a quadratic min-cost flow problem. We propose an efficient procedure which computes its solution exactly in polynomial time. Our algorithm scales up to millions of variables, and opens up a whole new range of applications for structured sparse models. We present several experiments on image and video data, demonstrating the applicability and scalability of our approach for various problems.Comment: accepted for publication in Adv. Neural Information Processing Systems, 201

    DES RESEAUX DE NEURONES ARTIFICIELS A LA ROBOTIQUE COOPERATIVE

    Get PDF
    Les travaux dĂ©crits dans ce mĂ©moire rapportent une trajectoire scientifique d’une dizaine d’annĂ©es constamment guidĂ©e par le dĂ©sir d’étudier et de dĂ©velopper des modĂšles de rĂ©seaux de neurones artificiels en prise directe avec le monde rĂ©el. La premiĂšre partie de nos recherches s’est intĂ©ressĂ©e Ă  l’apprentissage au sein de systĂšmes connexionnistes multi-rĂ©seaux. En droite ligne depuis le modĂšle de la Machine SĂ©quentielle Connexionniste (MSC, dĂ©veloppĂ©e durant la thĂšse de doctorat), qui met en jeu 2 rĂ©seaux multicouches, 6 MSCs sont mises en oeuvre qui permettent l’acquisition et le contrĂŽle de la marche chez un robot hexapode. Le paradigme utilisĂ© pour la distribution des informations nĂ©cessaires Ă  chacun des modules connexionnistes est l’apprentissage par pĂ©nalitĂ©-rĂ©compense. Un robot hexapode a Ă©tĂ© construit qui valide les rĂ©sulats prĂ©alablement obtenus en simulation. L’apprentissage par pĂ©nalitĂ©-rĂ©compense appartient Ă  la classe des apprentissage par renforcement. La seconde partie de nos recherches s’est intĂ©ressĂ©e Ă  Ă©tudier les interactions entre les rĂ©seaux de neurones artificiels et l’apprentissage par renforcement. Une implantation sur rĂ©seaux multicouches, puis sur cartes auto-organisatrices du Q-learning a Ă©tĂ© proposĂ©e. Nous obtenons ainsi des rĂ©ductions de la taille mĂ©moire requise et du nombre d’itĂ©rations d’apprentissage nĂ©cessaires qui autorisent une utilisation pratique. Nous avons ensuite dĂ©veloppĂ© des mĂ©canismes de distribution de l’apprentissage par renforcement, soit au sein d’un seul robot dotĂ© de plusieurs comportements, soit au sein d’un groupe de robots dans une tĂąche impliquant la coopĂ©ration. A la diffĂ©rence des courant de recherches actuels, qui pronent l’utilisation d’ a priori face Ă  la combinatoire Ă©levĂ©e de l’espace de recherche, nous proposons l’emploi d’ a posteriori , l’utilisation du “lazy learning” pour construire un modĂšle non explicite et le dĂ©veloppement d’outils et mĂ©thodes d’aide Ă  la conception des fonctions de renforcement. A moyen terme, l’objectif de nos recherches est d’automatiser la dĂ©composition d’un comportement robotique complexe en une succession de comportements Ă©lĂ©mentaires. L’utilisation de marqueurs temporel et spatial est envisagĂ©e pour permettre le sĂ©quencement des cartes auto-organisatrices implantant les comportements Ă©lĂ©mentaires. Dans ce cas, la simple dĂ©finition de l’objectif Ă  atteindre suffirait alors Ă  gĂ©nĂ©rer le comportement solution

    Articuler histoire et informatique, enseignement et recherche : le PIREH de l’universitĂ© PanthĂ©on-Sorbonne

    Get PDF
    La crĂ©ation et l’activitĂ© du PĂŽle informatique de recherche et d’enseignement en histoire (PIREH) de l’universitĂ© Paris 1 PanthĂ©on-Sorbonne s’inscrivent dans une tradition d’utilisation des outils informatiques et statistiques en histoire depuis la crĂ©ation de l’universitĂ© en 1971. Cet article revient sur ses acteurs, leurs enseignements, leurs productions (revues, logiciels) dans les annĂ©es 1970-1980, en les replaçant dans le contexte intellectuel et technique de l’époque. La crĂ©ation du PIREH en 1999 permet de structurer cette activitĂ© et ces formations (autour notamment des bases de donnĂ©es, de la lexicomĂ©trie et de l’analyse factorielle des correspondances). Depuis la fin des annĂ©es 1990, ces pratiques et les enseignements qui y sont liĂ©s se diversifient, Ă  la faveur du dĂ©veloppement du Web, d’un meilleur accĂšs Ă  des outils variĂ©s et de collaborations interdisciplinaires auxquelles participe le PIREH. L’esquisse de cette histoire nous permet in fine de dĂ©finir ce qui caractĂ©rise l’approche de l’informatique dans le travail pĂ©dagogique et scientifique du PIREH.The Center for Computing in History (PĂŽle informatique de recherche et d’enseignement en histoire, PIREH) of Paris 1 PanthĂ©on-Sorbonne University is rooted in a tradition of using statistics and computer sciences in History since the creation of this university in 1971. This paper first presents the people involved in this field at Paris 1 in the 1970-1980s, their teaching, and their work (journals, software), by replacing them in the intellectual and technical context of the time. The creation of the PIREH in 1999 reinforced this movement and structured a curriculum based on the use of databases, text analysis and factorial analysis in History. Since the late 1990s, the activity of the PIREH is diversifying, in response to the development of the Web, to the availability of new and more accessible computing tools, and to several interdisciplinary collaborations. By retracing this history, one can better grasp the specific use the PIREH makes of computing for teaching and researching History
    • 

    corecore