316 research outputs found
Risk bounds for purely uniformly random forests
Random forests, introduced by Leo Breiman in 2001, are a very effective
statistical method. The complex mechanism of the method makes theoretical
analysis difficult. Therefore, a simplified version of random forests, called
purely random forests, which can be theoretically handled more easily, has been
considered. In this paper we introduce a variant of this kind of random
forests, that we call purely uniformly random forests. In the context of
regression problems with a one-dimensional predictor space, we show that both
random trees and random forests reach minimax rate of convergence. In addition,
we prove that compared to random trees, random forests improve accuracy by
reducing the estimator variance by a factor of three fourths
A theoretical diagram for scientific activities with simulation software in physics learning
Les logiciels de simulation sont considérés a
priori comme des outils privilégiés pour l'étude des
théories et modÚles dans le cadre de l'enseignement secondaire et
supérieur. Mais la diversité des logiciels est grande et les
indications sur leur utilisation pédagogique sont souvent absentes. Sur la
base d'études exploratoires, nous proposons un schéma
théorique qui permet d'expliciter les spécificités de la
simulation numérique et de ses utilisations pour l'apprentissage des
modÚles en sciences. Il permet, en retour, d'interpréter les
difficultés rencontrées par les élÚves et les
Ă©tudiants, et de guider l'enseignant dans l'Ă©laboration
d'activités en cohérence avec les logiciels
10 simple rules to create a serious game, illustrated with examples from structural biology
Serious scientific games are games whose purpose is not only fun. In the
field of science, the serious goals include crucial activities for scientists:
outreach, teaching and research. The number of serious games is increasing
rapidly, in particular citizen science games, games that allow people to
produce and/or analyze scientific data. Interestingly, it is possible to build
a set of rules providing a guideline to create or improve serious games. We
present arguments gathered from our own experience ( Phylo , DocMolecules ,
HiRE-RNA contest and Pangu) as well as examples from the growing literature on
scientific serious games
Manifold-driven Grouping of Skeletal Muscle Fibers
In this report, we present a manifold clustering method for the classification of fibers obtained from diffusion tensor images (DTI) of the human skeletal muscle. To this end, we propose the use of angular Hilbertian metrics between multivariate normal distributions to define a family of distances between tensors that we generalize to fibers. The obtained metrics between fiber tracts encompasses both diffusion and localization information. As far as clustering is concerned, we use two methods. The first approach is based on diffusion maps and k-means clustering in the spectral embedding space. The second approach uses a linear programming formulation of prototype-based clustering. This formulation allows for classification over manifolds without the necessity to embed the data in low dimensional spaces and determines automatically the number of clusters. The experimental validation of the proposed framework is done using a manually annotated significant dataset of DTI of the calf muscle for healthy and diseased subjects
Network Flow Algorithms for Structured Sparsity
We consider a class of learning problems that involve a structured
sparsity-inducing norm defined as the sum of -norms over groups of
variables. Whereas a lot of effort has been put in developing fast optimization
methods when the groups are disjoint or embedded in a specific hierarchical
structure, we address here the case of general overlapping groups. To this end,
we show that the corresponding optimization problem is related to network flow
optimization. More precisely, the proximal problem associated with the norm we
consider is dual to a quadratic min-cost flow problem. We propose an efficient
procedure which computes its solution exactly in polynomial time. Our algorithm
scales up to millions of variables, and opens up a whole new range of
applications for structured sparse models. We present several experiments on
image and video data, demonstrating the applicability and scalability of our
approach for various problems.Comment: accepted for publication in Adv. Neural Information Processing
Systems, 201
DES RESEAUX DE NEURONES ARTIFICIELS A LA ROBOTIQUE COOPERATIVE
Les travaux dĂ©crits dans ce mĂ©moire rapportent une trajectoire scientifique dâune dizaine dâannĂ©es constamment guidĂ©e par le dĂ©sir dâĂ©tudier et de dĂ©velopper des modĂšles de rĂ©seaux de neurones artificiels en prise directe avec le monde rĂ©el. La premiĂšre partie de nos recherches sâest intĂ©ressĂ©e Ă lâapprentissage au sein de systĂšmes connexionnistes multi-rĂ©seaux. En droite ligne depuis le modĂšle de la Machine SĂ©quentielle Connexionniste (MSC, dĂ©veloppĂ©e durant la thĂšse de doctorat), qui met en jeu 2 rĂ©seaux multicouches, 6 MSCs sont mises en oeuvre qui permettent lâacquisition et le contrĂŽle de la marche chez un robot hexapode. Le paradigme utilisĂ© pour la distribution des informations nĂ©cessaires Ă chacun des modules connexionnistes est lâapprentissage par pĂ©nalitĂ©-rĂ©compense. Un robot hexapode a Ă©tĂ© construit qui valide les rĂ©sulats prĂ©alablement obtenus en simulation. Lâapprentissage par pĂ©nalitĂ©-rĂ©compense appartient Ă la classe des apprentissage par renforcement. La seconde partie de nos recherches sâest intĂ©ressĂ©e Ă Ă©tudier les interactions entre les rĂ©seaux de neurones artificiels et lâapprentissage par renforcement. Une implantation sur rĂ©seaux multicouches, puis sur cartes auto-organisatrices du Q-learning a Ă©tĂ© proposĂ©e. Nous obtenons ainsi des rĂ©ductions de la taille mĂ©moire requise et du nombre dâitĂ©rations dâapprentissage nĂ©cessaires qui autorisent une utilisation pratique. Nous avons ensuite dĂ©veloppĂ© des mĂ©canismes de distribution de lâapprentissage par renforcement, soit au sein dâun seul robot dotĂ© de plusieurs comportements, soit au sein dâun groupe de robots dans une tĂąche impliquant la coopĂ©ration. A la diffĂ©rence des courant de recherches actuels, qui pronent lâutilisation dâ a priori face Ă la combinatoire Ă©levĂ©e de lâespace de recherche, nous proposons lâemploi dâ a posteriori , lâutilisation du âlazy learningâ pour construire un modĂšle non explicite et le dĂ©veloppement dâoutils et mĂ©thodes dâaide Ă la conception des fonctions de renforcement. A moyen terme, lâobjectif de nos recherches est dâautomatiser la dĂ©composition dâun comportement robotique complexe en une succession de comportements Ă©lĂ©mentaires. Lâutilisation de marqueurs temporel et spatial est envisagĂ©e pour permettre le sĂ©quencement des cartes auto-organisatrices implantant les comportements Ă©lĂ©mentaires. Dans ce cas, la simple dĂ©finition de lâobjectif Ă atteindre suffirait alors Ă gĂ©nĂ©rer le comportement solution
Articuler histoire et informatique, enseignement et recherche : le PIREH de lâuniversitĂ© PanthĂ©on-Sorbonne
La crĂ©ation et lâactivitĂ© du PĂŽle informatique de recherche et dâenseignement en histoire (PIREH) de lâuniversitĂ© Paris 1 PanthĂ©on-Sorbonne sâinscrivent dans une tradition dâutilisation des outils informatiques et statistiques en histoire depuis la crĂ©ation de lâuniversitĂ© en 1971. Cet article revient sur ses acteurs, leurs enseignements, leurs productions (revues, logiciels) dans les annĂ©es 1970-1980, en les replaçant dans le contexte intellectuel et technique de lâĂ©poque. La crĂ©ation du PIREH en 1999 permet de structurer cette activitĂ© et ces formations (autour notamment des bases de donnĂ©es, de la lexicomĂ©trie et de lâanalyse factorielle des correspondances). Depuis la fin des annĂ©es 1990, ces pratiques et les enseignements qui y sont liĂ©s se diversifient, Ă la faveur du dĂ©veloppement du Web, dâun meilleur accĂšs Ă des outils variĂ©s et de collaborations interdisciplinaires auxquelles participe le PIREH. Lâesquisse de cette histoire nous permet in fine de dĂ©finir ce qui caractĂ©rise lâapproche de lâinformatique dans le travail pĂ©dagogique et scientifique du PIREH.The Center for Computing in History (PĂŽle informatique de recherche et dâenseignement en histoire, PIREH) of Paris 1 PanthĂ©on-Sorbonne University is rooted in a tradition of using statistics and computer sciences in History since the creation of this university in 1971. This paper first presents the people involved in this field at Paris 1 in the 1970-1980s, their teaching, and their work (journals, software), by replacing them in the intellectual and technical context of the time. The creation of the PIREH in 1999 reinforced this movement and structured a curriculum based on the use of databases, text analysis and factorial analysis in History. Since the late 1990s, the activity of the PIREH is diversifying, in response to the development of the Web, to the availability of new and more accessible computing tools, and to several interdisciplinary collaborations. By retracing this history, one can better grasp the specific use the PIREH makes of computing for teaching and researching History
- âŠ