13 research outputs found

    Apprentissage statistique et computer experiments : approche quantitative du risque et des incertitudes en modélisation

    Get PDF
    Cette thèse s'inscrit dans le domaine de l'apprentissage statistique et dans celui des expériences simulées (computer experiments). Son objet est de proposer un cadre général permettant d'estimer les paramètres d'un code de simulation numérique de façon à reproduire au mieux certaines caractéristiques d'intérêt extraites de données observées. Ce travail recouvre le cadre classique de l'estimation paramétrique dans un modèle de régression et également la calibration de la densité de probabilité des variables d'entrée d'un code numérique afin de reproduire une loi de probabilité donnée en sortie. Une partie importante de ce travail consiste dans l'estimation paramétrique d'un code numérique à partir d'observations. Nous proposons une classe de méthode originale nécessitant une simulation intensive du code numérique, que l'on remplacera par un méta-modèle s'il est trop coûteux. Nous validons théoriquement les algorithmes proposés du point de vue non-asymptotique, en prouvant des bornes sur l'excès de risque. Ces résultats reposent entres autres sur des inégalités de concentration. Un second problème que nous abordons est celui de l'étude d'une dualité entre procédure d'estimation et nature de la prédiction recherchée. Il s'agit ici de mieux comprendre l'effet d'une procédure d'estimation des paramètres d'un code numérique sur une caractéristique d'intérêt donnée. Enfin, en pratique la détermination des paramètres optimaux au sens du critère donné par le risque empirique nécessite la recherche du minimum d'une fonction généralement non convexe et possédant plusieurs minima locaux. Nous proposons un algorithme stochastique consistant à combiner une régularisation du critère par convolution avec un noyau gaussien, de variance décroissante au fil des itérations, avec une méthode d'approximation stochastique du type Kiefer-Wolfowitz.This thesis work consists in gathering statistical learning theory with the field of computer experiments. As the considered computer codes are only known through simulations, we propose an original statistical framework, including the classical ones, which takes into account the simulation aspect. We investigate learning algorithms for parameter estimation in computer codes which depend on both observed and simulation data. We validate these algorithms by proving excess risk bounds using concentration inequalities. We also study the duality between the estimation procedure and the wanted feature prediction. Here, we try to understand the impact of an estimation procedure on some given characteristic of the phenomenon of interest. Finally, the computation of optimal parameters in practice involves the minimization of a criterion which is generally highly non convex and with irregularities. We propose a stochastic algorithm which consists in combining regularization methods with a stochastic approximation method like the Kiefer-Wolfowitz one

    New sensitivity analysis subordinated to a contrast

    Get PDF
    International audienceIn a model of the form Y=h(X1,…,Xd)Y=h(X_1,\ldots,X_d) where the goal is to estimate a parameter of the probability distribution of YY, we define new sensitivity indices which quantify the importance of each variable XiX_i with respect to this parameter of interest. The aim of this paper is to define {\it goal oriented sensitivity indices} and we will show that Sobol indices are sensitivity indices associated to a particular characteristic of the distribution YY. We name the framework we present as {\it Goal Oriented Sensitivity Analysis} (GOSA)

    Risk bounds for new M-estimation problems

    Get PDF
    International audienceIn this paper, we develop new algorithms for parameter estimation in the case of models type Input/Output in order to represent and to characterize a phenomenon Y. From experimental data Y_{1},...,Y_{n} supposed to be i.i.d from Y, we prove risk bounds qualifying the proposed procedures in terms of the number of experimental data n, computing budget m and model complexity. The methods we present are general enough which should cover a wide range of applications

    Stochastic inverse problem with noisy simulator - Application to aeronautical model

    Get PDF
    International audienceInverse problem is a current practice in engineering where the goal is to identify parameters from observed data through numerical models. These numerical models, also called Simulators, are built to represent the phenomenon making possible the inference. However, such representation can include some part of variability or commonly called uncertainty (see [4]), arising from some variables of the model. The phenomenon we study is the fuel mass needed to link two given countries with a commercial aircraft, where we only consider the Cruise phase . From a data base of fuel mass consumptions during the cruise phase, we aim at identifying the Speci c Fuel Consumption (SFC) in a robust way, given the uncertainty of the cruise speed V and the lift-to-drag ratio F. In this paper, we present an estimation procedure based on Maximum-Likelihood estimation, taking into account this uncertainty

    A Stochastic Algorithm for M-estimator Computation

    No full text
    Most of statistical procedures consist in estimating parameters by minimizing (or maximizing) some criterion, a minimizing parameter isalso called in the statistical literature M-estimator. So to compute an M-estimator consists in finding a global minimum. Depending on the statistical problem and the available information, the criterion to minimize may be more or less complicated: non convex, no gradient, non smooth etc... Moreover, generally only evaluations of the criterion are reachable. Thus, it can be difficult in practice to compute a M-estimator. We propose a new procedure to compute a global minimum, using a stochastic algorithm to take advantage of various smooth versions of the criterion
    corecore