research

Robust statistics: a functional approach

Abstract

International audienceFor a given statistical method, good properties are usually obtained under strong hypotheses that are likely not to be verified in practice. In this context, the robustness of a method refers to its capability of keeping good properties even when the hypotheses are not verified. Statistics imply the treatment of data sets that are assumed to be the realization of random variables. The assumptions usually concern the probability distribution from which the data set is generated. One field in Statistics called “robust statistics” consists in defining some measures of robustness and proposes robust methods in the sense of these measures. After giving some basic notions of statistics, we present different well-known measures of robustness from the “robust statistics” field. In order to illustrate the ideas we consider the simple case of estimating a “mean” using the arithmetic mean, the median, the trimmed and the winzorised mean. The paper is an introductory presentation of robust statistics for readers who are not necessarily statisticians but it contains some technical details. The reader not interested in such details can read the introduction of each section and subsection where general ideas are given in simple words.Les bonnes propriétés d’une méthode statistique donnée sont généralement obtenues sous des hypothèses fortes qui ne sont pas vérifiées en pratique. Dans ce contexte, la robustesse d’une méthode consiste en sa capacité à garder de bonnes propriétés même lorsque les hypothèses ne sont pas vérifiées. La Statistique implique le traitement de donnéées qui sont supposées être la réalisation de variables aléatoires. Les hypothèses portent en général sur la distribution de probabilités sous-jacente aux données. Un domaine de la Statistique appelé “statistique robuste” consiste à définir des mesures de robustesse et à proposer des méthodes robustes au sens des mesures précédemment définies. Après avoir présenté des notions de base en statistique, nous donnons différentes mesures de robustesse bien connues dans le domaine. Pour illustrer les idées, nous considérons le cas simple de l’estimation d’une “moyenne” par la moyenne arithmétique, la médiane, la moyenne tronquée et la moyenne winzorisée. Le papier se veut un exposé introductif à la statistique robuste qui s’adresse à des lecteurs non nécessairement statisticiens mais il contient toutefois des détails techniques. Le lecteur qui n’est pas intéressé par ces détails pourra se contenter de lire l’introduction des différentes sections et sous-sections

    Similar works