105 research outputs found

    Spatial median and directional data

    Get PDF
    We introduce the normalized spatial median as an estimator of location for rotationally symmetric distributions on the hypersphere. We investigate some of its asymptotic properties and use them to obtain confidence regions for the modal direction of a distribution on the hypersphere. These results are then applied to the von Mises-Fisher distribution and to a contamination model. It is seen that the normalized spatial median can perform more efficiently than the normalized mean in presence of outlier

    Critères de qualité d'un classifieur généraliste

    No full text
    This paper considers the problem of choosing a good classifier. For each problem there exist an optimal classifier, but none are optimal, regarding the error rate, in all cases. Because there exists a large number of classifiers, a user would rather prefer an all-purpose classifier that is easy to adjust, in the hope that it will do almost as good as the optimal. In this paper we establish a list of criteria that a good generalist classifier should satisfy. We first discuss data analytic, these criteria are presented. Six among the most popular classifiers are selected and scored according to these criteria. Tables allow to easily appreciate the relative values of each. In the end, random forests turn out to be the best classifiers.-Cet article considère le problème de choisir un bon classifieur. Pour chaque contexte il existe un classifieur optimal selon le critère du taux d'erreur, mais aucun n'est optimal dans tous les cas. Comme il existe de nombreux classi-fieurs, lÕutilisateur préférera souvent choisir un classifieur généraliste, dont l'ajustement et l'exploitation sont à sa portée, en espérant que celui-ci fait presque aussi bien que l'optimal. Cet article établit une liste de critères que devrait rencontrer un bon classifieur généraliste, destiné à être ajusté et utilisé avec un minimum d'intervention humaine. Après avoir introduit l'analytique des données, ces critères sont présentés et commentés. Puis un sous-ensemble de six classifieurs est choisi parmi les plus populaires et des scores leur sont attribués en regard de ces critères. Des tables permettent d'apprécier les résul-tats et facilitent le choix d'un bon classifieur. Le classifieur qui ressort de cet exercice avec les meilleurs scores est la forêt aléatoire et ses variantes.léatoire (random forest) et ses variantes

    Uniqueness of the least-distances estimator in regression models with multivariate response

    No full text
    International audienc

    Critères de qualité d'un classifieur généraliste

    No full text
    This paper considers the problem of choosing a good classifier. For each problem there exist an optimal classifier, but none are optimal, regarding the error rate, in all cases. Because there exists a large number of classifiers, a user would rather prefer an all-purpose classifier that is easy to adjust, in the hope that it will do almost as good as the optimal. In this paper we establish a list of criteria that a good generalist classifier should satisfy. We first discuss data analytic, these criteria are presented. Six among the most popular classifiers are selected and scored according to these criteria. Tables allow to easily appreciate the relative values of each. In the end, random forests turn out to be the best classifiers.-Cet article considère le problème de choisir un bon classifieur. Pour chaque contexte il existe un classifieur optimal selon le critère du taux d'erreur, mais aucun n'est optimal dans tous les cas. Comme il existe de nombreux classi-fieurs, lÕutilisateur préférera souvent choisir un classifieur généraliste, dont l'ajustement et l'exploitation sont à sa portée, en espérant que celui-ci fait presque aussi bien que l'optimal. Cet article établit une liste de critères que devrait rencontrer un bon classifieur généraliste, destiné à être ajusté et utilisé avec un minimum d'intervention humaine. Après avoir introduit l'analytique des données, ces critères sont présentés et commentés. Puis un sous-ensemble de six classifieurs est choisi parmi les plus populaires et des scores leur sont attribués en regard de ces critères. Des tables permettent d'apprécier les résul-tats et facilitent le choix d'un bon classifieur. Le classifieur qui ressort de cet exercice avec les meilleurs scores est la forêt aléatoire et ses variantes.léatoire (random forest) et ses variantes

    Pediatric Reference Values for Respiratory Resistance Measured by Forced Oscillation

    No full text
    International audienc

    A four parameter generalization of the Gompertz curve suitable for somatic growth

    No full text
    International audienc

    Estimating the Signal-to-Noise ratio under repeated sampling of the same centered signal: applications to side-channel attacks on a cryptoprocessor

    No full text
    International audienceThis paper introduces an estimator of the signalto-noise ratio in the framework where a noisy source emits the same signal a number n of times. The estimator has the structure of a U-statistic from which derives many desirable properties: it is unbiased, consistent and, being a Rao-Blackwellisation of existing proposals, is closer to optimal variance-wise. However, its variance is numerically difficult to evaluate and two approximations are obtained to facilitate its use in practice. These allow to quantify the improvement in variance, which is found to be substantial as the estimator needs roughly one third of the data previously required to perform similarly. Moreover, a simulation shows that the estimator is approximately normally distributed for n as small as 10, which allows for accurate inference. The estimator is then applied to data arising in a cryptanalysis, where the numerical security of a cryptoprocessor is tested against a side-channel attack. This problem is a representative of situations where the signal-to-noise ratio must be precisely estimated for small n. We derive a rigorous data-driven approach that is shown to much enhance the efficiency of standard side-channel attacks. method
    • …
    corecore