179 research outputs found

    Atouts et faiblesses du logiciel R en enseignement, recherche et industrie

    No full text
    International audienceDans cette conférence, nous aborderons le logiciel R sous trois aspects : son utilisation en enseignement, en recherche et dans le monde de l'entreprise. Pour chacune de ces trois utilisations, il est nécessaire d'évaluer les demandes spécifiques du domaine et les réponses qu'apporte le logiciel R. Rappelons brièvement que le logiciel R est multi-plateforme et multi-OS. Il est entièrement gratuit, très complet et offre à la fois des commandes mais aussi des menus déroulants. Il est donc raisonnable de penser que ce logiciel fera partie des logiciels de statistique les plus enseignés. Sa facilité de programmation et sa forte utilisation dans le monde de la recherche en font dès aujourd'hui un language omniprésent. On peut donc s'interroger sur les futures évolutions de R vis à vis de la recherche en statistiques. Dans la troisième partie, nous comparerons R avec ses différents concurrents et analyserons les points qui gouvernent les choix de logiciels en entreprise (prix, interface graphique, intégration dans les base de données...). Bien évidemment le logiciel est loin d'être parfait mais il comporte dès à présent des avantages qui lui valent d'être adopté par un nombre croissant d'entreprises

    Réduction itérative du biais pour des lisseurs multivariés

    No full text
    International audienceLa méthode IBR (iterated biased reduction) permet d'estimer une fonction de régression mm inconnue lorsque les variables explicatives sont à valeurs dans \mathbbR^d. Pour estimer la fonction mm, les méthodes non-paramétriques classiques souffrent du fléau de la dimension. En pratique, il faut donc supposer des hypothèses structurelles: modèles additifs, modèles à directions révélatrices... A contrario IBR estime directement la fonction de régression mm. Elle concurrence MARS, les directions révélatrices ou les modèles additifs et sur des exemples réels ou simulés et elle apporte des gains significatifs sur l'erreur de prévision. Cette méthode utilise en pratique un lisseur pilote soit de type splines plaque-minces soit de type noyau gaussien. Cet estimateur pilote est utilisé de manière répétée afin d'estimer le biais et permet de l'enlever progressivement. La méthode, à l'instar du L2L_2 boosting, nécessite donc l'estimation de l'itération optimale. Des résultats de vitesse de convergence (vitesse minimax) de l'erreur quadratique moyenne de l'estimateur (avec itération optimale) ont été obtenus. L'optimalité du critère de choix de l'itération (GCV) a aussi été démontré. Un exemple simulé simple (d=2d=2) et un exemple réel (d=8d=8) seront traités et comparés aux méthodes existantes: GAM, MARS, PPR, ou L2L_2-boosting. Un package \textsfR disponible sur le CRAN permet d'utiliser cette méthode très simplement

    Iterative Bias Reduction Multivariate Smoothing in R: The ibr Package

    Get PDF
    In multivariate nonparametric analysis curse of dimensionality forces one to use large smoothing parameters. This leads to a biased smoother. Instead of focusing on optimally selecting the smoothing parameter, we fix it to some reasonably large value to ensure an over-smoothing of the data. The resulting base smoother has a small variance but a substantial bias. In this paper, we propose an R package named ibr to iteratively correct the initial bias of the (base) estimator by an estimate of the bias obtained by smoothing the residuals. After a brief description of iterated bias reduction smoothers, we examine the base smoothers implemented in the package: Nadaraya-Watson kernel smoothers, Duchon splines smoothers and their low rank counterparts. Then, we explain the stopping rules available in the package and their implementation. Finally we illustrate the package on two examples: a toy example in R2 and the original Los Angeles ozone dataset

    Prévision de la consommation d'électricité par correction itérative du biais

    No full text
    International audienceUne prévision correcte de la consommation d'électricité est fondamentale pour le bon fonctionnement du réseau électrique français, dont Réseau de Transport d'Electricité a la charge. Les prévisions utilisées quotidiennement par RTE sont issues d'un modèle alliant une régression paramétrique non linéaire et un modèle SARIMA. Dans l'idée d'obtenir un modèle de prévision adaptatif, des méthodes de prévision non-paramétriques ont déjà été testées sans succès véritable. On sait notamment que la qualité d'un prédicteur non-paramétrique résiste mal à un grand nombre de variables explicatives, ce qu'on appelle communément le fléau de la dimension. Nous utilisons une méthode de correction itérative du biais, en lissant les résidus obtenus à chaque étape. Nous appliquons cette méthode à la consommation d'électricité française sur laquelle les performances sont bonnes

    Non-parametric lower bounds and information functions

    Get PDF
    We argue that common features of non-parametric estimation appear in parametric cases as well if there is a deviation from the classical regularity condition. Namely, in many non-parametric estimation problems (as well as some parametric cases) unbiased finite-variance estimators do not exist; neither estimator converges locally uniformly with the optimal rate; there are no asymptotically unbiased with the optimal rate estimators; etc.. We argue that these features naturally arise in particular parametric subfamilies of non-parametric classes of distributions. We generalize the notion of regularity of a family of distributions and present a general regularity condition, which leads to the notions of the information index and the information function. We argue that the typical structure of a continuity modulus explains why unbiased finite-variance estimators cannot exist if the information index is larger than two, while in typical non-parametric situations neither estimator converges locally uniformly with the optimal rate. We present a new result on impossibility of locally uniform convergence with the optimal rate

    Resistance of Dictyostelium discoideum membranes to saponin permeabilization

    Get PDF
    <p>Abstract</p> <p>Background</p> <p>Saponin is a mild detergent commonly used to permeabilize cells prior to immunofluorescence labeling of intracellular proteins. It has previously been used to that effect in <it>Dictyostelium discoideum </it>amoebae.</p> <p>Findings</p> <p>We show that saponin, contrary to Triton X-100 or alcohol, permeabilizes at best incompletely membranes of <it>Dictyostelium</it>. In cells exposed to osmotic stress, almost complete resistance to saponin permeabilization was observed.</p> <p>Conclusions</p> <p>Saponin should be used with special care to permeabilize <it>Dictyostelium </it>membranes. This unsusual property is presumably linked to the specific sterol composition of <it>Dictyostelium </it>membranes. It may also represent an adaptation of <it>Dictyostelium </it>to harsh conditions or to natural compounds encountered in its natural environment.</p

    Design, Realization, and Characterization of Advanced Adhesives for Joining Ultra-Stable C/C Based Components

    Get PDF
    The aim of this work is to develop high-performance adhesives to join carbon fiber reinforced composites (C/C) for use in aerospace applications; in order to guarantee sound mechanical strength, a low coefficient of thermal expansion, and ease of application on large components. Several different adhesive formulations, based on phenolic or cyanate-ester resins (charged with the maximum experimentally feasible amount of carbon-based fillers), are developed and tested. The measurements of the lap shear strength at room temperature of the C/C joined by means of one phenolic and one cyanate ester-based resin demonstrates that these formulations are the most suitable for the given application. A complete characterization, by means of viscosimetry, dilatometry, and thermal gravimetric analysis, coupled with gas analysis by means of mass spectroscopy, confirms that the phenolic-based formulation is the most promising joining material. A nano-indenter is used to obtain its Young modulus and hardness, both inside the joint and as a bulk cured adhesive

    Damping of tropical instability waves caused by the action of surface currents on stress

    Get PDF
    Ocean eddies and fronts affect surface stress via two mechanisms: (1) ocean surface currents altering the relative motion between air and sea and, hence, the stress fields and (2) ocean sea surface temperature (SST) gradients forcing changes in stability and near-surface winds. In this paper, we quantify the first effect and how it impacts Tropical Instability Waves (TIW) in the eastern Pacific. High-resolution satellite data and a regional coupled model are used to distinguish between stress changes due to the surface currents and those due to the changes in stability and near-surface winds. It is found that both mechanisms affect the surface stress curl, but they do so at different latitudes, allowing for their effect on Ekman pumping to be distinguished. The Ekman pumping due to the surface current effect alone, leads to significant damping of the TIWs. In terms of the eddy kinetic energy, the inclusion of surface current in the stress leads to decay with an e-folding time comparable with the period of the TIWs. It is, thus, an important damping mechanism to be included in ocean and coupled ocean-atmosphere models
    corecore