80 research outputs found

    Adaptive estimation of irregular mean and covariance functions

    Full text link
    Nonparametric estimators for the mean and the covariance functions of functional data are proposed. The setup covers a wide range of practical situations. The random trajectories are, not necessarily differentiable, have unknown regularity, and are measured with error at discrete design points. The measurement error could be heteroscedastic. The design points could be either randomly drawn or common for all curves. The estimators depend on the local regularity of the stochastic process generating the functional data. We consider a simple estimator of this local regularity which exploits the replication and regularization features of functional data. Next, we use the ``smoothing first, then estimate'' approach for the mean and the covariance functions. They can be applied with both sparsely or densely sampled curves, are easy to calculate and to update, and perform well in simulations. Simulations built upon an example of real data set, illustrate the effectiveness of the new approach

    On the use of the Gram matrix for multivariate functional principal components analysis

    Full text link
    Dimension reduction is crucial in functional data analysis (FDA). The key tool to reduce the dimension of the data is functional principal component analysis. Existing approaches for functional principal component analysis usually involve the diagonalization of the covariance operator. With the increasing size and complexity of functional datasets, estimating the covariance operator has become more challenging. Therefore, there is a growing need for efficient methodologies to estimate the eigencomponents. Using the duality of the space of observations and the space of functional features, we propose to use the inner-product between the curves to estimate the eigenelements of multivariate and multidimensional functional datasets. The relationship between the eigenelements of the covariance operator and those of the inner-product matrix is established. We explore the application of these methodologies in several FDA settings and provide general guidance on their usability.Comment: 23 pages, 12 figure

    Franchissement des barrières épithéliales et endothéliales par le pathogène opportuniste Pseudomonas aeruginosa

    No full text
    P. aeruginosa is one of the main pathogens responsible for nosocomial infections. Acute infections by this bacterium are associated with high rates of morbidity and mortality, especially when bacteria disseminate in the bloodstream. In most situations, blood infection is the consequence of the crossing of two essential tissue barriers by P. aeruginosa: the epithelium for the mucosa and the endothelium for the blood vessel. Although these events are critical steps for systemic spread of bacteria, the mechanisms involved in the penetration of the pathogen in the organism are poorly understood. For the endothelium, we demonstrate that P. aeruginosa induces the cleavage of VE-cadherin, a protein of endothelial junctions, by the action of LasB, a protease secreted by the bacteria. VE-cadherin cleavage induces a loss of integrity of the endothelium, allowing bacterial access to the cellular basolateral domain. Once in this location, the Type 3 secretion system may inject toxins into the cell, triggering a major intoxication process. Crossing of the epithelial barrier involves a very different mechanism. Using real-time confocal microscopy, we show that P. aeruginosa uses a paracellular route to transmigrate, exploiting junctional weaknesses at sites of cell division and cell death. This transmigration process requires the coordinate actions of Type IV pili, the flagellum and toxins of the Type 3 secretion system.P. aeruginosa est l'un des principaux pathogènes responsables d'infections nosocomiales. Les infections aiguës à cette bactérie sont associées à une morbidité et une mortalité élevées, notamment lorsque ces bactéries envahissent le système sanguin. Dans la majorité des cas, ces infections du sang sont la conséquence du franchissement par P. aeruginosa de deux barrières tissulaires: l'épithélium pour les muqueuses et l'endothélium pour les vaisseaux. Bien que ces évènements soient des étapes cruciales de la dissémination systémique des bactéries, les mécanismes permettant la pénétration du pathogène dans l'organisme sont à ce jour mal compris. Pour l'endothélium, nous démontrons que P. aeruginosa induit le clivage de la VE-cadhérine, une protéine des jonctions intercellulaires, par l'action de la protéase LasB sécrétée par les bactéries. Le clivage de la VE-cadhérine entraîne une perte d'intégrité de l'endothélium, permettant aux bactéries d'accéder au domaine basolatéral des cellules. Les toxines du Système de Sécrétion de Type 3 peuvent être alors injectées dans la cellule, provoquant une intoxication cellulaire majeure. Le franchissement de la barrière épithéliale s'opère par un mécanisme très différent. Par microscopie confocale en temps réel, nous montrons que P. aeruginosa transmigre par une voie paracellulaire, en exploitant des faiblesses jonctionnelles aux sites de divisions et de morts cellulaires. Ce processus de transmigration requiert l'action coordonnée des pili de Type IV, du flagelle et de toxines du Système de Sécrétion de Type 3

    Méthodes statistiques pour données fonctionnelles multivariées

    No full text
    The topic of this thesis is related to functional data analysis and is motivated by modern data from automobile industry. The standard functional data methods rely on the assumption that the curves are continuously observed, without error. However, in general, the real data is neither continuously nor exactly observed. Therefore, a crucial step is to recover the trajectories from noisy measurements at discrete random points. For that, we propose an original point of view: the local regularity of the process generating the curves. Thus, combining information both within and across trajectories, we propose a simple estimator for this local regularity. Given this estimate, we build a nearly optimal local polynomial smoother of the curves from a sample of noisy trajectories. Nonparametric estimators for the mean and the covariance functions of functional data, using the local regularity of the process, are derived. Moreover, we propose a model-based clustering algorithm for a general class of functional data for which the components could be curves or images. Results of both simulated and real data show the good performances of this methods. A Python package, implementing the methods and publicly available, has been developed.Le sujet de cette thèse est lié à l'analyse de données fonctionnelles et est motivé par l'analyse de données provenant de l'industrie automobile. Les méthodes standards concernant les données fonctionnelles sont basées sur l'hypothèse que les courbes sont observées de façon continue et sans erreur. Or, en pratique, c'est rarement le cas. Pour cette raison, une étape cruciale est de reconstruire les trajectoires à partir de mesures bruitées ayant des instants d'observations discrets et alatoires. Pour cela, nous proposons une approche originale : l'utilisation de la régularité locale du processus générant les courbes. Ainsi, utilisant le grand nombre de trajectoires, ainsi que leur variabilité intrinsèque, nous proposons un estimateur simple de cette régularité locale. Munis de cet estimateur, nous construisons un estimateur par polynômes locaux, quasiment optimal, des courbes à partir d'un échantillon de courbes bruitées. Des estimateurs non-paramétriques des fonctions moyenne et covariance pour données fonctionnelles, basés sur la régularité locale du processus, sont développés. De plus, un algorithme de groupement, de type model-based, pour une classe générale de données fonctionnelles pour laquelle les composantes peuvent être des courbes ou des images est présenté. Les résultats sur des données réelles et simulées montrent les bonnes performances de ces méthodes. Un package Python, implementant celles-ci et disponible publiquement, a été développé

    Crossing of the epithelial and endothelial barriers by the opportunistic pathogen Pseudomonas aeruginosa

    No full text
    P. aeruginosa est l'un des principaux pathogènes responsables d'infections nosocomiales. Les infections aiguës à cette bactérie sont associées à une morbidité et une mortalité élevées, notamment lorsque ces bactéries envahissent le système sanguin. Dans la majorité des cas, ces infections du sang sont la conséquence du franchissement par P. aeruginosa de deux barrières tissulaires: l'épithélium pour les muqueuses et l'endothélium pour les vaisseaux. Bien que ces évènements soient des étapes cruciales de la dissémination systémique des bactéries, les mécanismes permettant la pénétration du pathogène dans l'organisme sont à ce jour mal compris. Pour l'endothélium, nous démontrons que P. aeruginosa induit le clivage de la VE-cadhérine, une protéine des jonctions intercellulaires, par l'action de la protéase LasB sécrétée par les bactéries. Le clivage de la VE-cadhérine entraîne une perte d'intégrité de l'endothélium, permettant aux bactéries d'accéder au domaine basolatéral des cellules. Les toxines du Système de Sécrétion de Type 3 peuvent être alors injectées dans la cellule, provoquant une intoxication cellulaire majeure. Le franchissement de la barrière épithéliale s'opère par un mécanisme très différent. Par microscopie confocale en temps réel, nous montrons que P. aeruginosa transmigre par une voie paracellulaire, en exploitant des faiblesses jonctionnelles aux sites de divisions et de morts cellulaires. Ce processus de transmigration requiert l'action coordonnée des pili de Type IV, du flagelle et de toxines du Système de Sécrétion de Type 3.P. aeruginosa is one of the main pathogens responsible for nosocomial infections. Acute infections by this bacterium are associated with high rates of morbidity and mortality, especially when bacteria disseminate in the bloodstream. In most situations, blood infection is the consequence of the crossing of two essential tissue barriers by P. aeruginosa: the epithelium for the mucosa and the endothelium for the blood vessel. Although these events are critical steps for systemic spread of bacteria, the mechanisms involved in the penetration of the pathogen in the organism are poorly understood. For the endothelium, we demonstrate that P. aeruginosa induces the cleavage of VE-cadherin, a protein of endothelial junctions, by the action of LasB, a protease secreted by the bacteria. VE-cadherin cleavage induces a loss of integrity of the endothelium, allowing bacterial access to the cellular basolateral domain. Once in this location, the Type 3 secretion system may inject toxins into the cell, triggering a major intoxication process. Crossing of the epithelial barrier involves a very different mechanism. Using real-time confocal microscopy, we show that P. aeruginosa uses a paracellular route to transmigrate, exploiting junctional weaknesses at sites of cell division and cell death. This transmigration process requires the coordinate actions of Type IV pili, the flagellum and toxins of the Type 3 secretion system

    Méthodes statistiques pour données fonctionnelles multivariées

    No full text
    The topic of this thesis is related to functional data analysis and is motivated by modern data from automobile industry. The standard functional data methods rely on the assumption that the curves are continuously observed, without error. However, in general, the real data is neither continuously nor exactly observed. Therefore, a crucial step is to recover the trajectories from noisy measurements at discrete random points. For that, we propose an original point of view: the local regularity of the process generating the curves. Thus, combining information both within and across trajectories, we propose a simple estimator for this local regularity. Given this estimate, we build a nearly optimal local polynomial smoother of the curves from a sample of noisy trajectories. Nonparametric estimators for the mean and the covariance functions of functional data, using the local regularity of the process, are derived. Moreover, we propose a model-based clustering algorithm for a general class of functional data for which the components could be curves or images. Results of both simulated and real data show the good performances of this methods. A Python package, implementing the methods and publicly available, has been developed.Le sujet de cette thèse est lié à l'analyse de données fonctionnelles et est motivé par l'analyse de données provenant de l'industrie automobile. Les méthodes standards concernant les données fonctionnelles sont basées sur l'hypothèse que les courbes sont observées de façon continue et sans erreur. Or, en pratique, c'est rarement le cas. Pour cette raison, une étape cruciale est de reconstruire les trajectoires à partir de mesures bruitées ayant des instants d'observations discrets et alatoires. Pour cela, nous proposons une approche originale : l'utilisation de la régularité locale du processus générant les courbes. Ainsi, utilisant le grand nombre de trajectoires, ainsi que leur variabilité intrinsèque, nous proposons un estimateur simple de cette régularité locale. Munis de cet estimateur, nous construisons un estimateur par polynômes locaux, quasiment optimal, des courbes à partir d'un échantillon de courbes bruitées. Des estimateurs non-paramétriques des fonctions moyenne et covariance pour données fonctionnelles, basés sur la régularité locale du processus, sont développés. De plus, un algorithme de groupement, de type model-based, pour une classe générale de données fonctionnelles pour laquelle les composantes peuvent être des courbes ou des images est présenté. Les résultats sur des données réelles et simulées montrent les bonnes performances de ces méthodes. Un package Python, implementant celles-ci et disponible publiquement, a été développé

    Méthodes statistiques pour données fonctionnelles multivariées

    No full text
    Le sujet de cette thèse est lié à l'analyse de données fonctionnelles et est motivé par l'analyse de données provenant de l'industrie automobile. Les méthodes standards concernant les données fonctionnelles sont basées sur l'hypothèse que les courbes sont observées de façon continue et sans erreur. Or, en pratique, c'est rarement le cas. Pour cette raison, une étape cruciale est de reconstruire les trajectoires à partir de mesures bruitées ayant des instants d'observations discrets et alatoires. Pour cela, nous proposons une approche originale : l'utilisation de la régularité locale du processus générant les courbes. Ainsi, utilisant le grand nombre de trajectoires, ainsi que leur variabilité intrinsèque, nous proposons un estimateur simple de cette régularité locale. Munis de cet estimateur, nous construisons un estimateur par polynômes locaux, quasiment optimal, des courbes à partir d'un échantillon de courbes bruitées. Des estimateurs non-paramétriques des fonctions moyenne et covariance pour données fonctionnelles, basés sur la régularité locale du processus, sont développés. De plus, un algorithme de groupement, de type model-based, pour une classe générale de données fonctionnelles pour laquelle les composantes peuvent être des courbes ou des images est présenté. Les résultats sur des données réelles et simulées montrent les bonnes performances de ces méthodes. Un package Python, implementant celles-ci et disponible publiquement, a été développé.The topic of this thesis is related to functional data analysis and is motivated by modern data from automobile industry. The standard functional data methods rely on the assumption that the curves are continuously observed, without error. However, in general, the real data is neither continuously nor exactly observed. Therefore, a crucial step is to recover the trajectories from noisy measurements at discrete random points. For that, we propose an original point of view: the local regularity of the process generating the curves. Thus, combining information both within and across trajectories, we propose a simple estimator for this local regularity. Given this estimate, we build a nearly optimal local polynomial smoother of the curves from a sample of noisy trajectories. Nonparametric estimators for the mean and the covariance functions of functional data, using the local regularity of the process, are derived. Moreover, we propose a model-based clustering algorithm for a general class of functional data for which the components could be curves or images. Results of both simulated and real data show the good performances of this methods. A Python package, implementing the methods and publicly available, has been developed
    • …
    corecore