59 research outputs found

    Advances in Feature Selection with Mutual Information

    Full text link
    The selection of features that are relevant for a prediction or classification problem is an important problem in many domains involving high-dimensional data. Selecting features helps fighting the curse of dimensionality, improving the performances of prediction or classification methods, and interpreting the application. In a nonlinear context, the mutual information is widely used as relevance criterion for features and sets of features. Nevertheless, it suffers from at least three major limitations: mutual information estimators depend on smoothing parameters, there is no theoretically justified stopping criterion in the feature selection greedy procedure, and the estimation itself suffers from the curse of dimensionality. This chapter shows how to deal with these problems. The two first ones are addressed by using resampling techniques that provide a statistical basis to select the estimator parameters and to stop the search procedure. The third one is addressed by modifying the mutual information criterion into a measure of how features are complementary (and not only informative) for the problem at hand

    A data-driven functional projection approach for the selection of feature ranges in spectra with ICA or cluster analysis

    Get PDF
    Prediction problems from spectra are largely encountered in chemometry. In addition to accurate predictions, it is often needed to extract information about which wavelengths in the spectra contribute in an effective way to the quality of the prediction. This implies to select wavelengths (or wavelength intervals), a problem associated to variable selection. In this paper, it is shown how this problem may be tackled in the specific case of smooth (for example infrared) spectra. The functional character of the spectra (their smoothness) is taken into account through a functional variable projection procedure. Contrarily to standard approaches, the projection is performed on a basis that is driven by the spectra themselves, in order to best fit their characteristics. The methodology is illustrated by two examples of functional projection, using Independent Component Analysis and functional variable clustering, respectively. The performances on two standard infrared spectra benchmarks are illustrated.Comment: A paraitr

    Assessment of the effects of sulfate and nitrate on the temporal evolution of Klebsiella oxytoca and Staphylococcus aureus abundance under shaking conditions, in aquatic microcosm

    Get PDF
    Most chemicals in natural aquatic media can be assimilated by bacteria. The impact of various environmental conditions on this microbial process is not always clear. This study aimed at investigating changes in the abundance of Klebsiella oxytoca and Staphylococcus aureus under different shaking conditions, in aquatic microcosms containing nitrate and sulfate. Sodium chloride solution (8.5 g NaCl•L-1), and nitrate and sulfate solutions (0.005, 0.05, 0.5 and 5 g•L-1) containing bacteria were supplemented with tryptic peptone at a final concentration of 10 g•L-1. The solutions were incubated under shaking conditions (300, 350 and 400 rev•min-1). Bacteriological analyses were performed hourly over a 6-h period. During the first 3 h of incubation, results showed that the highest values of the apparent cell growth rates (CAGRs) with K2SO4 in pure cultures, at a shaking speed 400 rev•min-1, were 0.656 h-1 for S. aureus, and 0.364 h-1 for K. oxytoca. In mixed culture, the CAGR was 0.235 h-1 for S. aureus, and 0.388 h-1 for K. oxytoca, both recorded at 300 rev•min-1. With KNO3 in pure culture solutions, the CAGR was 0.353 h-1 for S. aureus at 300 rev•min-1, and 0.367 h-1 for K. oxytoca at 350 rev•min-1. In mixed culture it was 0.454 h-1 for S. aureus and 0.393 h-1 for K. oxytoca, both recorded at 350 rev•min-1. The highest value of the apparent cell inhibition rate (CAIR) for S. aureus was 0.520 h-1 in K2SO4 (5 g•L-1, 400 rev•min-1), and 0.115 h-1 in KNO3 (5 g•L-1, 300 rev•min-1). For K. oxytoca, it was 0.07 h-1 in K2SO4 in pure culture (0.05 g•L-1, 300 rev•min-1), and 0.044 h-1 in mixed culture (0.05 g•L-1, 350 rev•min-1). In KNO3 it was 0.239 h-1 in mixed culture (5 g•L-1, 300 rev•min-1). The growth and inhibition potentials of different microbial species were impacted by the chemical concentrations and the movement speeds.L’impact de diverses conditions environnementales sur l’assimilation bactérienne dans l’eau, des composés chimiques est peu connu. La présente étude a visé l’évaluation de la dynamique d’abondance de Klebsiella oxytoca et Staphylococcus aureus sous diverses conditions, en milieu aquatique microcosme contenant du sulfate ou nitrate. Des solutions du NaCl (8,5 g•L-1), sulfate et nitrate (0,005, 0,05, 0,5 et 5 g•L-1) contenant des cellules ont été enrichies à la peptone trypsique (concentration finale 10 g•L-1), puis incubées sous conditions dynamiques (300, 350 et 400 tr•min-1). Les analyses bactériologiques ont été effectuées pendant 6 h. Il ressort qu’au cours des trois premières heures d'incubation, le taux de croissance cellulaire apparent (TCCA) le plus élevé en culture pure, contenant du K2SO4, est de 0,656 h-1 pour S. aureus, et 0,364 h-1 pour K. oxytoca, enregistrés à 400 tr•min-1. En culture mixte, il est de 0,235 h-1 pour S. aureus, et 0,388 h-1 pour K. oxytoca, enregistrés à 300 tr•min-1. Avec du KNO3, en culture pure, le TCCA est de 0,353 h-1 pour S. aureus à 300 tr•min-1, et 0,367 h-1 à 350 tr•min-1 pour K. oxytoka. En culture mixte, il est de 0,454 h-1 pour S. aureus et 0,393 h-1 pour K. oxytoca, enregistrés à 350 tr•min-1. Le taux d’inhibition cellulaire apparent (TICA) le plus élevé de S. aureus est de 0,520 h-1 en présence du K2SO4 (5 g•L-1, 400 tr•min-1), et 0,115 h-1 en présence de KNO3 (5 g•L-1, 300 tr•min-1). Pour K. oxytoca, il est de 0,07 h-1 avec du K2SO4 en culture pure (0,05 g•L-1, 300 tr•min-1), et 0,044 h-1 en culture mixte (0,05 g•L-1, 350 tr•min-1). Avec du KNO3, il est de 0,239 h-1 en culture mixte (5 g•L-1, 300 tr•min-1). La croissance et l’inhibition des microorganismes sont affectées par les concentrations en sels et la vitesse de mouvements du milieu

    Caractérisation des lipopeptides d'origine non ribosomique comme biopesticides

    No full text
    Le premier objectif de ce travail a été d étudier l implication des lipopeptides de Bacillus spp. dans la colonisation de la rhizosphère de tomates. Alors que seules les souches produisant de la surfactine sont capables de coloniser un milieu synthétique, toutes les souches testées, colonisent la rhizosphère de tomates avec une plus ou moins bonne efficacité quelque soit leur propriété de production de lipopeptide(s). L efficacité de la colonisation des racines de tomates est principalement espèce-dépendante. Ce n est que quand une souche est déjà une bonne colonisatrice que la surfactine semble améliorer cette propriété. Le deuxième objectif a été de tester l effet des lipopeptides surfactine et mycosubtiline contre le phytopathogène obligatoire de la laitue : Bremia lactucae. À l échelle du laboratoire, la mycosubtiline à 100 mg/L réduit le pourcentage de plantes infestées de 70 %. La surfactine ne montre aucun effet contre le champignon. Un mélange de mycosubtiline et de surfactine à 50 mg/L chacun diminue le pourcentage de plantes infestées de 65 %. Il semble diminuer le nombre de spores par plante infestée alors que cette propriété n est pas remarquée avec les autres traitements. L utilisation de la mycosubtiline dans une serre de culture limite la maladie aux symptômes les moins sévères et protège les plantes saines d une contamination croisée. L action des lipopeptides dans la colonisation des racines par Bacillus spp. n avait jamais été validée in situ. De même, c est la première fois que l activité des lipopeptides est testée contre un phytopathogène obligatoire.The first aim of this work was to study the role played by the lipopeptides of Bacillus spp. in the colonization of the tomato rhizosphere. While only the strains producing surfactin are able to colonize a synthetic agar medium, all the strains are able to colonize the rhizosphere of tomatoes with a more or less good efficiency, whatever the lipopeptide(s) they have the capability to produce. The efficiency of the colonization of the tomato rhizosphere is species-dependant. However, surfactine seems to improve the efficiency of only the good colonizing strains. The second aim of this thesis was to test the effect of surfactin and mycosubtilin against a biotrophic parasite of lettuce: Bremia lactucae. Used at 100 mg/L, mycosubtilin reduces the percentage of infested plants of 70 %. Surfactin does not have effect against the fungy. A mixture of mycosubtilin and surfactin at both 50 mg/L decreases the percentage of infested plants of 65 %. This mixture seems to reduce the number of spore per infested plant while this property was not found for the other treatments. The use of mycosubtilin in a greenhouse confines the disease to the lowest classes of severity and protects the healthy plants from a cross contamination.The efficiency of lipopeptides of Bacillus spp. in root colonization by these bacteria was never tested in situ before. Furthermore, this is the first time that the activity of lipopeptides is validated against an obligate phytopathogen.LILLE1-Bib. Electronique (590099901) / SudocSudocFranceF

    Etude de la qualité du piégeage des matières organiques par la matrice cimentaire vis-à-vis de la lixiviation

    No full text
    Dans le cadre de la qualité environnementale des matériaux, il est essentiel d'apporter la preuve que les matériaux à base de ciments adjuvantés ne relarguent pas ou peu de matières organiques lors de leur contact avec l'eau constituant une solution lixiviante. Les additifs organiques, tels que les agents de mouture et les superplastifiants, constituent deux classes d'adjuvants organiques utilisés de manière systématique dans la fabrication ou la formulation des matériaux cimentaires, notamment quand ils sont en contact avec l'eau potable (conduites et châteaux d'eau). Pour évaluer le piégeage de ces composés organiques par une pâte de ciment CEM I, cinq montages de lixiviation dynamique CTG-LEACHCRETE ont été mis en place et adaptés pour l'étude de pâtes de ciment formulées avec des adjuvants organiques. La seconde partie de ce travail a pour objectif de mettre au point des techniques analytiques sensibles pour la détection de traces des constituants du superplastifiant et de l'agent de mouture directement dans les produits de la lixiviation de pâtes de ciment (les lixiviats) grâce aux techniques de spectrométrie de masse MALDI-TOF et Py-THM-MS. Enfin, l'application du protocole global de "lixiviation dynamique couplée à la spectrométrie de masse" nous permet d'apprécier la présence des composés organiques suite à des essais de lixiviation de pâtes de ciment formulées avec de l'agent de mouture et du superplastifiant. Cette démarche nous a permis d'obtenir de nombreux résultats donnant des informations sur les mécanismes de piégeage des différents additifs organiques par une pâte de cimentEvidence that materials used by the industry are not damageable for the environment has become a major issue. In cement industry, organic admixtures such as grinding aids or superplasticizers ar widely used. In particular, they constitute cementitious materials in concrete contacting water like in water pipes and water tower. It is therefore essential to test whether these organic coumpounds are enventually dissolved into water by leaching. In this aim, five different dynamic leaching tests were developed and applied to a CEM I cement paste formulated with organic admixtures. In paralell, highly sensitive analytical methods based on MALDI-TOF and Py-THM-MS mass spectrometry techniques were designed in order to detect traces of leached superplasticizers or grinding aids. The dynamic leaching tests coupled to mass spectrometry allowed us to detect the presence of organic compounds in the leachate, and to better understand the mechanisms involved in the trapping of additives into a cement pasteMETZ-SCD (574632105) / SudocSudocFranceF

    Supervised Variable Clustering for Classification of NIR Spectra

    No full text
    Spectrometric data involve very high-dimensional observations representing sampled spectra. The correlation of the resulting spectral variables and their high number are two sources of difficulties in modeling. This paper proposes a supervised feature clustering algorithm that provides dimension reduction for this type of data in a classification context. The new features designed by this method are means of the original spectral variables computed on specific ranges of wavelengths and are therefore easy to interpret. Experiments on real world data show that the reduction in redundancy and in number of features leads to better performances obtained using a very low number of spectral ranges
    • …
    corecore