47 research outputs found

    Lasso based feature selection for malaria risk exposure prediction

    Full text link
    In life sciences, the experts generally use empirical knowledge to recode variables, choose interactions and perform selection by classical approach. The aim of this work is to perform automatic learning algorithm for variables selection which can lead to know if experts can be help in they decision or simply replaced by the machine and improve they knowledge and results. The Lasso method can detect the optimal subset of variables for estimation and prediction under some conditions. In this paper, we propose a novel approach which uses automatically all variables available and all interactions. By a double cross-validation combine with Lasso, we select a best subset of variables and with GLM through a simple cross-validation perform predictions. The algorithm assures the stability and the the consistency of estimators.Comment: in Petra Perner. Machine Learning and Data Mining in Pattern Recognition, Jul 2015, Hamburg, Germany. Ibai publishing, 2015, Machine Learning and Data Mining in Pattern Recognition (proceedings of 11th International Conference, MLDM 2015

    Spatial structure and factors determining tree mortality in Beninese forest formations

    Get PDF
    Dead wood plays an important role in the functioning of forest ecosystems through nutrient cycles, soil fertility balance and temporary carbon storage. This research evaluates the dead wood potential, spatial structure of dead trees and factors influencing tree mortality in natural woodlands in Benin. Data were collected in eleven square plots of 10,000 m2, established in six classified forests and hunting areas of the W and Pendjari national parks. The spatial structure was investigated using Ripley's K function, and a multiple regression with variable selection allowed the identification of the biotic and abiotic factors that have an effect on dead wood density in the study areas. The density of dead wood was 32 stems/hectare, while mean quadratic diameter and basal area were 17.2 cm and 0.88 m2.ha-1, respectively. There was random and regular spatial distribution of dead trees without a positive interaction between dead and living trees, thereby pointing to fire as the main factor of tree mortality. Other factors influencing tree mortality included attacks by saproxylic animal species and other wood pests, and senescence. This study suggests that an integration of dead trees in management plans may be essential for the proper functioning of Benin's forest ecosystems. Le bois mort joue un rôle important dans le fonctionnement de l’écosystème forestier de par sa position dans les cycles de matière, le maintien de la fertilité des sols, le stockage temporaire du carbone, et par son rôle dans la structuration physique des sols. Cette recherche évalue sur la base de onze placettes carrées de 10.000 m2, installées dans six (06) forêts classées et des zones cynégétiques des parcs nationaux W et Pendjari, le potentiel en bois morts, la structure spatiale des arbres morts et les facteurs influençant la mort des arbres dans les formations naturelles du Bénin. La structure spatiale est étudiée au moyen de la fonction K de Ripley et une régression multiple avec sélection de variables a permis d’identifier les facteurs biotiques et abiotiques qui ont un effet sur la densité en bois morts dans lesdites formations. Les paramètres dendrométriques des arbres morts dans les formations naturelles étudiées sont caractérisés par avec une densité à l’hectare de 32 tiges, un diamètre quadratique moyen de 17,2 cm et une surface terrière de 0,88 m2.ha-1. La structure spatiale affiche une distribution spatiale aléatoire et régulière des arbres morts sans aucune interaction positive entre arbres morts et vivants suggérant le feu comme principal facteur de mortalité des arbres. Les autres facteurs influençant le recrutement en bois morts sont les attaques des espèces animales saproxyliques ou autres ravageurs des bois et la sénescence. L’intégration des arbres morts dans les plans aménagements est alors indispensable pour assurer un très bon fonctionnement des écosystèmes forestiers du Bénin

    Modeling the Distribution of Marketable Timber Products of Private Teak (Tectona grandis L.f.) Plantations

    Full text link
    peer reviewedManagement of marketable products of private plantations will not be sustainable without class girth be-ing identifiable readily. Modeling marketable products is a key to obtain good fitness between observed and theoretical girth distribution. We determine the best parameter recovery method with the Weibull function for two sylvicultural regimes (coppice and high forest). Data on stand variables were collected from 1101 sample plots. The three Weibull function parameters were estimated with three parameters re-covery methods: the maximum likelihood method, the method of moments and the method of percentiles. Stepwise regression and the simultaneously re-estimated parameter using the Seemingly Unrelated Re-gression Estimation were applied to model each parameter. The results indicated that the three methods successfully predicted girth size distributions within the sample stands. The method of moments was the best one with lowest values of Reynolds error index and Kolmogorov-Smirnov statistic however the syl-vicultural regimes. The Weibull parameter distribution model developed for each of the two sylvicultural regimes was quite reliable.Contribution au développement d'une filière du teck au départ des forêts privées du Sud-Bénin (Département de l'Atlantique

    Spatial distributions and interactions of trees in Sudanian woodlands: implications for forest enrichment

    Full text link
    During the last decade, management of woodlands in the Sudanian region of Benin has been based on enrichment with valuable tree-species. Yet, no previous research has been undertaken to support enrichment design with respect to plant eye view, tree growth magnitude or survival capacity under local forest environments. To fill in this gap, Ripley's K function was used to assess the spatial pattern of trees, diameter classes and dominant valuable species in the Sudanian zone. Data were collected in four sites of variable size (150 X 100 m, 150 X 100 m, 100 X 50 m and 150 X 150 m). Mostly, the spatial patterns of the target species revealed small-clumps. Within these small-clumps, intraspecific repulsions were observed on average at a 3 m scale, while interspecific repulsions were noticed at a 4.5 m scale. Only a weak repulsion between diameter size was also remarked, suggesting that proximity to adult trees would not affect the survival of young plants. With regard to observed repulsion scales, we would suggest using a minimum of a 3 m space between trees of the same species and a 4.5 m space between trees of different species, for enrichment plantings in Sudanian woodlands, if based on the target species. However, this suggested spacing may not be optimal with regard to plant growth. Further investigation is needed to address this aspect.L'aménagement forestier des savanes boisées et forêts claires en zone soudanienne au Bénin a eu recours, ces dernières années, à l'enrichissement en essences locales de valeur. Cependant, aucune étude préalable n'a été menée pour déterminer l'environnement local de chaque arbre, l'habileté des arbres à croître ou encore leur probabilité de survie dans un complexe forestier. Cette étude a utilisé la fonction de second ordre K de Ripley pour analyser la répartition spatiale des arbres, des grosseurs d'arbres et des essences dominantes de valeur. Les données ont été collectées sur quatre sites de dimensions variables (150 X 100 m, 150 X 100 m, 100 X 50 m et 150 X 150m). Il ressort de l'analyse des résultats que la plupart des essences étudiées présentent une répartition spatiale en de petits agrégats au sein desquels on observe des répulsions intraspécifiques de l'ordre de 3 m et des répulsions interspécifiques de l'ordre de 4,5 m. Par ailleurs, seule une faible répulsion est observée entre classes de grosseur et suggère que la proximité des pieds adultes n'affecte pas la survie des jeunes plants. Tenant compte des comportements de répulsion, on pourrait suggérer un écartement intraspécifique minimum de 3 m et un écartement interspécifique minimum de 4,5 m dans les processus d'enrichissement des savanes boisées et forêts claires en zone soudanienne. Toutefois, les espacements suggérés peuvent ne pas être optimaux du point de vue de la croissance des espèces. Des travaux supplémentaires permettraient d'éclaircir ce point

    Sélection de variables par le GLM-Lasso pour la prédiction du risque palustre

    Get PDF
    National audienceIn this study, we propose an automatic learning method for variables selection based on Lasso in epidemiology context. One of the aim of this approach is to overcome the pretreatment of experts in medicine and epidemiology on collected data. These pretreatment consist in recoding some variables and to choose some interactions based on expertise. The approach proposed uses all available explanatory variables without treatment and generate automatically all interactions between them. This lead to high dimension. We use Lasso, one of the robust methods of variable selection in high dimension. To avoid over fitting a two levels cross-validation is used. Because the target variable is account variable and the lasso estimators are biased, variables selected by lasso are debiased by a GLM and used to predict the distribution of the main vector of malaria which is Anopheles. Results show that only few climatic and environmental variables are the mains factors associated to the malaria risk exposure.Nous étudions dans ce travail une méthode de sélection de variables basée sur le Lasso dans le contexte épidémiologique. L'un des objectifs est de construire automatiquement un modèle prédictif en limitant le recours aux experts médicaux qui opèrent des prétraitements sur les données collectées. Ces prétraitements consistent entre autres à recoder certaines variables en classe et à choisir manuellement certaines interactions en se basant sur la connaissance des données. L'approche proposée utilise toutes les variables explicatives sans traitement et génère automatiquement toutes les interactions entre les variables, ce qui nous conduit en grande dimension. Nous utilisons le Lasso qui est une méthode robuste de sélection de variables en grande dimension. Le nombre d'observations dans les études épidémiologiques étant faible, nous proposons une validation croisée à deux niveaux pour éviter le risque de sur apprentissage dans la phase de sélection de variables. Les estimateurs Lasso étant biaisés et la variable d'intérêt qu'est lenombre d'anophèles à prédire étant discret, nous utilisons un modèle GLM pour débiaiser les variables sélectionnées par le Lasso et faire de la prédiction. Les résultats montrent que quelques variables climatiques et environnementales seulement sont des facteurs principaux liés au risque d'exposition au paludisme

    Evaluación de los recursos de teca, Tectona grandis L.f., de las plantaciones privadas des sur de Benín

    Full text link
    peer reviewedAu Sud-Bénin, les plantations privées de teck ont été installées à un rythme croissant ces trois dernières décennies. Pour combler le vide d’informations fiables sur cette ressource, une démarche méthodologique a été conçue en vue de quantifier et caractériser les plantations privées de teck et de mieux connaître les propriétaires privés impliqués dans la production de teck au Bénin. Celle-ci s’apparente à un échantillonnage boule de neige (Ebn) ou snowball sampling avec trois types d’acteurs, les agents des services forestiers, les chefs de village et les propriétaires de plantations de teck ou leur représentant. Les données collectées sont le profil socio-économique du propriétaire, le descriptif général de ses plantations et la caractérisation dendrométrique de ces dernières. En vue d’évaluer la capacité de l’Ebn, un échantillonnage par quadrats a été mis en place. L’Ebn a permis d’identifier 1 002 propriétaires et de recenser 861,10 ha de plantations de teck, Tectona grandis L.f. Près de 69 % des plantations ont moins de 6 ans, comprenant 12,4 % de jeunes plantations et 56,7 % de taillis. Les futaies âgées de plus de 20 ans ne représentent qu’une infime proportion de la ressource en teck (0,2 %). Avec un taux de boisement global très faible estimé à 3,58 %, un taux de détection de l’Ebn de 68,6 %, la surface totale en teck est estimée à 1 255,3 ha avec les limites de confiance de 1 084,5 ha et 1 574,2 ha. La géodatabase construite lors de l’application de l’Ebn sur la commune de Toffo constitue indéniablement une amorce prometteuse dans la construction d’un réseau d’acteurs impliqués dans la culture du teck. L’intérêt d’une telle approche dans le contexte d’une foresterie paysanne justifie l’application de l’Ebn aux autres communes.Private teak plantations in southern Benin have been established at an increasing rate in the last thirty years. To remedy the lack of reliable information on this resource, a methodological approach was designed to quantify and characterise private teak plantations and gain a better understanding of the private owners involved in teak production in Benin. The method involves “snowball sampling” among three categories of players: forestry service agents, village chiefs and the owners of teak plantations or their representatives. The data collected are the socio-economic profiles of the owners, an overall description of their plantations and dendrometric characterisations of these plantations. In order to assess its performance, the snowball sampling technique was tested by the quadrant method. Snowball sampling identified 1,002 owners and 861.10 ha of Tectona grandis L.f. plantations. Almost 69 % of the plantations were less than 6 years of age, of which 12.4 % were young plantations and 56.7 % coppice. Stands more than 20 years of age accounted for only a very small proportion of these teak resources (0.2 %). With a very low overall afforestation rate, estimated at 3.58 %, and a snowball sampling detection rate of 68.6%, the total area planted with teak was estimated at 1,255.3 ha, within confidence limits of 1,084.5 ha and 1,574.2 ha. The geodatabase built up during the snowball sampling campaign in the Toffo municipality is clearly a promising start for the development of a network of players involved in teak production. The value of snowball sampling in the context of small-scale sylviculture warrants its application to the other municipalities concerned.Las plantaciones privadas de teca en el sur de Benín se han ido estableciendo a un ritmo cada vez mayor en los últimos treinta años. Para llenar el vacío de información confiable sobre este recurso, se desarrolló un enfoque metodológico a fin de cuantificar y caracterizar las plantaciones privadas de teca y conocer mejor a los propietarios privados dedicados a la producción de teca en Benín. Este enfoque se asemeja al muestreo en bola de nieve (MBN) con tres tipos de actores: los agentes de los servicios forestales, los jefes de los poblados y los propietarios de las plantaciones de teca o su representante. Los datos recabados son el perfil socioeconómico del propietario, la descripción general de sus plantaciones y su caracterización dendrométrica. Se estableció un muestreo por cuadrados para evaluar la capacidad del MBN. El MBN permitió identificar 1.002 propietarios e inventariar 861,10 ha de plantaciones de teca, Tectona grandis L.f.. Casi el 69 % de las plantaciones tiene menos de 6 años, con un 12,4% de plantaciones jóvenes y 56,7% de monte bajo. El monte alto de más de 20 años apenas supone una ínfima parte de los recursos de teca (0,2%). Con una tasa de forestación global muy baja, estimada a 3,58%, y una tasa de detección del MBN de 68,6%, la superficie total de teca se estima en 1.255,3 ha, con límites de confianza de 1.084.5 ha y 1.574,2 ha. La geodatabase elaborada durante la aplicación del MBN en el municipio de Toffo constituye indudablemente un inicio prometedor para la construcción de una red de actores involucrados en el cultivo de la teca. El interés de dicho enfoque en el marco de la silvicultura campesina justifica la aplicación del MBN en otros municipios

    Modélisation des distributions des paramètres dendrométriques d’une espèce ligneuse dominante en peuplement naturel

    No full text
    Distributions modelling of dendrometrical parameters for dominant species in natural forest. In the present article, we present an approach of modelling the distribution of dendrometrical parameters from dominant species in natural forest. Data were collected on the inventory of 314 sample plots with 15 m of radius on stands with dominance of Isoberlinia spp. in three natural forests Monts Kouffé, Wari-Maro and Ouémé Supérieur in Benin. For each plots statistical parameters of Isoberlinia diameter as, m, σ\sigma2, β\beta1 and β\beta2, characteristics of distributions families were determined and used to establish model according to the dominance level and diameter average of Isoberlinia. With the best models, the theoretical crops parameters are estimated. The result showed that the distribution of diameter was the type 1 according to Pearson system. Distributions tables of stems number, basal area and volume were simulated according to diameter and dominance class.Dans le présent article, nous présentons une approche de modélisation de la distribution des paramètres dendrométriques de l’espèce dominante en forêt naturelle au Bénin. Les données utilisées proviennent de l’inventaire de 314 placettes circulaires de 15 m de rayon échantillonnées dans des faciès à dominance Isoberlinia spp. des massifs forestiers Monts Kouffé, Wari-Maro et Ouémé Supérieur au Bénin. Pour chaque placette, les paramètres statistiques relatifs au diamètre d’Isoberlinia, tels que la moyenne, Dg, la variance, σ\sigma2, les coefficients de dissymétrie et d’aplatissement de Pearson, β\beta1 et β\beta2, caractéristiques des familles de distribution sont déterminés et modélisés en fonction du degré de dominance et du diamètre quadratique moyen des tiges d’Isoberlinia. Avec les meilleurs modèles, les paramètres des peuplements théoriques sont ensuite estimés. Il ressort que la distribution des tiges est le type 1 suivant le système de Pearson. Des tables de distribution du nombre de tiges, de la surface terrière et du volume ont été simulées en fonction de la classe de grosseur et de la classe de dominance
    corecore