6 research outputs found

    Validity Limit of the Linear Regression Models for the Prediction

    Full text link
    Monte Carlo simulation methods was used to study the effects of the data structure on the quality of the predictions in linear multiple regression. Five hundred forty (540) data files were generated of which the number of variables, R-square, the collinearity between the explanatory variables and the index of coefficient, that measures the importance of the explanatory variables in the model, were controlled. Predictions were influenced by the theoretical value of R-square, the method used to establish the model and, to a lesser extent, the collinearity between the explanatory variables. The determination of the minimal sample size which leads to predicted values better than those obtained by the mean of the dependant variable indicated that this size depends on the number of the explanatory variables, the theretical value of the R-square and the method used to establish the model. The minimal sample size increases with the models without variables selection and gradually decreases with the intensity of the selection

    Introduction à la programmation avec Matlab sous windows

    Full text link
    L'objet de cette note est de faire une petite introduction au logiciel Matlab sous windows. A travers cette présentation, nous avons montré quelques atouts du logiciel. Cette présentation est ensuite illustrée par quelques exemples de programmation avec le logiciel.This note aims to introduce Matlab software. Through this presentation we show a few advantages of the software. This presentation is then illustrated by a few examples of program with the software

    Modèle de productivité et tarif de cubage des peuplements de teck (tectona grandis L. F.) au Sud-Bénin

    Full text link
    peer reviewedCette étude vise à élaborer un modèle de productivité et un tarif de cubage des peuplements purs, équiennes et relativement homogène de teck au Sud Bénin. Les paramètres dendrométriques sont obtenus sur un échantillon de 104 placettes temporaires réparties dans différentes classes d'âges et de productivité. Le modèle de productivité est établi à partir des données d'analyses de tiges réalisées sur 19 arbres dominants d'âge et de classes de fertilité différents. L'ajustement d'un faisceau de courbes de productivité est obtenu par la régression sériée. L'équation d'estimation du volume des peuplements établie fait ressortir que l'âge, l'indice de productivité et la surface terrière sont les paramètres dendrométriques déterminants pour le cubage des peuplements.This study aims to build site index model and stem volume function of pure, even aged and relatively homogeneous teak stands in south Benin. The characteristics of the stands were obtained from the inventory of 104 temporary plots sampled from stands with different ages and fertility. The stem analysis of 19 dominant trees wer used to establish, by serial regression, a model giving the evolution of top height according to the age. The site index curves were built in order to determine site index of the stands. The estimated volume function obtained shows that age, site index and basal area are the main stand parameters of stem volume funtion

    Sur l'erreur résiduelle obtenue en régression linéaire multiple.

    Full text link
    The residual error is one of the most used criteria for the choice of regression model. The large majority of the criteria for model selection are also functions of the usual variance estimate for a regression model, as Akaike criterion information [Akaike, 1973] and Mallows’ criterion [Mallows, 1964]. The effectiveness of these criteria to approach the theoretical model is related to the good estimate of the theoretical residual error of the model. This efficiency is often limited by the sample size used for the estimates. The choice of a invalid model can have bad consequences on the objective of the research in particular on the forecasts, interpretations and the conclusions. We studied by Monte Carlo simulation the effects of the data structure on the quality of the residual error obtained in multiple linear regression. The results showed that the estimator is a good estimator when the model is established without selection of variables, but becomes biased when the model results from a selection of variables. Colinearity between the explanatory variables and the index which measure the importance of the variables in the true model do not have an influence on the quality of the estimator.L’erreur résiduelle est l’un des critères les plus utilisés pour le choix d’un modèle de régression. Elle intervient également dans la plupart des autres critères de sélection de modèles, notamment dans le critère d’information d’Akaike [Akaike, 1973] et le critère [Mallows, 1964]. L’efficacité de ces critères à approcher le modèle théorique est liée à la bonne estimation de l’erreur résiduelle théorique du modèle. Cette efficacité est souvent limitée par la taille de l’échantillon utilisé lors des estimations. Le choix d’un mauvais modèle peut avoir des conséquences néfastes sur l’objectif de la recherche en particulier sur les prévisions, les interprétations et les conclusions. Par simulation, nous étudions à travers une gamme variée de jeux de données l’influence de la structure des données sur l’estimateur de l’erreur résiduelle obtenue en régression linéaire multiple. Les résultats ont montré que l’estimateur de l’erreur résiduelle se comporte bien lorsque le modèle est établi sans sélection de variables, mais devient biaisé lorsque le modèle est issu d’une sélection de variables. La colinéarité entre les variables explicatives et l'indice de décroissance des coefficients de régression, qui mesure l'importance des variables dans le modèle théorique n'ont pas d’influence sur la qualité de cet estimateur