8 research outputs found

    Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular

    Get PDF
    Some techniques of multivariate statistical analysis can only be conducted on a complete data matrix, but the process of data collection often misses some elements. Imputation is a technique by which the missing elements are replaced by plausible values, so that a valid analysis can be performed on the completed data set. A multiple imputation method is proposed based on a modification to the singular value decomposition (SVD) method for single imputation, developed by Krzanowski. The method was evaluated on a genotype × environment (G × E) interaction matrix obtained from a randomized blocks experiment on Eucalyptus grandis grown in multienvironments. Values of E. grandis heights in the G × E complete interaction matrix were deleted randomly at three different rates (5%, 10%, 30%) and were then imputed by the proposed methodology. The results were assessed by means of a general measure of performance (Tacc), and showed a small bias when compared to the original data. However, bias values were greater than the variability of imputations relative to their mean, indicating a smaller accuracy of the proposed method in relation to its precision. The proposed methodology uses the maximum amount of available information, does not have any restrictions regarding the pattern or mechanism of the missing values, and is free of assumptions on the data distribution or structure.Algumas técnicas de análise estatística multivariada só podem ser realizadas com uma matriz de dados completa, porém o processo de coleta dos dados freqüentemente leva a uma matriz com dados ausentes. A imputação é uma técnica, na qual os dados ausentes são preenchidos com valores plausíveis, para uma posterior análise na matriz completa. Neste trabalho, nós propomos um método de imputação múltipla, baseado no método da decomposição por valores singulares (DVS) para imputação simples, desenvolvido por Krzanowski, e avaliado numa matriz de interação genótipos × ambientes (G × E), proveniente de um ensaio com o delineamento aleatorizado em blocos em multiambientes com genótipos de Eucalyptus grandis. Valores da altura de E. grandis da matriz completa de interação G × E foram retirados aleatoriamente em três diferentes proporções (5%, 10%, 30%), os quais foram imputados valores dados pelo método proposto. Os resultados obtidos por meio da medida geral de exatidão ou acurácia (Tacc) mostraram um viés pequeno, em relação aos valores originais. No entanto, seus valores foram maiores do que a variabilidade dos valores imputados em relação à sua média, indicando uma exatidão ou acurácia menor do método proposto em relação à sua precisão. A metodologia proposta utiliza o maior número de informação disponível, não possui qualquer restrição quanto ao padrão e mecanismo de ausência de dados e é livre de suposição sobre a distribuição ou estrutura dos dados

    Água residuária gerada em tratamento de água de piscina e possibilidade de reúso agrícola

    Get PDF
    Este trabalho teve por objetivos caracterizar e discutir a possibilidade de reúso agrícola da água de lavagem de filtros (ALAF) da piscina de um campus universitário e avaliar sua clarificação com e sem condicionamento químico, utilizando sementes de Tamarindus indica e cal. A qualidade da ALAF foi verificada em termos de parâmetros físicos, químicos, microbiológicos e biológico. Foram realizados ensaios de clarificação por gravidade com dosagens 0 e 15 g/kg SST para os dois coagulantes. O software R foi utilizado para a análise de variância, com um nível de 5% de significância. Observou-se um potencial de reúso agrícola da ALAF após seu tratamento (para remoção de SST e alumínio total), desde que acompanhado de manejo da irrigação, para algumas culturas. Para as condições dos ensaios e requisitos da análise de variância, não houve diferença entre os coagulantes tamarindo e cal, bem como na interação destes com as dosagens, para turbidez e SST no sobrenadante e, SST e alumínio total do lodo

    Multiple imputation with distribution-free using the singular value decomposition in interaction matrix

    No full text
    Algumas técnicas de análise estatística multivariada necessitam de uma matriz de dados completa, porém o processo de coleta elos dados frequentemente não leva a uma matriz com todos os dados. A imputação é uma técnica, na qual os dados ausentes são preenchidos com valores plausíveis, para uma posterior análise dos dados completados ( observados + imputados). O objetivo deste trabalho é propor um método de imputação múltipla, resultante de uma mudança no procedimento, baseado na decomposição por valores singulares (DVS), desenvolvido por Krzanowski (1988). Assim, na matriz genótipos (20) x ambientes (7), proveniente de um ensaio com o delineamento aleatorizado em blocos em multiambientes com a cultura de Eucalyptus grandis (LAVORANTI, 2003), foram retirados valores aleatoriamente (5%, 10%, 30%), os quais foram imputados pelo método proposto. Os resultados obtidos por meio da medida geral de exatidão ou acurácia (Tacc), na matriz ele interação G x E para os dados de altura de E. grandis, mostraram um viés pequeno, em relação aos valores originais, no entanto, seus valores foram maiores do que a variabilidade em relação à média dos valores imputados, indicando uma exatidão ou acurácia menor do método proposto em relação à sua alta precisão. A metodologia proposta utiliza o maior número de informação disponível, não possui qualquer restrição quanto ao padrão e mecanismo de ausência e é livre ele suposição sobre a distribuição ou estrutura dos dados.Some techniques of the multivariate statistical analysis need a complete data matrix, but the process of data collection usually does not supply a complete data matrix. The imputation is a technique, in which the missing data are replaced by plausible values, for a latter analysis of the complete data set (observed + imputed). This work aims to propose a multiple imputation method, as a product of a procedures change, based on the singular value decomposition (SVD) developed by Krzanowski (1988). Thus, in the genotype (20) x environment (7) matrix (G x E), derived from a trial following the complete randomized blocks design considering the Eucalyptus grandis genotype in multienvironments (LAVORANTI, 2003), values were retrieved randomly (5%, 10%, 30%), which were imputed by the proposed method. The results obtained by means of the general measure of accuracy (Tacc), in the interaction G X E for the height of E. grandis data matrix, showed a small bias when compared to the original data, however, its values where greater then the variability in relation to the imputed data mean, indicating a smaller accuracy of the proposed method in relation to its precision. The proposed methodology uses the greater number of information available, it does not posses any restriction about the pattern and missing mechanism and it is free of suppositions about the data distribution or structure

    Multilevel models applied in the analysis of repeated measure data.

    No full text
    Em muitos trabalhos científicos, é comum encontrar os dados estruturados de forma hierarquica, ou seja, os indivíduos em estudo estão agrupados em unidades de nível mais baixo, que por sua vez pertencem a unidades de um nível mais alto e assim sucessivamente. Na análise desse tipo de dados é importante levar em conta a estrutura hierarquica uma vez que, não faze-la, pode implicar na superestimação dos coecientes do modelo em estudo. Assim, para facilitar a análise de dados seguindo uma estrutura hierarquica, foram desenvolvidos os modelos multiníveis. Tais modelos levam em conta toda a variabilidade existente para os dados num mesmo nível como nos diferentes níveis da hierarquia. No caso da análise de dados de medidas repetidas no tempo, uma estrutura hierarquica em dois níveis pode ser considerada, organizando as ocasiões de medidas, no primeiro nível, para cada indivíduo no segundo nível. Neste trabalho, é feita uma abordagem dos modelos multiníveis para vários níveis da hierarquia bem como os métodos de estimação e teste dos parâmetros envolvidos no modelo. Como aplicação, foram analisados dados provenientes do Programa de Atenção ao Idoso (PAI), desenvolvido no ambulatório municipal Dr. Plinio do Prado Coutinho em Alfenas, M.G., em que foram observadas as variáveis Indice de Massa Corporea (imc) e Pressão Arterial dos idosos durante 22 meses. Também, foram analisados dados referentes ao teor de proteína no leite de 79 vacas australianas, coletados durante 19 semanas após o parto e submetidas a três dietas (Diggle et al., 1994). Para os dados do "PAI", foi possível verificar que as diferentes medidas de pressão arterial estão relacionadas positivamente com o imcao longo do tempo, independente de sexo, idade e estado civil. Já nos dados relativos ao teor de proteína no leite, notou-se uma redução do teor de proteína no leite ao longo do tempo, independente dos tratamentos aplicados. Foram utilizados os softwares MLwiN e SAS para a realização das análises.It is common to and data structured in a hierarchical form in several scientific works, that is, the studied subjects are nested in the lowest level unites, that belong to the highest level unites, and so on. To analyze these sort of data it is important to take in account the hierarchical structure once, if does not do it, the coeficients can be overestimated in the studied model. Then, in order to become easier the data analysis according to the hierarchical structure, multilevel models were developed. Such models take into account all the existing variability for the data at the same level as well as in diferent levels of the hierarchy. In the case of repeated measure data, a two levels hierarchical structure can be considered, organizing the occasions at the first level for each subject at the second level. In this work, na approach of the multilevel models for several levels are made as well as the estimation methods and the tests for the involved parameters in the model. As an application, data from the Elderly Care Program (ECP), developed at outpatient clinic Dr. Plinio do Prado Coutinho at Alfenas, M.G., where the Body Mass Index and the Bloody Pressure were observed from elderly people for 22 months. Also, it was analyzed the milk protein content of 79 australian cows during 19 weeks after calving and subject to three diets (Diggle et al., 1994). For the data of the ECP it was possible to observe that the bloody pressure are positively related to the occasions, independently of sex, race and marital status. For the data form the milk protein content, a reduce in the content in the occasions even after the diets are included. MLwiN and SAS softwares were used to run the analysis

    Multiple imputation with distribution-free using the singular value decomposition in interaction matrix

    No full text
    Algumas técnicas de análise estatística multivariada necessitam de uma matriz de dados completa, porém o processo de coleta elos dados frequentemente não leva a uma matriz com todos os dados. A imputação é uma técnica, na qual os dados ausentes são preenchidos com valores plausíveis, para uma posterior análise dos dados completados ( observados + imputados). O objetivo deste trabalho é propor um método de imputação múltipla, resultante de uma mudança no procedimento, baseado na decomposição por valores singulares (DVS), desenvolvido por Krzanowski (1988). Assim, na matriz genótipos (20) x ambientes (7), proveniente de um ensaio com o delineamento aleatorizado em blocos em multiambientes com a cultura de Eucalyptus grandis (LAVORANTI, 2003), foram retirados valores aleatoriamente (5%, 10%, 30%), os quais foram imputados pelo método proposto. Os resultados obtidos por meio da medida geral de exatidão ou acurácia (Tacc), na matriz ele interação G x E para os dados de altura de E. grandis, mostraram um viés pequeno, em relação aos valores originais, no entanto, seus valores foram maiores do que a variabilidade em relação à média dos valores imputados, indicando uma exatidão ou acurácia menor do método proposto em relação à sua alta precisão. A metodologia proposta utiliza o maior número de informação disponível, não possui qualquer restrição quanto ao padrão e mecanismo de ausência e é livre ele suposição sobre a distribuição ou estrutura dos dados.Some techniques of the multivariate statistical analysis need a complete data matrix, but the process of data collection usually does not supply a complete data matrix. The imputation is a technique, in which the missing data are replaced by plausible values, for a latter analysis of the complete data set (observed + imputed). This work aims to propose a multiple imputation method, as a product of a procedures change, based on the singular value decomposition (SVD) developed by Krzanowski (1988). Thus, in the genotype (20) x environment (7) matrix (G x E), derived from a trial following the complete randomized blocks design considering the Eucalyptus grandis genotype in multienvironments (LAVORANTI, 2003), values were retrieved randomly (5%, 10%, 30%), which were imputed by the proposed method. The results obtained by means of the general measure of accuracy (Tacc), in the interaction G X E for the height of E. grandis data matrix, showed a small bias when compared to the original data, however, its values where greater then the variability in relation to the imputed data mean, indicating a smaller accuracy of the proposed method in relation to its precision. The proposed methodology uses the greater number of information available, it does not posses any restriction about the pattern and missing mechanism and it is free of suppositions about the data distribution or structure

    Efeito de soluções fluoretadas contendo xilitol e sorbitol no número de estreptococos do grupo mutans na saliva de seres humanos

    No full text
    O objetivo do estudo foi avaliar o efeito de soluções de fluoreto de sódio a 0,05% contendo 2,5% ou 12,5% de xilitol no número de estreptococos do grupo mutans presentes na saliva. Participaram do estudo duplo cego, do tipo cruzado, 50 meninos entre 8 e 16 anos, distribuídos aleatoriamente em quatro grupos. Destes, 33 finalizaram o estudo. As soluções utilizadas foram: solução placebo; solução de fluoreto de sódio a 0,05%; solução de fluoreto de sódio a 0,05% + 2,5% xilitol + 2% sorbitol; solução de fluoreto de sódio a 0,05% + 12,5% xilitol + 2% sorbitol. Os indivíduos utilizaram 20 mL de uma das soluções, duas vezes ao dia. Cada solução foi utilizada por um período experimental de 28 dias. Os períodos experimentais foram intercalados por períodos de descanso de 10 dias. As soluções contendo xilitol a 2,5% e 12,5% não apresentaram diferença significativa (P = 0,32) em termos do logaritmo do número de estreptococos do grupo mutans. No entanto, a diferença foi significativa quando essas soluções foram comparadas às soluções de fluoreto de sódio e placebo (P < 0,001). Os resultados sugerem que a solução de fluoreto de sódio a 0,05% com adição de xilitol a 2,5% ou 12,5% reduziu significativamente o número de estreptococos do grupo mutans
    corecore