Article thumbnail

Fiber quality of different Brazilian cotton cultivars and their relationship with weather conditions

By Isabella Theresa de Almeida Martins

Abstract

O algodoeiro (Gossypium hirsutum L. raça latifolium Hutch) é produzido por mais de 60 países e, apesar da qualidade e multiplicidade de uso de suas sementes, é cultivado essencialmente para a produção de fibras. A qualidade da fibra pode diferir entre os diferentes ambientes de produção, sendo fator chave para determinação do preço e qualidade do algodão destinado aos produtos têxteis. Essas diferenças de qualidade estão associadas principalmente às cultivares e às condições meteorológicas, as quais influenciam os parâmetros indicativos de qualidade de fibra. O conhecimento dos fatores que condicionam a qualidade da fibra de algodão é importante para a definição das regiões com potencial para produção de fibras de qualidade superior. Dessa forma, como maneira de subsidiar a produção de fibras de algodão de melhor qualidade, os objetivos do presente estudo foram identificar e ordenar os fatores que afetam a qualidade da fibra de algodão, de acordo com sua importância, bem como o desenvolvimento de modelos matemáticos de estimação para os índices de qualidade da fibra de algodão por meio de técnicas de mineração de dados (MD). Para tanto, dados das variáveis meteorológicas e de índices de qualidade da fibra de algodão de 32 cultivares brasileiras foram submetidos à análises de correlação de Pearson (para uma abordagem geral); à análise de agrupamento (\"clusterização\"); e à três técnicas de MD (Random Forest; XGBoosting; e Support Vector Machine). Para a MD, os dados foram separados em duas partes, sendo uma para o treinamento dos algoritmos e geração dos modelos (70%) e outra para a etapa de teste dos modelos gerados (30% dos dados restantes). A análise de desempenho dos modelos foi efetuada pela comparação entre os índices de qualidade da fibra estimados pelos modelos e os índices de qualidade observados por meio da análise de regressão. O desempenho dos modelos foi avaliado considerando os seguintes índices estatísticos: coeficiente de correlação (R); coeficiente de determinação (R2); índice de Willmott (D); índice de confiança de Camargo (C); erro absoluto médio (EAM); e raiz quadrada do erro médio (RMSE). Por fim, comparou-se os resultados obtidos pelos modelos gerados com as técnicas de mineração de dados com os obtidos pelas análises de correlação e agrupamento. De modo geral, os modelos gerados por meio do emprego de técnicas de MD tiveram desempenho melhor do que as análises de correlação feitas a nível de abordagem geral e a nível de agrupamento e o melhor desempenho dos modelos foi para a elongação e o pior para o comprimento da fibra de algodão, sendo que o modelo XGB se apresentou ligeiramente melhor que o RF e o SVM foi o pior para todas as variáveis. As variáveis preditoras que foram comuns às três técnicas para os índices de qualidade da fibra avaliados variaram da seguinte foram: para o micronaire as variáveis de mais importância foram a radiação solar (Qg), o número de dias com temperatura maior ou igual a 32°C (Tmax32) e o número de dias com temperatura mínima menores ou iguais a 20°C (Tmin20); para o comprimento foram Qg, Tmin20 e velocidade do vento (U2); para a resistência foram Qg, Tmax32, Tmin 20 e temperatura mínima (Tmin); para a uniformidade foram U2, excedente hídrico (∑EXC), déficit hídrico (∑DEF)(mm), Tmin20 e precipitação pluvial (P); para a elongação foram Qg, número de dias com excedente hídrico maior do que zero (EXC0); temperatura máxima (Tmax), número de dias com temperatura menor ou igual a 18°C (Tmin18) e P; e para o índice de fibras curtas (SFI) foram umidade relativa do ar (UR); Tmax; e P.Cotton (Gossypium hirsutum L. race latifolium Hutch) is produced by more than 60 countries and despite the quality and multiplicity of use of its seeds, it is grown mainly to produce fibers. The quality of the fiber can differ between different production environments, being a key factor in determining the price and quality of cotton destined for textile products. These differences in quality are mainly associated with cultivars and weather conditions, which influence the indicating parameters of fiber quality. The knowledge of the factors that affect the quality of the cotton fiber is important for the definition of the regions with potential to produce that with superior quality. Thus, as a way to subsidize the production of better quality cotton fibers, the objectives of the present study were to identify and classify the factors that affect the quality of the cotton fiber, according to its importance, as well as the development of mathematical models for estimating the indices of cotton fiber quality using data mining (DM) techniques. To accomplish this, data of meteorological variables, and indices of cotton fiber quality from 32 Brazilian cultivars, were submitted to Pearson\'s correlation analysis (for a general approach); cluster analysis (\"clustering\"); and three DM techniques (Random Forest; XGBoosting; and Support Vector Machine). For DM, the data were separated in two parts, one for training the algorithms and generating the models (70%), and the other for testing the generated models (30% of the remaining data). The performance analysis of the models was achieved by comparing the fiber quality indices estimated using the models with the quality indices observed through the regression analysis. The performance of the models was evaluated considering the following statistical indices: correlation coefficient (R); determination coefficient (R2); Willmott index (D); Camargo confidence index (C); mean absolute error (MAE); and root mean square error (RMSE). Finally, the results obtained by the models generated with data mining techniques were compared with those obtained by correlation and cluster analysis. In general, the models generated using DM performed better than the correlation analyzes made using both the general approach and the grouping. The best performance of the models was for elongation and the worst for the length of the cotton fiber. In addition, the XGB model showed slightly better results than the RF model, and the SVM model presented the worst results for all indices. The predictor variables that were common to the three DM techniques for the evaluated indices of fiber quality varied as follows: for micronaire, the most important variables were solar radiation (Qg), the number of days with temperature greater than or equal to 32°C (Tmax32), and the number of days with minimum temperature less than or equal to 20°C (Tmin20); for the length of the fibers, the variables with the greatest influence were Qg, Tmin20 and wind speed (U2); for fibers resistance the most important variables were Qg, Tmax32, Tmin 20, and minimum temperature (Tmin); for uniformity of the fibers these variables were U2, water surplus (∑EXC), water deficit (∑DEF), Tmin20, and rainfall (P); for fibers elongation these variables were Qg, number of days with water surplus greater than zero (EXC0), maximum temperature (Tmax), number of days with a temperature less than or equal to 18°C (Tmin18), and P; and for short fiber index (SFI) the most influencing variables were relative humidity (UR), Tmax, and P

Topics: Gossypium hirsutum L. raça latifolium Hutch, Support vector machine, Random forest, Micronaire, XGBoosting, Random forest, Micronaire, Support vector machine, Gossypium hirsutum L. race latifolium Hutch, XGBoosting
Publisher: 'Universidade de Sao Paulo, Agencia USP de Gestao da Informacao Academica (AGUIA)'
Year: 2020
DOI identifier: 10.11606/D.11.2020.tde-13102020-095751
OAI identifier: oai:teses.usp.br:tde-13102020-095751
Download PDF:
Sorry, we are unable to provide the full text but you may find it at the following location(s):
  • https://www.teses.usp.br/teses... (external link)

  • To submit an update or takedown request for this paper, please submit an Update/Correction/Removal Request.

    Suggested articles