Orientador: Luiz Henrique Antunes RodriguesDissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia AgrícolaResumo: A tomada de decisão e o planejamento de uma usina de cana-de-açúcar têm como principal variável a produtividade dos cultivos, que em conjunto com a área permite estimar a produção. A cana-de-açúcar, uma cultura semi-perene, nas condições brasileiras, possui um ciclo inicial que pode variar de 12 a 18 meses e, após a primeira colheita, é colhida anualmente até que o decréscimo de produtividade leve ao replantio da área. Considerando o tamanho das áreas de cultivo, e o horizonte temporal, projeções de produtividade são fornecidas em diferentes contextos de decisão para cultivos que se encontram em diferentes momentos do ciclo de crescimento. Foi conduzida uma pesquisa exploratória junto a uma usina com intuito de contextualizar as principais decisões que são influenciadas pela perspectiva de produtividade futura, bem como a forma que essas predições afetam o planejamento. Tomando por base o resultado de entrevistas semiestruturadas e acompanhamento de atividades, foi possível identificar decisões chave e suas características, que foram relacionadas a soluções propostas pela comunidade científica e enquadradas dentro de uma proposta de framework para tomada de decisão e planejamento. Entre as decisões, chamou atenção as que são tomadas nos elos iniciais da cadeia de valor, que terão efeitos em todos os processos posteriores e que são tomadas na maior situação de incerteza, sendo consideradas pontos críticos no planejamento. No framework, baseado no uso de modelos empíricos de produtividade, é possível explorar o potencial das informações climáticas para projeção da produtividade e também explorar o potencial dos dados acumulados pelo setor. Para tal, foram desenvolvidos modelos empíricos de produtividade utilizando diferentes técnicas de mineração de dados. Os modelos de produtividade possuíam como atributos preditores os dados referentes aos talhões e seu manejo, em conjunto com os dados do clima ocorrido. Foi possível reduzir a magnitude de erro para menos da metade do encontrado em uma abordagem anterior. Entre as técnicas utilizadas, a SVM e a Random Forest obtiveram os melhores desempenhos, embora o modelo utilizando SVM tenha utilizado significativamente menos atributos. A estratégia de modelagem baseada em dados permitiu a criação de modelos específicos para o contexto produtivo da própria unidade, na escala da menor unidade de gestão, os talhões. Os modelos de produtividade criados possuem potencial para projeção de produtividade se utilizados em conjunto com projeções de climaAbstract: Decision making and planning of sugarcane production have as main variable the crop yield, which in conjunction with the field area allows us to estimate production. Sugarcane, a semi-perennial crop, in Brazilian conditions, has an initial cycle that varies from 12 to 18 months and after the first harvest, is harvested annually until yield reduction lead to replanting the area. Considering the size of cultivated areas, and the time horizon, yield projections are provided in different contexts of decision for crops that are in different stages of the growth cycle. An exploratory study was conducted within a sugarcane mill to contextualize the main decisions that are influenced by the perspective of future yield, as well as how those predictions affect planning. Based on the result of semi-structured interviews and activities follow-up, it was possible to identify key decisions and their characteristics, which were related to the solutions proposed by the scientific community and framed within a proposed framework for decision making and planning. Decisions made in the first echelons of the value chain demanded early predictions and have effects in the whole value chain, being considered a critical point for planning. In the framework, based on the use of empirical models of yield, it is possible to exploit the potential of climate information to forecast yield and also explore the potential of data accumulated by the sector. Empirical yield models were developed using different data mining techniques. The models used and data from the blocks and their management, coupled with the climatic data as predictive variables. Error magnitude was reduced by half from a previous approach. Among the techniques used, SVM and Random Forest got the best performance, although the SVM model has significantly fewer attributes. The modeling strategy based on data enabled the creation of specific models for the production context of the mill, on the scale of the smallest management unit. The yield models created have potential for yield forecast if used in conjunction with weather forecastsMestradoPlanejamento e Desenvolvimento Rural SustentávelMestre em Engenharia Agrícola12/50049-3FAPES