Dissertation presented as the partial requirement for obtaining a Master's degree in Information Management, specialization in Knowledge Management and Business IntelligenceA capacidade de prever a bilheteria de filmes tem sido atividade de grande interesse para
investigadores. Entretanto, parcela significativa destes estudos concentra-se no uso de variáveis
disponíveis apenas nos estágios de produção e pós-produção de filmes. O objetivo deste trabalho é
desenvolver um modelo preditivo de bilheteria baseando-se apenas em informações dos roteiros dos
filmes, por meio do uso de técnicas de processamento de linguagem natural (PLN), mineração de texto
e de redes neuronais profundas. Essa abordagem visa otimizar a tomada de decisão de investidores
em uma fase ainda inicial dos projetos, com foco específico na melhoria dos processos seletivos da
Agência Nacional do Cinema do Brasil.The ability to predict movies box-office has been a field of interest for many researchers. However,
most of these studies are concentrated on variables that are available only in later stages as in
production and pos-production phase of films. The objective of this work is to develop a predictive
model to forecast movie box-office performance based only on information in the movie script, using
natural language processing techniques, text mining and deep learning neural networks. This approach
aims to optimize the investor’s decision-making process at earlier steps of the project, with special
focus on the selection process of the Brazilian Film Agency (ANCINE – Agência Nacional do cinema)