Movie’s box office performance prediction: An approach based on movie’s script, text mining and deep learning

Abstract

Dissertation presented as the partial requirement for obtaining a Master's degree in Information Management, specialization in Knowledge Management and Business IntelligenceA capacidade de prever a bilheteria de filmes tem sido atividade de grande interesse para investigadores. Entretanto, parcela significativa destes estudos concentra-se no uso de variáveis disponíveis apenas nos estágios de produção e pós-produção de filmes. O objetivo deste trabalho é desenvolver um modelo preditivo de bilheteria baseando-se apenas em informações dos roteiros dos filmes, por meio do uso de técnicas de processamento de linguagem natural (PLN), mineração de texto e de redes neuronais profundas. Essa abordagem visa otimizar a tomada de decisão de investidores em uma fase ainda inicial dos projetos, com foco específico na melhoria dos processos seletivos da Agência Nacional do Cinema do Brasil.The ability to predict movies box-office has been a field of interest for many researchers. However, most of these studies are concentrated on variables that are available only in later stages as in production and pos-production phase of films. The objective of this work is to develop a predictive model to forecast movie box-office performance based only on information in the movie script, using natural language processing techniques, text mining and deep learning neural networks. This approach aims to optimize the investor’s decision-making process at earlier steps of the project, with special focus on the selection process of the Brazilian Film Agency (ANCINE – Agência Nacional do cinema)

    Similar works