1 research outputs found
TSPO: an autoML approach to time series forecasting
Dissertation presented as the partial requirement for obtaining a Master's degree in Data Science and Advanced AnalyticsTime series forecasting is an essential tool in many fields. In recent years, machine learning
has gained popularity as an appropriate tool for time series forecasting. When employing
machine learning algorithms, it is necessary to optimise a machine learning pipeline, which is a
tedious manual effort and requires time series analysis and machine learning expertise. AutoML
(automatic machine learning) is a sub-field of machine learning research that addresses this issue
by providing integrated systems that automatically find machine learning pipelines. However,
none of the available open-source tools is yet explicitly designed for time series forecasting.
The proposed system TSPO (Time Series Pipeline Optimisation) aims at providing an
autoML tool specifically designed to solve time series forecasting tasks to give non-experts the
capability to employ machine learning strategies for time series forecasting. The system utilises
a genetic algorithm to find an appropriate set of time series features, machine learning models
and a set of suitable hyper-parameters. The optimisation objective is defined as minimising the
obtained error, which is measured with a time series variant of k-fold cross-validation.
TSPO outperformed the official machine learning benchmarks of the M4-Competition in 9
out of 12 randomly selected time series. TSPO captured the characteristics of all analysed time
series consistently better compared to the benchmarks.
The results indicate that TSPO is capable of producing robust and accurate forecasts without
any human input.A previsão de séries temporais é uma importante ferramenta em muitas disciplinas. Nos últimos
anos, a aprendizagem automática ganhou popularidade como ferramenta apropriada para a
previsão de séries temporais. Ao utilizar algoritmos de aprendizagem automática, é necessário
otimizar pipelines de aprendizagem automática, que é um esforço manual, tedioso e que requer
experiência na área. O AutoML (aprendizagem automática automatizada) é um subcampo
de aprendizagem automática que aborda esse problema, fornecendo sistemas integrados que
encontram automaticamente pipelines de aprendizagem automática. No entanto, nenhuma
das ferramentas de código aberto disponÃveis é explicitamente destinada à previsão de séries
temporais.
O sistema proposto TSPO (Time Series Pipeline Optimisation) visa fornecer uma ferramenta
de aprendizagem automática projetada especificamente para resolver problemas de previsão de
séries temporais. Dando a não especialistas a capacidade de utilizar estratégias de aprendizagem
automática para previsão de séries temporais. O sistema utiliza um algoritmo genético para
encontrar um conjunto apropriado de pipelines de séries temporais, modelos de aprendizagem
automática e um conjunto de hiperparâmetros adequados. O objetivo da otimização é definido
como a minimização do erro obtido, medido com uma variante da validação cruzada k-fold
aplicada a séries temporais.
O TSPO superou os benchmarks oficiais de aprendizagem automática da competição M4
em 9 das 12 séries temporais aleatoriamente selecionadas. Além disso o TSPO capturou as
caracterÃsticas de todas as séries temporais analisadas melhor que os benchmarks. Os resultados
indicam que o TSPO é capaz de produzir previsões robustas e precisas sem qualquer contribuição
humana