4 research outputs found
Deep Learning and Linear Programming for Automated Ensemble Forecasting and Interpretation
This paper presents an ensemble forecasting method that shows strong results
on the M4 Competition dataset by decreasing feature and model selection
assumptions, termed DONUT (DO Not UTilize human beliefs). Our assumption
reductions, primarily consisting of auto-generated features and a more diverse
model pool for the ensemble, significantly outperform the statistical,
feature-based ensemble method FFORMA by Montero-Manso et al. (2020). We also
investigate feature extraction with a Long Short-term Memory Network (LSTM)
Autoencoder and find that such features contain crucial information not
captured by standard statistical feature approaches. The ensemble weighting
model uses LSTM and statistical features to combine the models accurately. The
analysis of feature importance and interaction shows a slight superiority for
LSTM features over the statistical ones alone. Clustering analysis shows that
essential LSTM features differ from most statistical features and each other.
We also find that increasing the solution space of the weighting model by
augmenting the ensemble with new models is something the weighting model learns
to use, thus explaining part of the accuracy gains. Moreover, we present a
formal ex-post-facto analysis of an optimal combination and selection for
ensembles, quantifying differences through linear optimization on the M4
dataset. Our findings indicate that classical statistical time series features,
such as trend and seasonality, alone do not capture all relevant information
for forecasting a time series. On the contrary, our novel LSTM features contain
significantly more predictive power than the statistical ones alone, but
combining the two feature sets proved the best in practice
Exploration of Forecasting Paradigms and a Generalized Forecasting Framework
Først presenterer vi en total ordning av den teoretiske nedre grense for prediksjonsfeil for forskjellige prediksjonsparadigmer i følgende synkende rekkefølge: modellvalg, modellkombinasjon, ikke-parametriske univariate modeller og ikke-parametriske multivariate modeller.
Deretter lager vi et generalisert prediksjonsrammeverk for å teste de ovennevnte prediksjonsparadigmer på forhånd. Vi implementerer rammeverket ved å lage en original datakube bestående av daglige aksjekurser og 100 000 kvartalsrapporter fra omlag 1 600 globale selskaper og flere daglige makrotidsserier, fra 2000 til våren 2022. Til slutt bruker vi rammeverket og viser at moderne multivariate tidsseriemodeller er kraftige, men domeneavhengige. Vi demonstrerer den domeneavhengige nøyaktigheten gjennom overbevisende resultater for anslag av bedriftskonkursrisiko, moderate resultater ved prediksjon av aksjekursvolatilitet og manglende resultater når vi til slutt forutsier selskapets markedsverdi.
Gitt gode resultater i visse domener, samt fortsatt urealisert teoretisk høyeste nøyaktighet av multivariate modeller, håper vi å oppmuntre til videre forskning på ikke-parametriske multisignaltilnærminger som utnytter et bredere spekter av tilgjengelig informasjon