Usean ennustemuuttujan hyödyntäminen mahdollistaa monipuolisemman ja laajemman havaintoaineistojen käytön, sillä makrotaloudelliset muuttujat ovat hyvin usein toisistaan riippuvaisia ja sisältävät informaatiota toisistaan. Toisaalta oleellisten ennustemuuttujien valinta on vaikeaa ja usean ennustemuuttujan käyttö johtaa ns. suuren dimensionaalisuuden ongelmaan.
Tämän tutkielman tarkoituksena on verrata regressiomalleihin perustuvien oppimismenetelmien soveltuvuutta Yhdysvaltojen inflaatiovauhdin ennustamiseksi käyttäen kuukausitason dataa ajalta 1966-2015. Keskityn tapauksiin, joissa ennustuksen aikahorisonttina on kolme, kuusi ja kaksitoista kuukautta. Mallien vertailussa käytän simuloitua otoksen ulkopuolista (”simulated out-of-sample”) menetelmää, eli mallit estimoidaan vain datalla, joka on ajalta ennen ennustusperiodia. Mallien ennustetarkkuuden vertailukriteerinä käytetään keskineliövirhettä.
Empiirinen osio on tehty tilastollisessa R-ohjelmointiympäristössä. Autoregressiivinen malli, jossa viiveiden määrä on valittu minimoimalla Bayesian-informaatiokriteeri, tuotti pienimmän virheen. Suuremmalla määrällä komponentteja Osittaisen pienimmän neliön regressio (”PLS-metodi)” oli kuitenkin lähellä autoregressiivisen mallin tuottamaa keskineliövirhettä kaikilla ennustehorisonteilla. Taloustieteelliset aikasarjamallit ovat usein epävakaita ajan edetessä, joten nämä mallit ovat suuntaa-antavia. Tämän huomioon ottaen ei voida olettaa, että sama ennustemalli antaisi parhaan tuloksen eri historiallisilla ajanjaksoilla