Painotusmenetelmät survey aineiston muuttujien estimoimiseen

Abstract

Survey aineistojen estimoimisessa on monia haasteita. Esimerkiksi puuttuneisuus ja kenttätyön tuomat haasteet ovat esimerkkejä asioista, jotka tuovat haasteita survey tutkimuksiin ja sitä kautta harhaa, kun tutkimuksen kiinnostuken kohteina olevia muuttujia estimoidaan. Otanta-asetelman sekä kenttätyön luomat haasteet voidaan usein ratkaista hyvällä suunnittelulla ja perusteellisella työskentelyllä. Puuttuneisuutta eli vastauskatoa ei voida kuitenkaan ehkäistä pelkästään hyvällä suunnittelulla. Puuttuneisuus onkin survey aineistoista lasketuissa estimaateissa suurin harhaa aiheuttava tekijä. Puuttuneisuus voidaan jakaa yksikkövastauskatoon sekä erävastauskatoon. Tämän tutkielman menetelmillä pyritään vähentämään nimenomaan yksikkövastauskadon tuomaa harhaa. Tätä harhaa voidaan vähentää painottamalla satunnaisotannan kautta saatu aineisto. Painotusmenetelmillä on tarkoitus painottaa otokseen valitut ja kyselyyn vastanneet vastaajat niin, että ne edustaisivat tutkimuksen tavoiteperusjoukkoa mahdollisimman hyvin. Painotusmenetelmät voidaan jakaa peruspainotukseen ja uudelleenpainotukseen. Peruspainotuksen ideana on luoda pohja uudelleenpainotukselle. Uudelleenpainotuksen ideana on eri lähteistä saatavia aputietoja hyväksikäyttäen luoda mahdollisimman hyvät uudet painot, joidenka avulla voidaan estimoida mahdollisimman harhattomasti joitakin kiinnostuksen kohteena olevia muuttujia. Tässä tutkielmassa käydään läpi niin peruspainotus, kuin uudelleenpainotuskin. Tutkielmassa esittelen tyypillisimmät uudelleenpainotus menetelmät. Näitä on muun muassa: jälkiositus, kalibrointi ja vastaustodennäköisyysmalleihin perustuvat painotus. Tutkielman lopuksi lasken joitakin estimaatteja käyttäen eri painoja, joita olen tutkielman aikana luonut. Tutkielmassa olevat kiinnostuksen kohteena olevat muuttujat ovat peräisin vuoden 2014 ESS (European social survey) datan pohjalta luodusta aineistosta. Tutkielmassa kiinnostuksen kohteena olevia muuttujia olivat muuttujat liittyen luottamukseen, terveyteen, onnellisuuteen ja kotitalouden tuloihin. Tutkielmassa saatiin selville, että sillä mitä painotusmenetelmää käytetään ja mitä aputietoja käytetään, saadaan selkeästi erilaisia painotuksia aineistoille ja sitä kautta erilaisia estimaatteja tutkittaville muuttujille. Tutkielman aikana ilmenee selkeästä, että esimerkiksi kalibroinnilla luodut painot ja niiden avulla lasketut estimaatit parantavat tuloksia selkeästi. Yksi mielenkiintoinen löydös tutkimuksessa oli se, kuinka paljon jokin yksittäinenkin lisätieto tai sen puuttuminen voi muokata painoja ja sitä kautta estimaatteja. Lopulta parhaat painot saadaan luotua vastaustodennäköisyysmallien ja kalibroinnin yhdistelmällä. Tutkielmassa laskettujen estimaattien arvot saivat liian suuret arvot, kun ne laskettiin ilman painotusta tai pelkän peruspainotuksen avulla. Tämä ilmiö tapahtui lähes kaikissa tutkielmassa lasketuissa estimaateissa. Ja lopulta pystyttiin myös toteamaan, että lähes kaikkien tutkittavien muuttujien estimaatit erosivat toisistaan tilastollisesti merkitsevästi, kun vertailtiin estimaatteja, jotka laskettiin ilman painotusta ja parhailla mahdollisilla painotus-menetelmillä

Similar works

This paper was published in Helsingin yliopiston digitaalinen arkisto.

Having an issue?

Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.