research

Gewichtung des Scientific Usefiles des IAB-Betriebspanels 2007 : Methodenbeschreibung

Abstract

"Im IAB wird derzeit die Anonymisierbarkeit von Paneldaten zur Erstellung von Scientific-Use-Files untersucht. Dabei wurden mithilfe der Multiplen Imputation synthetische Datensätze der Erhebungswelle 2007 des IAB-Betriebspanels erzeugt. Dieses Vorgehen stellt sicher, dass einerseits einzelne Betriebe nicht identifizierbar sind, andererseits aber die gleichen Untersuchungen durchgeführt werden können wie mit den Originaldaten. Die am Ende öffentlich zugänglichen Daten bestehen aus imputierten und synthetischen Werten. Der Nutzer erhält 25 synthetische Datensätze, die in ihrer Struktur untereinander und mit dem Originaldatensatz identisch sind. Für die Auswertung müssen die Endergebnisse über die 25 synthetischen Datensätze gemittelt werden. Um auch deskriptive Auswertungen durchführen zu können, sollen die synthetischen Datensätze gewichtet werden. Die Gewichtung dient in erster Linie der Korrektur des disproportionalen Stichprobenansatzes. Darüber hinaus werden im Rahmen der Gewichtung eventuelle Verzerrungen durch disproportionale Ausfälle bereinigt. Die Gewichtung des IAB-Betriebspanels erfolgt grundsätzlich in Form einer Hochrechnung auf die Grundgesamtheit. Das Verfahren der Querschnittsgewichtung beim IAB-Betriebspanel ist sehr aufwändig. Würde man den gleichen Aufwand bei jedem der 25 Datensätze betreiben, so würde dies den vorgegebenen Zeit- und Kostenrahmen sprengen. Aus diesem Grund haben sich das IAB und TNS Infratest gemeinsam auf ein vereinfachtes Vorgehen verständigt, das deutlich weniger Zeit pro zu gewichtendem Datensatz in Anspruch nimmt und damit auch die Kosten begrenzt hält. Die damit verbundenen Unschärfen erscheinen in der derzeitigen Phase des Projekts 'Scientific Usefile für das IAB-Betriebspanel' vertretbar. Um mit Hilfe eines Vergleichs feststellen zu können, welche Auswirkungen das veränderte Gewichtungs- und Hochrechnungsverfahren auf die hochgerechneten Daten hat, wurde auch der normale Querschnittsdatensatz der Erhebungswelle 2007 auf diese Art und Weise gewichtet." (Autorenreferat, IAB-Doku)IAB-Betriebspanel, Imputationsverfahren, Datenanonymisierung, Datenschutz, Betriebsdatenerfassung

    Similar works