Erstellung eines Scientific Use File "HIS-Absolventenpanel 1997"

Start of the project: 2005-Nov-01 - End of the project: 2006-May-30

Das DZHW (damals HIS) beabsichtigte 2005, die Nutzung der von ihm erhobenen Daten durch die Wissenschaft systematisch und deutlich zu erleichtern. Dafür sollte in einem Pilotprojekt ein Scientific Use File erstellt werden.

Dieses Projekt verfolgte vier Ziele:

  • Die Erstellung eines exemplarischen Scientific Use Files auf der Basis des Absolventenpanels 1997, das aufgrund der relativ aktuellen Daten (die zweite Befragung fand 2003 statt) und wegen der für 2007 angestrebten 3. Befragungswelle besonders geeignet erschien.
  • Die Vorbereitung aller Absolventenbefragungen für eine leichtere Vergleichbarkeit der Panels, die insbesondere Vereinheitlichungen (z.B. in den Variablenbezeichnungen) umfasst und Vorarbeiten für eine mögliche zukünftige Erstellung weiterer Scientific Use Files (z.B. der Absolventenpanels 1989, 1993, 2001) darstellt.
  • Die Erarbeitung eines standardisierten Verfahrens zur Erstellung weiterer Scientific Use Files, um anhand von Richtlinien und Werkzeugen eine einfache, schnelle und kostengünstige Erstellung weiterer Scientific Use Files zu ermöglichen.
  • Die (bessere) Einschätzung des mit der Erstellung von Scientific Use Files verbundenen personellen und zeitlichen Aufwands.

Die Arbeit in diesem Projekt gliederte sich in fünf Schwerpunkte:

  • Die Anonymisierung der Datensätze, die insbesondere auf Anonymisierungsstrategien zielte, die eine Deanonymisierung einzelner Fälle unmöglich machen (z.B. durch Aggregation von Variablen oder Hinzufügen eines Zufallswerts zu einzelnen Variablen).
  • Die Aufbereitung der Datendateien, damit sie ohne größere Schwierigkeiten von Dritten genutzt werden können.
  • Die Dokumentation des Datensatzes anhand eines ausführlichen Codebuchs, einer Beschreibung der Gewichtungsverfahren und einer kommentierten Literaturliste über die auf Basis des Datensatzes erstellten Veröffentlichungen.
  • Die technische Erstellung der Datendateien im ASCII-Format, als Setup-Datei für STATA und in Formaten weiterer häufig verwendeter Statistikprogramme (SPSS, SAS).
  • Die Anfertigung eines Handbuchs zur Erstellung von Scientific Use Files aus DZHW-Befragungsdaten (vormals HIS), in dem Standards zur Dokumentation von DZHW-Befragungen definiert und festgelegt sowie einzelne Arbeitsschritte und Verfahren im Detail beschrieben werden.

In dieses Projekt bezog das DZHW (damals HIS) verschiedene Instutionen ein, die bereits über Erfahrungen mit der Erstellung von Scientific Use Files verfügten (ZUMA, Forschungsdatenzentrum des Statistichen Bundesamts, Forschungsgruppe SOEP des DIW).

Das Projekt wurde im Sommer 2006 abgeschlossen. Das Scientific Use File wurde im Winter 2006/2007 an das Zentralarchiv für empirische Sozialforschung an der Universität Köln übergeben und ist dort verfügbar.

Whole project

Researchers

Gregor Fabian