|
Tobias C. Stubbe |
Die folgende Anleitung zur Analyse eines Zensus ist für Benutzer gedacht, die an einem PC sitzen, auf dem sich die besprochenen Programme befinden. Wir setzen dabei voraus, daß die Benutzer basale Fähigkeiten besitzen. Der Text soll einen Schnelleinstieg in die Programme ermöglichen, die z.T. für Anfänger miserabel bis völlig ungenießbar dokumentiert sind.
Zahlreiche Screenshots sollen die
Verständlichkeit der Anleitung erhöhen. Z.T. sind diese direkt in den Text
integriert, ansonsten kann man sich bei Bedarf durch einen Klick auf den Button
einen Screenshot zu dem entsprechenden Schritt ansehen. (Die Screenshots öffnen
sich dabei in einem neuen Fenster.)
Verwendete Programme:
Family Tree Maker 9.0: Programm zur Eingabe der Zensusdaten.
MS Excel wird benötigt, um die Daten vom Family Tree Maker nach SPSS zu exportieren.
SPSS 11: Statistikprogramm zur Analyse der Zensusdaten.
Inhalt:
1. Eingabe der Zensusdaten in den Family Tree Maker
2. Daten vom Family Tree Maker nach SPSS exportieren
3. Auswertung der Zensusdaten mit SPSS
1. Datenansicht und Variablenansicht
2. Variablen transformieren
3. Altersberechnung aus dem Geburtsdatum
4. Klassenbildung bei numerischen Variablen
5. Univariate Statistik
6. Bivariate Statistik
1. Eingabe der Zensusdaten in den Family Tree Maker
Nach dem Start des Programms hat man zunächst die Möglichkeit, entweder eine
bestehende Datei zu öffnen oder eine neue Datei zu erstellen.
Um letzteres zu tun, muß man auf den Button 'New' klicken, es erscheint
ein neues Fenster
,
in das man wie gewohnt Ort und Namen der neuen Datei eingeben kann. Family
Tree Maker (FTM) erzeugt daraufhin zwei Dateien: name.ftw ist die für uns
interessante Datei; name.fbk ist ein Backup. Während der Arbeit mit FTM ist es
nicht notwendig, Änderungen abzuspeichern, dies tut das Programm von allein.
Nachdem die neue Datei erzeugt wurde, erscheint ein Fenster mit der
Überschrift 'Start you Family Tree'.
Da wir dieses für unsere Zwecke nicht benötigen, kann man an dieser
Stelle mit 'Cancel' abbrechen. Man gelangt dann auf die 'Family Page'.
Im folgenden gelangt man auf diese Seite zurück, indem man in der
Menüleiste auf
klickt. Auf der 'Family Page' werden zunächst die Grunddaten des
'Ausgangsehepaares' eingegeben: Name, Geburtstag, Geburtsort und ggf.
Sterbedatum und Sterbeort. Dabei ist wichtig, daß bei Frauen immer der
Mädchenname angegeben wird. [Bei Problemen mit der Vergabe von
Familiennamen (z.B. bei nicht-europäischen Systemen) bietet FTM gute
Hilfestellung: Help>Contents -
auf 'Hilfethemen' klicken - unter 'Index' Entering: names eingeben.] Auch Hochzeitstag und -ort können bei Bedarf
an dieser Stellen angefügt werden. [Der spätere Export der Daten nach SPSS
gelingt nur bei einheitlichen Datumsangaben. Fehlt bei einigen Angaben Tag
und/oder Monat, sollte entweder grundsätzlich nur das Jahr oder
bei unvollständigen Daten der 01.01.JJJJ angegeben werden!]
Im nächsten Schritt werden die restlichen Informationen
angefügt. Dazu klickt man auf den 'More'-Button
,
der sich neben den Grunddaten sämtlicher Personen befindet; so gelangt man auf
die 'Facts-Page':
Name, Geburtsdatum und ggf. Sterbedatum sind bereits vorhanden.
Aus dem Drop-Down-Menu
kann man weitere 'Facts' auswählen. In unserem Beispiel 'Education', 'Nationality',
'Occupation', 'Religion' und 'Residence'. Die zugehörigen Angaben werden in das
Feld 'Comment/Location' eingegeben
(nur wenn es sich um ein Datum handelt in das Feld 'Date') und mit der
Eingabetaste bestätigt. 'Fact-Namen', die nicht vorhanden sind, kann man direkt
in das 'Fact-Feld' eingeben; hier sind dies die Personen-ID ('Pid') und die
Haushalts-ID ('Hid'). Das Hinzufügen eines neuen 'Fact-Namens' muß noch
bestätigt werden. ![]()
Statt die Personen-IDs - wie oben beschrieben - manuell zu
vergeben, kann man dies auch FTM überlassen. Dazu wählt man File>Preferences>Reference
Numbers... aus und markiert das Feld 'Individuals'.
Dieses Vorgehen ist einfacher und vor allem weniger fehlerträchtig.
Um Personen zum Zensus hinzuzufügen, die nicht zur 'Ausgangsfamilie' gehören, muß man People>Add Unrelated Individual auswählen. Es erscheint eine leere 'Family Page'. Dies führt man solange fort, bis die Daten aller Personen, die zum Zensus gehören, eingegeben wurden. Damit ist die Dateneingabe beendet.
2. Daten vom Family Tree Maker nach SPSS exportieren
Leider kann SPSS die FTM-Datei nicht direkt öffnen. Wie sich die Daten trotzdem übertragen lassen, ist im folgenden beschrieben.
a) Erzeugen des 'Custom Reports' über View>Reports>Custom - Der 'Custom Report' enthält zunächst nur Name, Geburtstag und ggf. Sterbedatum.
b) Hinzufügen weiterer 'Facts' über Contents>Items
to Include in Report...
- Auf der linken Seite des erschienenen Fensters sind sämtliche verfügbaren 'Facts'
aufgeführt. Aus diesen muß man nun diejenigen auswählen, die man mit SPSS
analysieren will. Dabei ist darauf zu achten, jeweils den 'Fact' mit der Angabe 'cmt/loc'
auszuwählen; nur wenn es sich um ein Datum handelt mit der Angabe 'date'. (Dies entspricht den
beiden Spalten auf der 'Facts-Page' - s.o.) Anschließend kann man
aus Gründen der Übersichtlichkeit die Reihenfolge der 'Facts' noch verändern. Dazu markiert man einen 'Fact'
auf der rechten Seite und verschiebt ihn mit 'Move up' und 'Move down'.

c) Bei Bedarf kann man den Report über Format>Sort
Report... nach einen bestimmten 'Fact' sortieren (z.B. nach Personen-ID).
![]()
d) Unter File>Preferences>Dates & Measures... muß das Datumsformat auf TT.MM.JJJJ gestellt werden!

e) Ein leeres Excel (Tabellen) Blatt aufschlagen. Der Cursor muß auf Feld A1 stehen.
f) Kopieren des Reports im FTM mit Edit>Copy
Report => Einfügen in Excel mit Bearbeiten>Einfügen
![]()
g) Löschen der ersten beiden Zeilen (Mit der linken Maustaste die Felder '1' und '2' markieren, mit der rechten Maustaste auf eines der beiden klicken und Zellen löschen auswählen)
h) Optimale Spaltenbreite auswählen (Mit der linken
Maustaste auf das unbeschriftete Eckfeld - über der '1' und links vom 'A' -
klicken, um die gesamte Tabelle zu markieren und dann Format>Spalte>Optimale
Breite bestimmen auswählen) ![]()
i) Datei>Speichern unter... => Bei Dateityp 'Text (Tabs getrennt)' auswählen. => Excel schließen!
j) SPSS starten, Datei>Öffnen>Daten..., Dateityp 'Text (*.txt)' auswählen und die mit Excel erzeugte Datei öffnen.
k) Der Assistent für den Textimport startet. Bei den ersten
drei Schritten einfach 'Weiter' klicken.
Bei Schritt 4 darf nur 'Tabulator' angestrichen sein.
Bei den beiden letzten Schritten wieder nur 'Weiter' klicken.
Fertig!
3. Auswertung der Zensusdaten mit SPSS
1. Datenansicht und Variablenansicht
Die Darstellung des Zensus in der Datenansicht entspricht der in
Excel
.
In den Zeilen sind die einzelnen Personen des Zensus aufgeführt, in den Spalten
die verschiedenen Variablen. Über die Felder links unten
kann man zwischen der Datenansicht und der Variablenansicht wechseln. In dieser
Tabelle sind in den Zeilen die verschiedenen Variablen aufgeführt und in den
Spalten deren Eigenschaften
.
Die meisten Einstellungen kann man so lassen, wie sie sind. In der ersten Spalte
('Name') kann man den Variablen Namen geben, was das weitere Vorgehen mit
Sicherheit vereinfacht. Außerdem muß man in der zweiten Spalte ('Typ') bei
Datumsangaben statt 'String' 'Datum' auswählen.

Der Zensus in der überarbeiteten Variablenansicht: ![]()
2. Variablen transformieren
Wie sich später zeigen wird, ist es für die Auswertung sinnvoll, wenn die
Angaben zum Geschlecht in den Ausprägungen '0'/'1' vorliegen, statt in 'Female'/'Male'.
Dies erreicht man, indem man Transformieren>Umkodieren>In
andere Variablen... auswählt.

In dem erschienen Fenster muß man dann die Variable für das Geschlecht (hier 'sex') auswählen und mit Hilfe des Pfeils in das Feld 'String-Variable -> Ausgabevar.:' verschieben. In das Feld 'Name' muß man dann den Namen für die neue Variable (hier 'gesch') eingeben und mit 'Ändern' bestätigen. Nachdem man auf 'Alte und neue Werte' geklickt hat, erscheint ein weiteres Fenster:

Zunächst gibt man auf der linken Seite 'Male' und auf der
rechten Seite '1' ein (s.o.) und klickt auf 'Hinzufügen'. Anschließend
wiederholt man das Ganze für 'Female' und '0', so daß sich folgendes Bild
ergibt: 
Nach Bestätigung durch 'Weiter' und 'OK' erscheint die neue Variable. In der Variablenansicht kann man dann noch die Anzahl der Dezimalstellen auf 0 festlegen.
Auf entsprechende Weise kann man auch mehreren Ausprägungen einer Variablen ein und den selben Wert zuweisen. Dies ist z.B. sinnvoll, um verschiedene Berufe in Gruppen zusammenzufassen.
3. Altersberechnung aus dem Geburtsdatum
Bislang liegen uns für die Personen des Zensus nur die Geburtsdaten vor, nicht
jedoch deren Alter. Um dies zu errechen, muß man Transformieren>Berechnen...
auswählen.

In das Feld 'Zielvariable' gibt man zunächst den Namen der neu
zu erstellenden Variable ein. In dem Feld 'Numerischer Ausdruck' muß die Formel
zur Berechnung des Alters stehen, also das Jahr des Zensus minus dem Geburtsjahr
der einzelnen Personen. Das Jahr des Zensus und das Minuszeichen kann man über
die Tastatur eingeben. Danach wählt man aus der rechten Liste die Funktion 'XDATE.YEAR(datum)'
und verschiebt diesen mit dem Pfeil in das obere Feld. Abschließend muß man
aus der linken Liste die Variable Geburtsdatum (hier 'birth') auswählen und mit
den Pfeil in das obere Feld verschieben, so daß dort '2002-XDATE.YEAR(birth)'
steht.
Bevor man die Altersberechnung durchführt, muß man noch die bereits
verstorbenen Personen ausschließen. Dazu klickt man auf den Button 'Falls...',
so daß folgendes Fenster erscheint:

Es sollen nur Fälle eingeschlossen werden, in denen das Sterbedatum fehlt. Dazu wählt man die Funktion 'MISSING(variable)' und die Variable Sterbedatum (hier 'death') aus, so daß im oberen Feld 'MISSING(death)' steht. Nach Bestätigung durch 'Weiter' und 'OK' erscheint die neue Variable. In der Variablenansicht kann man dann noch die Anzahl der Dezimalstellen auf 0 festlegen.
4. Klassenbildung bei numerischen Variablen
Oft ist es sinnvoll, die Altersangaben in Klassen zusammenzufassen (z.B. 0-9
Jahre, 10-19 Jahre etc.). Wie bei der Berechung des Alters wählt man zunächst Transformieren>Berechnen...
aus.

Wieder gibt man zunächst den Namen der neuen Variable ein, wählt dann die Funktion 'TRUNC(numausdr)' und schließlich die zuvor erzeugte Variable für das Alter (hier 'alter'). In der Klammer fügt man dann noch '/a' und hinter der Klammer '*a' ein. Dabei steht 'a' für die Größe der zu bildenden Altersklassen. (a=5 erzeugt also die Altersklassen 0-4, 5-9, 10-14 etc.) In dem Feld 'Numerischer Ausdruck' muß in diesem Fall also 'TRUNC(alter/5)*5' stehen. Wie bei der Altersberechnung sollen nur Fälle eingeschlossen werden, in denen das Sterbedatum fehlt. Nach Anklicken des 'Falls...'-Buttons wählt man wiederum die Funktion 'MISSING(variable)' und die Variable Sterbedatum (hier 'death') aus, so daß im oberen Feld 'MISSING(death)' steht. Nach Bestätigung durch 'Weiter' und 'OK' erscheint die neue Variable. In der Variablenansicht kann man dann noch die Anzahl der Dezimalstellen auf 0 festlegen.
|
|
Die '55' in der Spalte 'alter5' steht also für die Altersklasse von 55 bis 59; die '50' in der Spalte 'alter10' entsprechend für die Altersklasse von 50 bis 59. |
5. Univariate Statistik
Will man eine einzelne Variable untersuchen, muß man Analysieren>Deskriptive
Statistiken>Häufigkeiten... auswählen:

Aus der linken Liste wählt man die zu untersuchende Variable
aus und verschiebt sie nach rechts. Mit dem Button 'Diagramme...' kann man
verschiedene Diagrammtypen und Diagrammwerte auswählen.
Über den Button 'Statistik...' lassen sich verschiedene Maßzahlen auswählen,
die berechnet werden sollen. ![]()
Die Häufigkeitsverteilung der Variable Religionszugehörigkeit
sieht z.B. wie folgt aus: 
Bei der unbeschrifteten roten Fläche handelt es sich um die sogenannten 'missing values' - also um fehlende Werte. (In diesem Fall sind das die vier Großeltern, deren Religionszugehörigkeit nicht erhoben wurde.) Häufig macht es keinen Sinn, diese 'missing values' in die Analyse mit einzubeziehen. Auf keinen Fall darf man sie mit der Angabe 'keine Religionszugehörigkeit' (o.ä.) verwechseln.
Für numerische Werte sind natürlich noch weitere statistische Angaben sinnvoll. Bei der Altersverteilung erhält man neben dem Mittelwert beispielsweise auch noch Standardabweichung/Varianz sowie Minimum und Maximum:

6. Bivariate Statistik
Um zwei Variablen in einer Kreuztabelle darzustellen, muß man Analysieren>Deskriptive
Statistik>Kreuztabellen... auswählen:

Wie gewohnt wählt man aus der linken Liste die Variablen aus
und verschiebt sie in das Feld 'Zeilen' bzw. 'Spalten'. Über den Button
'Statistik...' kann man verschiedene Maßzahlen auswählen, die berechnet werden
sollen. ![]()

SPSS ist ein sehr umfangreiches Programm mit vielen Funktionen. Das Kochbuch soll nur die ersten Schritte erläutern. Unter Hilfe>Lernprogramme finden sich sehr instruktive Tutorien, und auch an guten Lehrbüchern mangelt es nicht. [z.B.: Martens, Jul (1999): Statistische Datenanalyse mit SPSS für Windows. Oldenbourg]
...