Datenaufbereitung
Dateiformate
Dateien können in den folgenden Formaten übermittelt werden:
MS Excel, CSV, SPSS, txt, MS Access oder SAS.
Struktur der Datenmatrix
- Die Variablennamen der Datenmatrix müssen in der ersten Zeile stehen. Abgesehen von dieser ersten Zeile darf die Tabelle nur Datenwerte enthalten (keine Zwischenresultate, Formeln, Graphiken, etc.).
- Die Beobachtungen (z. B. Patient:innen) stehen in den Zeilen, die Variablen stehen in den Spalten einer einzigen Tabelle.
- Die erste Variable soll die eindeutige Patientenkennung enthalten (z. B. Patnr).
- Der Datensatz darf keine Patient:innennamen enthalten.
Bei wiederholten Messungen pro Individuum gibt es zwei Möglichkeiten:
Eine Zeile pro Individuum
A | B | C | D | E | F | G | |
---|---|---|---|---|---|---|---|
1 | PatNr | Alter | Sex | Datum1 | Gewicht1 | Datum2 | Gewicht2 |
2 | 1 | 46 | 0 | 12.10.97 | 73 | 20.11.97 | 69 |
3 | 2 | 59 | 1 | 13.09.97 | 63 | 22.10.97 | 62 |
Die wiederholten Variablen müssen entsprechend der laufenden Nummer der Messung numeriert sein (z. B. Datum1 und Gewicht1 für die 1. Messung, Datum2 und Gewicht2 für die 2. Messung)
Eine Zeile pro Individuum und wiederholter Messung
A | B | C | D | E | F | |
---|---|---|---|---|---|---|
1 | PatNr | Alter | Sex | Messung | Datum | Gewicht |
2 | 1 | 46 | 0 | 1 | 12.10.97 | 73 |
3 | 1 | 46 | 0 | 2 | 20.11.97 | 69 |
4 | 2 | 59 | 1 | 1 | 13.09.97 | 63 |
5 | 2 | 59 | 1 | 2 | 22.10.97 | 62 |
In diesem Fall muß es eine Variable geben, welche die wiederholten Messungen pro Individuum aufsteigend numeriert (z. B. Messung).
- Klären Sie mit dem Institut für Medizinische Statistik ab, welche Form der Datenmatrix Sie für die geplante Auswertung verwenden sollen.
- Es dürfen nur Buchstaben von A-Z, Ziffern von 0-9 und _ (Underline) verwendet werden.
Das erste Zeichen muß ein Buchstabe sein. - Groß- und Kleinschreibung wird nicht unterschieden.
- Jeder Variablenname darf nur 1x verwendet werden.
Codierungen
- Werden Werte codiert, so sollen die Codes numerisch sein (z. B. 1 für männlich, 0 für weiblich).
- Geordnete Merkmale sollen aufsteigend (ordnungserhaltend) vercodet werden.
- Codes für die gleichen Antwortkategorien sollen für alle Variablen gleich sein z. B. 0 = nein, 1 = ja.
- Sind Mehrfachantworten auf eine Frage möglich, so ist für jede Antwortmöglichkeit in der Datenmatrix eine Ja/Nein-Antwort vorzusehen.
Linkerhand korrekte, rechts ungültige Kodierung:
Patnr | Diag1 | Diag2 | Diag3 |
---|---|---|---|
1 | 0 | 0 | 1 |
2 | 1 | 1 | 0 |
Patnr | Diagnose |
---|---|
1 | 3 |
2 | 1 und 2 |
Werte
In den Zellen dürfen nur Zahlen stehen und keine Maßeinheiten. Daher muß die gewählte Maßeinheit pro Variable für alle Eintragungen einheitlich sein. Zum Beispiel, Gewicht: 73 (nicht 73 kg). Im Falle fehlender Werte ist die entsprechende Zelle leer zu lassen (keine Leerzeichen, Nullen, etc.). Zahlen bitte ohne Zahlentrennpunkte angeben: 2303493 (nicht 2.303.493). Datumsvariablen müssen in der Form TT.MM.JJJJ angegeben sein (z. B. 15.10.1996). In MS-Excel müssen Zahlenwerte im Excel-Zahlenformat, Datumswerte im Excel-Datumsformat eingegeben werden.
Legende
Zur Datenmatrix ist ein Beiblatt zu erstellen, in dem die Bedeutung und Kodierung der Variablen erläutert wird.