Skip to main content English

Richtlinien für eine Datenmatrix

Institut für Medizinische Statistik

Datenaufbereitung

Dateiformate

Dateien können in den folgenden Formaten übermittelt werden:

MS Excel, CSV, SPSS, txt, MS Access oder SAS.

Struktur der Datenmatrix

  • Die Variablennamen der Datenmatrix müssen in der ersten Zeile stehen. Abgesehen von dieser ersten Zeile darf die Tabelle nur Datenwerte enthalten (keine Zwischenresultate, Formeln, Graphiken, etc.).
  • Die Beobachtungen (z. B. Patient:innen) stehen in den Zeilen, die Variablen stehen in den Spalten einer einzigen Tabelle.
  • Die erste Variable soll die eindeutige Patientenkennung enthalten (z. B. Patnr).
  • Der Datensatz darf keine Patient:innennamen enthalten.
    Bei wiederholten Messungen pro Individuum gibt es zwei Möglichkeiten:

Eine Zeile pro Individuum

  A B C D E F G
1 PatNr Alter Sex Datum1 Gewicht1 Datum2 Gewicht2
2 1 46 0 12.10.97 73 20.11.97 69
3 2 59 1 13.09.97 63 22.10.97 62

Die wiederholten Variablen müssen entsprechend der laufenden Nummer der Messung numeriert sein (z. B. Datum1 und Gewicht1 für die 1. Messung, Datum2 und Gewicht2 für die 2. Messung)

Eine Zeile pro Individuum und wiederholter Messung

  A B C D E F
1 PatNr Alter Sex Messung Datum Gewicht
2 1 46 0 1 12.10.97 73
3 1 46 0 2 20.11.97 69
4 2 59 1 1 13.09.97 63
5 2 59 1 2 22.10.97 62

In diesem Fall muß es eine Variable geben, welche die wiederholten Messungen pro Individuum aufsteigend numeriert (z. B. Messung).

  • Klären Sie mit dem Institut für Medizinische Statistik ab, welche Form der Datenmatrix Sie für die geplante Auswertung verwenden sollen.
  • Es dürfen nur Buchstaben von A-Z, Ziffern von 0-9 und _ (Underline) verwendet werden.
    Das erste Zeichen muß ein Buchstabe sein.
  • Groß- und Kleinschreibung wird nicht unterschieden.
  • Jeder Variablenname darf nur 1x verwendet werden.

Codierungen

  • Werden Werte codiert, so sollen die Codes numerisch sein (z. B. 1 für männlich, 0 für weiblich).
  • Geordnete Merkmale sollen aufsteigend (ordnungserhaltend) vercodet werden.
  • Codes für die gleichen Antwortkategorien sollen für alle Variablen gleich sein z. B. 0 = nein, 1 = ja.
  • Sind Mehrfachantworten auf eine Frage möglich, so ist für jede Antwortmöglichkeit in der Datenmatrix eine Ja/Nein-Antwort vorzusehen.

Linkerhand korrekte, rechts ungültige Kodierung:

Patnr Diag1 Diag2 Diag3
1 0 0 1
2 1 1 0
Patnr Diagnose
1 3
2 1 und 2

Werte

In den Zellen dürfen nur Zahlen stehen und keine Maßeinheiten. Daher muß die gewählte Maßeinheit pro Variable für alle Eintragungen einheitlich sein. Zum Beispiel, Gewicht: 73 (nicht 73 kg). Im Falle fehlender Werte ist die entsprechende Zelle leer zu lassen (keine Leerzeichen, Nullen, etc.). Zahlen bitte ohne Zahlentrennpunkte angeben: 2303493 (nicht 2.303.493). Datumsvariablen müssen in der Form TT.MM.JJJJ angegeben sein (z. B. 15.10.1996). In MS-Excel müssen Zahlenwerte im Excel-Zahlenformat, Datumswerte im Excel-Datumsformat eingegeben werden.

Legende

Zur Datenmatrix ist ein Beiblatt zu erstellen, in dem die Bedeutung und Kodierung der Variablen erläutert wird.