After Work Statistics - So viele Tests! Die Qual der Wahl


Welchen Test nehme ich für Unterschiede zwischen zwei Gruppen?

Sie brauchen: ein gruppeneinteilendes Merkmal und Endpunkt

Welches Skalenniveau hat der Endpunkt?
  • Nominal (z.B. binär): Chi-Quadrat-Test
  • Ordinal: Mann-Whitney-U-Test
  • Metrisch: t-Test oder Mann-Whitney-U-Test


Kurze Wiederholung zu Skalenniveaus:

  • Nominal: Kategorien ohne sinnvolle Ordnung zB.:
    • Ibuprofen, Aspirin, Paracetamol
    • ja/nein, Raucher/Nichtraucher
  • Ordinal: Kategorien können geordnet werden, aber genaue Abstände sind nicht sinnvoll
    • Placebo, Ibuprofen, Morphin
    • hoher Blutdruck, normaler Blutdruck, niedriger Blutdruck
  • Metrisch: Abstände zwischen Werten sind sinnvoll (Intervallskala)
    • Ibuprofen in mg, (600 mg ist 400 mg mehr als 200 mg)
    • Dieses Beispiel erfüllt außerdem die Anforderungen einer Verhältnisskala, das heißt Sie können sinnvolle Verhältnisse bilden (600 mg ist dreimal so viel wie 200 mg)


This Shiny app is hosted by

Beispiel für binär skalierten Endpunkt

Endpunkt: Herzinfarkt gemessen als Ja/Nein

Forschungsfrage: Sie vermuten, dass Raucher ein erhöhtes Herzinfarktrisiko haben.

Test-Hypothesen:
  • Nullhypothese: Raucher haben das gleiche Herzinfarktrisiko wie Nichtraucher

  • Forschungshypothese: Das Herzinfarktrisiko für Raucher und Nichtraucher ist ungleich

Tabelle mit den beobachteten Daten

Tabelle unter der Nullhypothese

Beispiel für ordinal skalierten Endpunkt

Endpunkt: Blutdruck gemessen in Kategorien: sehr niedrig, niedrig, normal, hoch, sehr hoch

Forschungsfrage: Haben Raucher einen höheren Blutdruck als Nichtraucher?

Test-Hypothesen:
  • Nullhypothese: Die Wahrscheinlichkeit, dass ein beliebiger Wert aus Gruppe 1 größer ist als ein beliebiger Wert aus Gruppe 2, ist gleich 50%.

  • Forschungshypothese: Die Wahrscheinlichkeit, dass ein beliebiger Wert aus Gruppe 1 größer ist als ein beliebiger Wert aus Gruppe 2, ist ungleich 50%.

Daten: Der Blutdruck von 8 Patienten (4 Nichtraucher und 4 Raucher) wird beobachtet.


Tabelle mit den beobachteten Daten

Idee: Der Mann-Whitney-U-Test basiert auf der Idee der Rangierung der Daten. Das heisst, es wird nicht mit den Messwerten selbst gerechnet, sondern diese werden durch Ränge ersetzt, mit welchen der eigentliche Test durchgeführt wird. Damit beruht die Berechnung des Tests ausschliesslich auf der Ordnung der Daten (grösser als, kleiner als). Die absoluten Abstände zwischen den Werten werden nicht berücksichtigt.

Beispiel für metrisch skalierten Endpunkt

Endpunkt: Blutdruck gemessen mmHg

Forschungsfrage: Haben Raucher einen höheren Blutdruck als Nichtraucher?

Test-Hypothesen:
  • Nullhypothese: Der mittlere Blutdruck in der Population der Rauchern ist gleich dem mittleren Blutdruck in der Population der Nichtraucher.

  • Forschungshypothese: Der mittlere Blutdruck in der Population der Rauchern ist ungleich dem mittleren Blutdruck in der Population der Nichtraucher.


Im Folgenden können Sie den Mittelwert der Raucher- und Nichtraucher-Population festlegen sowie die Stichprobengröße, die zufällig aus der Population gezogen wird. Beobachten Sie, wie sich Änderungen in der Stichprobengröße, Standardabweichung oder Mittelwertdifferenz auf die Verteilung der Daten sowie den p-Wert auswirken!

Test Sie Ihr Wissen: Willkommen zu unserem Quiz!