Im medizinisch-biologischen Bereich können wissenschaftliche Hypothesen meist nicht direkt bewiesen werden, da unbekannte Faktoren eventuell vorhandene Gesetzmäßigkeiten stören.
Die Gültigkeit einer wissenschaftlichen Hypothese wird überprüft, indem ein konkretes Experiment benutzt wird, um die Vereinbarkeit der Hypothese mit der Realität zu erklären. Wird beispielsweise die Hypothese untersucht, ob eine bestimmte Operationsmethode die Blutzuckerkonzentration beeinflusst, muss zusätzlich die Tatsache berücksichtigt werden, dass mehrfache Blutzuckerbestimmungen beim gleichen Patienten zufällige (biologische) Schwankungen aufweisen. Auch bei fehlendem Einfluss der Operationsmethode werden die Messungen der Blutzuckerwerte eines Patienten vor und nach der Operation voneinander abweichen. Sind die beobachteten Blutzuckerveränderungen jedoch ausschließlich durch Zufallsschwankungen bedingt, so kann man erwarten, dass diese Differenzen im Mittel (
Mittelwert, arithmetischer) sehr klein sind, dass sie also nur zufällig vom erwarteten Wert Null abweichen. Auf dieser Tatsache basiert die Konstruktion von Beurteilungskriterien für die Gültigkeit der Hypothese.
Eine Hypothese der Art „Es besteht kein Unterschied“ oder „Beobachtete Unterschiede weichen nur zufällig von Null ab“ werden in der Statistik als Nullhypothese (H
0) bezeichnet. Die komplementäre Aussage heißt Alternativhypothese (H
1). Die zentrale Bedeutung der Nullhypothese ist, dass sie Annahmen zur Formulierung eines Wahrscheinlichkeitsmodells festlegt. Lassen sich die tatsächlichen Beobachtungen (s. Beobachtung) durch das so festgelegte Modell nur unzulänglich erklären, wird die ursprüngliche Annahme in der Form der Gültigkeit von H
0 als unhaltbar verworfen. Unter der Annahme der Richtigkeit der Nullhypothese ist man in der Lage, die Verteilung (
Verteilung, statistische) der
Prüfgröße vor Beginn des Versuchs zu spezifizieren. So können Aussagen über das voraussichtliche Versuchsergebnis gemacht werden. Es wird ein Bereich angegeben, in dem die Realisation der Prüfgröße mit einer bestimmten (hohen), vor Versuchsbeginn festzulegenden Wahrscheinlichkeit zu finden sein wird (z. B. 95 oder 99 %). In den komplementären Bereich fällt unter der Annahme der Gültigkeit der Nullhypothese die Realisation der Prüfgröße nur mit einer geringen Wahrscheinlichkeit von α = 0,05 (5 %) bzw. 0,01 (1 %), der sog. Irrtumswahrscheinlichkeit (s.
Irrtumswahrscheinlichkeit α,
Irrtumswahrscheinlichkeit β). Fällt die Realisation der Prüfgröße in diesen
Ablehnbereich, ist ein Ereignis eingetreten, dem bei Zutreffen der Nullhypothese nur eine geringe Wahrscheinlichkeit zukommt. In diesem Falle wird man sich daher dafür entscheiden, die Nullhypothese zu verwerfen und die Alternative anzunehmen, eine solche Testentscheidung nennt man „signifikant“.
Fällt die Realisation der
Prüfgröße nicht in den
Ablehnbereich, sondern in den
Annahmebereich, hat das Experiment keine gewichtigen statistischen Gründe geliefert, die Nullhypothese anzuzweifeln und die Nullhypothese wird nicht verworfen. Die entsprechende Testentscheidung wird „nicht signifikant“ genannt.
Die Auswahl eines speziellen
Testverfahrens hängt nicht nur von den zu prüfenden Hypothesen ab, sondern darüber hinaus von den Informationen über die vorliegende(n)
Stichprobe(n). Testverfahren lassen sich nach der Zielsetzung des Tests (Vergleich von Erwartungswerten,
Varianzen oder Häufigkeiten), der Anzahl der Stichproben (ein, zwei oder mehr als zwei), der Art der Stichproben (unabhängig, abhängig) sowie der Verteilung der
Prüfgröße (
Binomialverteilung,
Normalverteilung, andere oder auch unbekannt) klassifizieren. Die Tabelle fasst häufig verwendete Testverfahren für Ein- und Zweistichprobensituationen in Hinblick auf die Zielsetzung des Tests zusammen:
Vergleich eines Anteils mit einem festen Wert | Eine | Binomialtest |
Vergleich zweier Anteile | Zwei, unabhängig | χ2-Test |
Vergleich eines Mittelwertes mit einem festen Wert | Eine | (Einstichproben) t-Test |
Vergleich zweier Mittelwerte | Zwei, abhängig | Verbundener t-Test |
Vergleich zweier Mittelwerte | Zwei, unabhängig | Unverbundener t-Test |
Vergleich zweier Verteilungen | Zwei, abhängig | Wilcoxon-Vorzeichen-Rangtest |
Vergleich zweier Verteilungen | Zwei, unabhängig | Wilcoxon-Rangsummentest, Mann-Whitney-U-Test |