Lexikon der Medizinischen Laboratoriumsdiagnostik
Autoren
R.-D. Hilgers, N. Heussen und S. Stanzel

Test, statistischer

Test, statistischer
Synonym(e)
Hypothesentest; statistischer Signifikanztest
Englischer Begriff
statistical test
Definition
Ein statistischer Test ist ein Entscheidungsverfahren zur Prüfung einer wissenschaftlichen Hypothese aufgrund von Daten aus einer oder mehreren Stichproben (s. Stichprobe).
Beschreibung
Im medizinisch-biologischen Bereich können wissenschaftliche Hypothesen meist nicht direkt bewiesen werden, da unbekannte Faktoren eventuell vorhandene Gesetzmäßigkeiten stören.
Die Gültigkeit einer wissenschaftlichen Hypothese wird überprüft, indem ein konkretes Experiment benutzt wird, um die Vereinbarkeit der Hypothese mit der Realität zu erklären. Wird beispielsweise die Hypothese untersucht, ob eine bestimmte Operationsmethode die Blutzuckerkonzentration beeinflusst, muss zusätzlich die Tatsache berücksichtigt werden, dass mehrfache Blutzuckerbestimmungen beim gleichen Patienten zufällige (biologische) Schwankungen aufweisen. Auch bei fehlendem Einfluss der Operationsmethode werden die Messungen der Blutzuckerwerte eines Patienten vor und nach der Operation voneinander abweichen. Sind die beobachteten Blutzuckerveränderungen jedoch ausschließlich durch Zufallsschwankungen bedingt, so kann man erwarten, dass diese Differenzen im Mittel (Mittelwert, arithmetischer) sehr klein sind, dass sie also nur zufällig vom erwarteten Wert Null abweichen. Auf dieser Tatsache basiert die Konstruktion von Beurteilungskriterien für die Gültigkeit der Hypothese.
Eine Hypothese der Art „Es besteht kein Unterschied“ oder „Beobachtete Unterschiede weichen nur zufällig von Null ab“ werden in der Statistik als Nullhypothese (H0) bezeichnet. Die komplementäre Aussage heißt Alternativhypothese (H1). Die zentrale Bedeutung der Nullhypothese ist, dass sie Annahmen zur Formulierung eines Wahrscheinlichkeitsmodells festlegt. Lassen sich die tatsächlichen Beobachtungen (s. Beobachtung) durch das so festgelegte Modell nur unzulänglich erklären, wird die ursprüngliche Annahme in der Form der Gültigkeit von H0 als unhaltbar verworfen. Unter der Annahme der Richtigkeit der Nullhypothese ist man in der Lage, die Verteilung (Verteilung, statistische) der Prüfgröße vor Beginn des Versuchs zu spezifizieren. So können Aussagen über das voraussichtliche Versuchsergebnis gemacht werden. Es wird ein Bereich angegeben, in dem die Realisation der Prüfgröße mit einer bestimmten (hohen), vor Versuchsbeginn festzulegenden Wahrscheinlichkeit zu finden sein wird (z. B. 95 oder 99 %). In den komplementären Bereich fällt unter der Annahme der Gültigkeit der Nullhypothese die Realisation der Prüfgröße nur mit einer geringen Wahrscheinlichkeit von α = 0,05 (5 %) bzw. 0,01 (1 %), der sog. Irrtumswahrscheinlichkeit (s. Irrtumswahrscheinlichkeit α, Irrtumswahrscheinlichkeit β). Fällt die Realisation der Prüfgröße in diesen Ablehnbereich, ist ein Ereignis eingetreten, dem bei Zutreffen der Nullhypothese nur eine geringe Wahrscheinlichkeit zukommt. In diesem Falle wird man sich daher dafür entscheiden, die Nullhypothese zu verwerfen und die Alternative anzunehmen, eine solche Testentscheidung nennt man „signifikant“.
Fällt die Realisation der Prüfgröße nicht in den Ablehnbereich, sondern in den Annahmebereich, hat das Experiment keine gewichtigen statistischen Gründe geliefert, die Nullhypothese anzuzweifeln und die Nullhypothese wird nicht verworfen. Die entsprechende Testentscheidung wird „nicht signifikant“ genannt.
Die Auswahl eines speziellen Testverfahrens hängt nicht nur von den zu prüfenden Hypothesen ab, sondern darüber hinaus von den Informationen über die vorliegende(n) Stichprobe(n). Testverfahren lassen sich nach der Zielsetzung des Tests (Vergleich von Erwartungswerten, Varianzen oder Häufigkeiten), der Anzahl der Stichproben (ein, zwei oder mehr als zwei), der Art der Stichproben (unabhängig, abhängig) sowie der Verteilung der Prüfgröße (Binomialverteilung, Normalverteilung, andere oder auch unbekannt) klassifizieren. Die Tabelle fasst häufig verwendete Testverfahren für Ein- und Zweistichprobensituationen in Hinblick auf die Zielsetzung des Tests zusammen:
Zielsetzung
Stichprobe
Testverfahren
Vergleich eines Anteils mit einem festen Wert
Eine
Binomialtest
Vergleich zweier Anteile
Zwei, unabhängig
χ2-Test
Vergleich eines Mittelwertes mit einem festen Wert
Eine
(Einstichproben) t-Test
Vergleich zweier Mittelwerte
Zwei, abhängig
Verbundener t-Test
Vergleich zweier Mittelwerte
Zwei, unabhängig
Unverbundener t-Test
Vergleich zweier Verteilungen
Zwei, abhängig
Wilcoxon-Vorzeichen-Rangtest
Vergleich zweier Verteilungen
Zwei, unabhängig
Wilcoxon-Rangsummentest, Mann-Whitney-U-Test
Literatur
Hilgers R-D, Bauer P, Scheiber V (2002) Einführung in die Medizinische Statistik. Springer-Verlag, Berlin/Heidelberg/New York