Suchformular schließen

Lexikon der Medizinischen Laboratoriumsdiagnostik

Info

Publiziert am: 26.04.2018

Test, statistischer

Verfasst von: R.-D. Hilgers, N. Heussen und S. Stanzel

Test, statistischer

Synonym(e)

Hypothesentest; statistischer Signifikanztest

Englischer Begriff

statistical test

Definition

Ein statistischer Test ist ein Entscheidungsverfahren zur Prüfung einer wissenschaftlichen Hypothese aufgrund von Daten aus einer oder mehreren Stichproben (s. Stichprobe).

Beschreibung

Im medizinisch-biologischen Bereich können wissenschaftliche Hypothesen meist nicht direkt bewiesen werden, da unbekannte Faktoren eventuell vorhandene Gesetzmäßigkeiten stören.

Die Gültigkeit einer wissenschaftlichen Hypothese wird überprüft, indem ein konkretes Experiment benutzt wird, um die Vereinbarkeit der Hypothese mit der Realität zu erklären. Wird beispielsweise die Hypothese untersucht, ob eine bestimmte Operationsmethode die Blutzuckerkonzentration beeinflusst, muss zusätzlich die Tatsache berücksichtigt werden, dass mehrfache Blutzuckerbestimmungen beim gleichen Patienten zufällige (biologische) Schwankungen aufweisen. Auch bei fehlendem Einfluss der Operationsmethode werden die Messungen der Blutzuckerwerte eines Patienten vor und nach der Operation voneinander abweichen. Sind die beobachteten Blutzuckerveränderungen jedoch ausschließlich durch Zufallsschwankungen bedingt, so kann man erwarten, dass diese Differenzen im Mittel (Mittelwert, arithmetischer) sehr klein sind, dass sie also nur zufällig vom erwarteten Wert Null abweichen. Auf dieser Tatsache basiert die Konstruktion von Beurteilungskriterien für die Gültigkeit der Hypothese.

Eine Hypothese der Art „Es besteht kein Unterschied“ oder „Beobachtete Unterschiede weichen nur zufällig von Null ab“ werden in der Statistik als Nullhypothese (H₀) bezeichnet. Die komplementäre Aussage heißt Alternativhypothese (H₁). Die zentrale Bedeutung der Nullhypothese ist, dass sie Annahmen zur Formulierung eines Wahrscheinlichkeitsmodells festlegt. Lassen sich die tatsächlichen Beobachtungen (s. Beobachtung) durch das so festgelegte Modell nur unzulänglich erklären, wird die ursprüngliche Annahme in der Form der Gültigkeit von H₀ als unhaltbar verworfen. Unter der Annahme der Richtigkeit der Nullhypothese ist man in der Lage, die Verteilung (Verteilung, statistische) der Prüfgröße vor Beginn des Versuchs zu spezifizieren. So können Aussagen über das voraussichtliche Versuchsergebnis gemacht werden. Es wird ein Bereich angegeben, in dem die Realisation der Prüfgröße mit einer bestimmten (hohen), vor Versuchsbeginn festzulegenden Wahrscheinlichkeit zu finden sein wird (z. B. 95 oder 99 %). In den komplementären Bereich fällt unter der Annahme der Gültigkeit der Nullhypothese die Realisation der Prüfgröße nur mit einer geringen Wahrscheinlichkeit von α = 0,05 (5 %) bzw. 0,01 (1 %), der sog. Irrtumswahrscheinlichkeit (s. Irrtumswahrscheinlichkeit α, Irrtumswahrscheinlichkeit β). Fällt die Realisation der Prüfgröße in diesen Ablehnbereich, ist ein Ereignis eingetreten, dem bei Zutreffen der Nullhypothese nur eine geringe Wahrscheinlichkeit zukommt. In diesem Falle wird man sich daher dafür entscheiden, die Nullhypothese zu verwerfen und die Alternative anzunehmen, eine solche Testentscheidung nennt man „signifikant“.

Fällt die Realisation der Prüfgröße nicht in den Ablehnbereich, sondern in den Annahmebereich, hat das Experiment keine gewichtigen statistischen Gründe geliefert, die Nullhypothese anzuzweifeln und die Nullhypothese wird nicht verworfen. Die entsprechende Testentscheidung wird „nicht signifikant“ genannt.

Die Auswahl eines speziellen Testverfahrens hängt nicht nur von den zu prüfenden Hypothesen ab, sondern darüber hinaus von den Informationen über die vorliegende(n) Stichprobe(n). Testverfahren lassen sich nach der Zielsetzung des Tests (Vergleich von Erwartungswerten, Varianzen oder Häufigkeiten), der Anzahl der Stichproben (ein, zwei oder mehr als zwei), der Art der Stichproben (unabhängig, abhängig) sowie der Verteilung der Prüfgröße (Binomialverteilung, Normalverteilung, andere oder auch unbekannt) klassifizieren. Die Tabelle fasst häufig verwendete Testverfahren für Ein- und Zweistichprobensituationen in Hinblick auf die Zielsetzung des Tests zusammen:

Zielsetzung	Stichprobe	Testverfahren
Vergleich eines Anteils mit einem festen Wert	Eine	Binomialtest
Vergleich zweier Anteile	Zwei, unabhängig	^χ2-Test
Vergleich eines Mittelwertes mit einem festen Wert	Eine	(Einstichproben) t-Test
Vergleich zweier Mittelwerte	Zwei, abhängig	Verbundener t-Test
Vergleich zweier Mittelwerte	Zwei, unabhängig	Unverbundener t-Test
Vergleich zweier Verteilungen	Zwei, abhängig	Wilcoxon-Vorzeichen-Rangtest
Vergleich zweier Verteilungen	Zwei, unabhängig	Wilcoxon-Rangsummentest, Mann-Whitney-U-Test

Literatur

Hilgers R-D, Bauer P, Scheiber V (2002) Einführung in die Medizinische Statistik. Springer-Verlag, Berlin/Heidelberg/New York

Live-Webinar: Aktuelle Leitlinien bei Herz-Kreislauf-Erkrankungen

Springer Medizin

Test, statistischer