Hintergrund
Die Kritik am Konzept
p-Wert und: | Erklärung |
---|---|
Aussagekraft | Der p-Wert ist ein Ergebnis der Analyse, dessen Größe von vielen Faktoren abhängt, u. a. dem Zutreffen aller Modellannahmen, den vorliegenden Daten und deren Manipulation. Der p-Wert ist nur die Wahrscheinlichkeit, unter der Nullhypothese ein noch unwahrscheinlicheres Ergebnis für die Testgröße zu erhalten Beispiel: Ein Studienergebnis weist den Zusammenhang zwischen Alter und systolischem Blutdruck (SBD) mit einem Anstieg um 6,5 mm HG pro Altersdekade (95 %-Konfidenzintervall [6,0; 7,0]) und einem p-Wert von p = 0,001 aus. Unter der Nullhypothese (zwischen Alter und SBD besteht kein Zusammenhang) ist die Wahrscheinlichkeit für ein extremeres Testergebnis 0,1 % |
Klinische Relevanz | Ob Studienergebnisse auch eine klinische Relevanz haben, ist eine inhaltliche Entscheidung, die unabhängig von p-Werten zu beurteilen ist |
Kausalität | Der p-Wert allein hat keine Aussagekraft hinsichtlich der Kausalität von Studienergebnissen. Für Aussagen zur Kausalität sind die zugrunde liegende Methodik und das Studiendesign entscheidend. Konfirmatorische, randomisierte Studien lassen Aussagen zur möglichen Kausalität zu |
Effektstärke | Von der Größe des p-Wertes kann nicht auf die Effektstärke geschlossen werden. Sowohl große wie auch kleine Effekte können mit hohen sowie sehr kleinen p-Werten beschrieben werden. Die Größe des p-Wertes ist insbesondere von der Fallzahl abhängig. In sehr großen Studien, beispielsweise mit Sekundärdaten, führen selbst marginale Effekte zu sehr kleinen p-Werten |
Existenz von Effekten | p-Werte >0,05 bedeuten nicht, dass ein untersuchter Effekt tatsächlich nicht vorliegt, sondern lediglich, dass er mit den verwendeten Daten nicht gezeigt werden konnte [1]. Falsche Methodik, unzureichende Fallzahl oder ungenaue Daten können dazu führen, dass vorhandene Effekte nicht gezeigt werden können |
Multiples Testen | Die häufige Anwendung von mehreren unabhängigen Hypothesentests führt zur Erhöhung der Wahrscheinlichkeit, dass die Nullhypothese abgelehnt wird, obwohl sie korrekt ist. Bei 100 unabhängigen Tests – diese Anzahl wird nicht selten in Publikationen erwähnt [4] – sind 5 Tests falsch positiv (signifikant) |
Bias | Die Auswahl von Studienergebnissen aufgrund niedriger p-Werte führt zu Publikationsbias, dies ist hinlänglich bekannt Weniger bekannt ist, dass p-Werte selbst auch einer Verzerrung (Bias) unterliegen können. In multiplen Regressionsmodellen führt starke Kollinearität zwischen Prädiktoren zur Inflation der Varianz der Schätzer. Damit sind die entsprechenden p-Werte überschätzt |
Berichterstattung in Publikationen | Die alleinige Darstellung von p-Werten in Publikationen ist fast immer unzureichend. Es sollten die Effekte mit zugehörigen Konfidenzintervallen berichtet werden, ggf. ergänzt um p-Werte [21] |