Pädiatrie
Autoren
Rüdiger von Kries

Prävention und Epidemiologie in der Pädiatrie

Prävention hat einen bevölkerungsbezogenen Ansatz. Durch Vorsorgemaßnahmen bei primär Gesunden bzw. gesund Erscheinenden sollen Erkrankungen verhindert werden. Epidemiologie beschäftigt sich mit dem Auftreten von und Risikofaktoren für Krankheiten in Bevölkerungen. Hierbei stehen zunächst die Häufigkeit der Erkrankung bzw. Veränderungen der Häufigkeit im Zentrum des Interesses. Deshalb ist die Kenntnis epidemiologischer Methoden für die Konzeption und Bewertung von Prävention unverzichtbar. Die im Kontext der einzelnen Erkrankungen möglichen spezifischen Präventionsmaßnahmen werden bei den jeweiligen Zielkrankheiten und Programmen dargestellt. Prinzipien der Prävention und die hierbei zugrunde liegenden epidemiologischen Konzepte sind Inhalt dieses Beitrags. Wann ist Prävention möglich? Wann notwendig? Wie kann die Wirksamkeit überprüft werden?
Einleitung
Prävention hat einen bevölkerungsbezogenen Ansatz. Durch Vorsorgemaßnahmen bei primär Gesunden bzw. gesund Erscheinenden sollen Erkrankungen verhindert werden. Epidemiologie beschäftigt sich mit dem Auftreten von und Risikofaktoren für Krankheiten in Bevölkerungen. Hierbei stehen zunächst die Häufigkeit der Erkrankung bzw. Veränderungen der Häufigkeit im Zentrum des Interesses. Deshalb ist die Kenntnis epidemiologischer Methoden für die Konzeption und Bewertung von Prävention unverzichtbar. Die im Kontext der einzelnen Erkrankungen möglichen spezifischen Präventionsmaßnahmen werden bei den jeweiligen Zielkrankheiten und Programmen dargestellt. Prinzipien der Prävention und die hierbei zugrunde liegenden epidemiologischen Konzepte sind Inhalt dieses Beitrags. Wann ist Prävention möglich? Wann notwendig? Wie kann die Wirksamkeit überprüft werden?

Konzepte der Prävention

Prävention beinhaltet Vorsorge – Vorsorge, dass Erkrankungen nicht auftreten, weniger schwer verlaufen oder dass Komplikationen der Erkrankung vermieden werden. Diese 3 Zielrichtungen lassen sich verschiedenen Präventionsebenen zuordnen:
  • primäre Prävention: Verhinderung des Auftretens von Krankheiten (Beispiele: Vitamin-D-, Vitamin-K- und Fluor-Gabe, Impfen);
  • sekundäre Prävention: Früherkennung von Erkrankungen, Screening (Beispiele: Neugeborenenscreening auf Stoffwechselstörungen, angeborene Hörstörungen, Hüftdysplasie);
  • tertiäre Prävention: Verhinderung von Krankheitskomplikationen, Therapie chronischer Erkrankungen (z. B. bei Diabetes mellitus: Verhinderung der Nephropathie, Vaskulopathie, Erblindung).
„Vorsorgen ist besser als heilen“ – immer? Grundsätzlich schon, wenn
1.
Risikofaktoren und Strategien zu deren Vermeidung identifiziert wurden,
 
2.
das Ziel der Prävention ein relevantes Problem ist,
 
3.
die Prävention tatsächlich wirksam ist,
 
4.
die Nebenwirkungen der Prävention geringer als der Gewinn durch die Prävention sind.
 
Ad 1.) Die Identifikation von Risikofaktoren ist eine Domäne der Epidemiologie. Ausgangspunkt ist nicht selten eine Erkrankungszunahme. Im Gegensatz von Mythen und Verschwörungstheorien postuliert die moderne Medizin, dass es für Änderungen in der Erkrankungsinzidenz eine kausale, naturwissenschaftlich beschreibbare Ursache geben muss. Epidemiologische Methoden suchen nach empirischer Evidenz für die Ursache. Eine solche empirisch gesicherte Ursache wird als Risikofaktor – führt zur Zunahme der Inzidenz – oder als Schutzfaktor – führt zur Abnahme der Inzidenz – bezeichnet. Ein solcher empirisch gesicherter Risikofaktor ist weder eine hinreichende noch ein notwendige Bedingung für das Auftreten einer Erkrankung: Nicht alle Raucher erkranken an Lungenkrebs und Lungenkrebs kann auch Nichtraucher betreffen. Liegt ein (kausaler) Risikofaktor vor, ist die Erkrankung häufiger, wird dieser jedoch vermieden, wird die Erkrankung seltener. Die Vermeidung solcher Risikofaktoren ist ein Kernelement der Prävention. Die Identifikation von Risikofaktoren ist die Voraussetzung von Prävention und alles andere als trivial.
Ad 2.) Die Relevanz ergibt sich aus der Schwere der Erkrankung und deren Häufigkeit. Entscheidungsrelevant für Kostenträger ist die Relation von Kosten der Prävention zu Krankheitskosten. Bei Methoden zur der Erfassung der Häufigkeit von Erkrankungen sind zwei Aspekte relevant. Die Richtigkeit (Validität) beschreibt, ob als „erkrankt“ klassifizierte Personen tatsächlich die Krankheit haben bzw. als „gesund“ klassifizierte Personen tatsächlich nicht erkrankt sind. Da eine Vollerfassung fast nie möglich ist, wird meist die Häufigkeit bezogen auf eine Stichprobe „geschätzt“. Die Präzision dieser Schätzung beschreibt das 95 %-Konfidenzintervall. Hierdurch wird die Unsicherheit, die sich aus der Stichproben-Ziehung ergibt, beschrieben.
Die Relevanz der Rotavirus-Gastroenteritiden und der Varizellenerkrankungen in Deutschland, z. B. besteht vor allen in deren Häufigkeit. Bei Rotavirus-Erkrankungen sind Hospitalisierungen sehr häufig (Meldungen nach Infektionsschutzgesetz), wobei einige Kinder auch sehr schwer erkranken können (Studien). Vor Einführung der Impfung waren im Alter von 10 Jahren mehr als 90 % der Kinder meist in Folge eines Varizellen-Verlaufs, der häufig eher nur lästig als bedrohlich war, Varizellen seropositiv. Selten führten jedoch auch Varizellen bei Kindern zur Hospitalisation, Folgeschäden und waren ganz selten sogar letal. Dagegen sind systemische Meningokokken-Infektionen zwar selten, aber aufgrund ihrer Schwere relevant.
Die Erfassung der Häufigkeit von Erkrankungen bei Kindern ist eine Domäne der pädiatrischen Epidemiologie.
Ad 3.) Nur wenige Präventionsmaßnahmen wurden hinsichtlich ihrer Effektivität in randomisierten kontrollierten Studien (randomized controlled trial, RCT) überprüft. Die meisten RCT’s zur Prävention erfolgten zu Impfstoffen. Bei der Bewertung der RCT’s ist es entscheidend, ob der RCT bezogen auf den klinischen Endpunkt – die zu verhindernde Zielkrankheit – oder auf einen Surrogat-Parameter der Wirksamkeit durchgeführt wurden. Sicher beweiskräftig sind nur RCT’s mit klinischem Endpunkt.
Gründe für das Fehlen von RCT’s zu vielen Präventionsempfehlungen sind z. B. ethische Gründe oder die hohen Kosten von RCT’s. So ist eine Randomisierung zu Rauchexposition in der Schwangerschaft, Stillen oder Regelschlaflage (Bauch versus Rücken) ethisch nicht vertretbar. Zur Wirksamkeit des Ultraschall-Hüftscreenings gibt es keine beweiskräftigen RCT’s, weil zum Nachweis günstiger Langzeiteffekte sehr hohe Fallzahlen notwendig wären. Der Nachweis der Wirksamkeit basiert ausschließlich auf dem Vergleich von Zeiträumen und Regionen mit und ohne Ultraschallscreening sowie einer Fall-Kontroll-Studie.
Zur Beurteilung der Wirksamkeit von Präventionsmaßnahmen ist daher die Kenntnis der Methoden und Fallstricke epidemiologischer Methoden unverzichtbar.
Ad 4.) Prävention kann auch Risiken haben. Suchanfragen zum Impfen im Internet führen rascher zu vermeintlichen Impfkomplikationen als zu den Empfehlungen der ständigen Impfkommission am Robert Koch-Institut (STIKO). Unzweifelhaft treten im zeitlichen Zusammenhang mit Impfungen unerwünschte Ereignisse auf. Impfreaktionen wie Rötung und Schwellung an der Einstichstelle auf und leichte Allgemeinsymptome sind häufig (Prozentbereich). Auch definierte Impfkomplikationen sind beschrieben (z. B. Fieberkrämpfe, Thrombozytopenie nach MMR-Impfung [Masern, Mumps, Röteln]). Tatsächliche Impfschäden sind selten, können aber nicht ausgeschlossen werden. Für viel Verunsicherung sorgten plötzliche Todesfälle nach Sechsfachimpfung – Koinzidenz oder kausaler Zusammenhang? Mit epidemiologischen Methoden lässt sich häufig zumindest klären, ob das unerwünschte Ereignis nicht auch durch den Zufall erklärt werden kann.
Früherkennung von Krankheiten kann segensreich sein, wenn dies eine effektive Therapie zur Folge hat. Das Ergebnis jeder Screening-Untersuchung – sei diese klinisch, klinisch-apparativ oder eine Laboruntersuchung – kann jedoch in zweierlei Hinsicht falsch sein: Kranke werden nicht als krank erkannt (falsch-negativ) oder Gesunde werden nicht als gesund erkannt (falsch-positiv). Testmerkmale sind Sensitivität und Spezifität. Den Anteil der tatsächlich Kranken, den der Test als krank erkennt, beschreibt die Sensitivität. Ebenso wichtig ist es zu wissen, welcher Anteil der Gesunden richtig als gesund erkannt wird: Spezifität. Sensitivität und Spezifität sind Testcharakteristika. Entscheidend für die Bewertung der Testergebnisse im Rahmen des Screenings ist aber zu wissen, wie hoch die Wahrscheinlichkeit ist, dass ein Test-positives Kind tatsächlich erkrankt ist. Dies beschreibt der positive prädiktive Wert des Testergebnisses. Dieser hängt entscheidend davon ab, wie häufig die Erkrankung, nach der gesucht wird, in der untersuchten Kinderpopulation ist. Auch bei hoher Test-Sensitivität und Spezifität kann dieser gering sein, wie das folgende Beispiel illustriert.
Beispiel: Die Messungen transitorisch evozierter oto-akustischer Emissionen (TEOAE) bzw. Hirnstammaudiometrie (AABR) erlauben ein apparatives Hörscreening bei Neugeborenen. Die verfügbaren TEOAE-Geräte haben eine Sensitivität und Spezifität von ca. 95 %. Etwa jedes 1000ste Neugeborene hat eine für dessen Entwicklung relevante Schwerhörigkeit. Wie viele Test-positive Fälle bei 100.000 mit TEOAE untersuchten Neugeborenen in Abhängigkeit von der Prävalenz der Erkrankung in der untersuchten Population tatsächlich krank sind, illustrieren ( Tab. 1 und 2).
Tab. 1
Testergebnis bei 100.000 unselektierten Neugeborenen
 
Krank
Gesund
 
Test positiv
95
4995
Positiver prädiktiver Wert: 95/5090= ca. 1,9 %
Test negativ
5
94.905
 
Summe
100
99.900
100.000
 
Sensitivität: 95 %
Spezifität: 95 %
 
Tab. 2
Testwiederholung bei Test-positiven Neugeborenen
 
Krank
Gesund
 
Test positiv
90
250
Positiver prädiktiver Wert: 90/340= ca. 26 %
Test negativ
5
4745
 
Summe
95
4995
 
 
Sensitivität
Spezifität
 
Tab. 1 beschreibt den Einsatz des Tests bei 100.000 unselektierten Neugeborenen. Von diesen hat etwa jedes 1000ste Neugeborene eine relevante irreversible Hörstörung.
Bei Einsatz des durchaus nicht schlechten TEOAE Tests im Screening bei allen Neugeborenen ist nur etwa jeder 50. Test-positive Säugling tatsächlich erkrankt (1,9 % genau). Für einen richtig als krank identifizierten Fall werden 49 Familien zu Unrecht beunruhigt. Durch simple Testwiederholung mit TEOAE bzw. AABR mit ähnlichen Testcharakteristika wie TEOAE kann der positive prädiktive Wert verbessert werden.
Bei der Wiederholung werden nur Test-positive Kinder erneut untersucht (Tab. 2).
Nach Testwiederholung ist etwa jeder 4. Test-positive Säugling tatsächlich krank. Sensitivität und Spezifität des Tests sind unverändert. Die A-priori-Wahrscheinlichkeit krank zu sein war jedoch höher (95/5090=1,9 % vs. 1/1000=0,1 %). Vor dem Hintergrund der Tatsache, dass die Früherkennung und Therapie der angeborenen Schwerhörigkeit von erheblicher Bedeutung für die Entwicklung betroffener Kinder ist, erscheint die unbegründete Beunruhigung von 3 Familien pro richtig erkanntem Fall vertretbar. Deshalb muss jeder positive Screening-Erstbefund bis spätestens zur U2 – möglichst mit AABR – kontrolliert werden.
Dieses Beispiel macht deutlich, dass auch bei guten Testverfahren ein nicht unerheblicher Teil der im Screening auffälligen Kinder gesund sein kann. Jeder unbegründete Verdacht bei falsch-positivem Testbefund bedeutet neben unnötigen Untersuchungen oder Therapien des Kindes auch eine Belastung der Eltern durch Verunsicherung bzw. Besorgnis mit potenziell ungünstigem Einfluss auf die Eltern-Kind-Interaktion. Deshalb muss bei der Anwendung auch guter diagnostischer Tests die Frage nach der positiven Prädiktion für Erkennung in der Zielgruppe überprüft werden.
Neben diesem arithmetischen Kriterium (positiver prädiktiver Wert) wurden ethische und logistische Kriterien für die Vertretbarkeit von Screening aufgestellt. Die Kriterien von Wilson und Jungner betreffen:
Erkrankung:
  • Dies ist ein wichtiges Gesundheitsproblem.
  • Für dieses Gesundheitsproblem gibt es eine Latenz (frühsymptomatische Periode), bevor es zum Vollbild kommt.
  • Der Spontanverlauf muss bekannt sein.
  • Sie ist behandelbar.
  • Konsensus auch für die Behandlung von Frühstadien ist vorhanden.
Test:
  • Es gibt einen geeigneten Test.
  • Der Test ist für die Zielpopulation akzeptabel.
  • Der Test kann allen angeboten werden.
Gesundheitssystem:
  • Die Kosten für das Screening-Programm stehen in vertretbarem Verhältnis zu den Gesamtausgaben im Gesundheitssystem.
  • Das Programm kann über längere Zeit angeboten werden (so lange, wie die Effektivität außer Zweifel steht und der Gewinn höher ist als etwaige neu erkannte Risiken).
Da einige der Testverfahren – beim Neugeborenen Screening, z. B. für das Mukoviszidose-Screening – molekulargenetische Verfahren verwenden, wurde folgender Anforderungskatalog ergänzt. Diese Ergänzungen betreffen das Screeningprogramm als Ganzes. Neben der Forderung nach gesicherter Effektivität werden u. a. Patienteninteressen besonders herausgestellt:
  • Autonomie: Die Teilnahme erfordert umfassende Information, und die freie Entscheidung der Eltern (Patienten), ob sie daran teilnehmen wollen oder nicht.
  • Die Zielgruppe sollte die Notwendigkeit des Screenings wahrnehmen.
  • Die Effektivität muss gegen mögliche Schäden abgewogen sein.
Auch die Ansprüche an das Screeningprogramm wurden umfassender definiert:
  • Die Ziele des Programms müssen bei Beginn klar definiert sein.
  • Das Programm muss die Elemente Information und Programm-Management enthalten. Hierunter fällt z. B. das Tracking auffälliger Befunde zur Sicherstellung, dass bei allen auffälligen Screeningbefunden die Diagnose bestätigt oder ausgeschlossen wird. Das Programm muss auch eine Evaluation enthalten, die neben der Effektivität auch potenzielle Nebenwirkungen erfasst. Der Gesamtgewinn muss größer als der Schaden sein.
  • Eine Qualitätssicherung muss potenziellen Schaden durch Fehler im Programmablauf minimieren.
  • Die Zielpopulation muss klar umrissen sein – alle Individuen der Zielpopulation haben gleiche Zugangsrechte.
Diese Forderungen sind der Grund, warum vor dem Screening so ausführlich informiert und ein schriftliches Einverständnis für die Teilnahme und etwaiges Nachverfolgen auffälliger Befunde bis zur definitiven Diagnose gegeben werden muss.
Diese Überlegungen sind in der kinderärztlichen Praxis auch für die Beurteilung und Kommunikation von Entwicklungsauffälligkeiten von Bedeutung. Hierzu werden zunehmend Fragebögen eingesetzt. Nicht jede Abweichung von der Norm prädiziert eine Erkrankung – der Hinweis auf die Abweichung kann aber sehr wohl die Eltern verunsichern. Kinder brauchen in erster Linie positive Zuwendung. „Kindheit ist keine Krankheit“, so lautet ein Buchtitel, in dem Michael Hauch vor Überdiagnostik und Übertherapie warnt.

Anwendung epidemiologischer Methoden in der Pädiatrie

Epidemiologie beschäftigt sich mit dem Auftreten und den potenziellen Ursachen von Krankheiten (Risikofaktoren) in Bevölkerungen. In der deskriptiven Epidemiologie sind die Häufigkeit der Erkrankung bzw. Veränderungen der Häufigkeit im Zentrum des Interesses. Hierzu wurden eine Terminologe und Methoden der validen Erfassung entwickelt.
In der analytischen Epidemiologie wurden Methoden entwickelt, um mögliche Risikofaktoren für veränderte Krankheitshäufigkeiten zu erkennen und diese hinsichtlich eines möglichen Kausalzusammenhangs zu bewerten.

Adipositas – Epidemie bei Kindern und Jugendlichen

Die Erfassung zeitlicher Trends von Erkrankungen ist eine Kernaufgabe der Epidemiologie. In den USA ist fast jedes dritte Kind zu dick – in Europa bis zu jedes fünfte. Zu dick, also mindestens übergewichtig, ist ein Erwachsener mit einem Body-Mass-Index (BMI) über 25, adipös ist er ab einem BMI über 30. Bei Kindern können solche fixierten Grenzwerte nicht verwendet werden, da der BMI altersabhängig ist. Durch ein Pooling von Messwerten aus verschiedenen Kinderpopulation wurden altersabhängige Grenzwerte extrapoliert, die einem BMI von 25 bzw. 30 bei Erwachsenen entsprechen. Sind auch in Deutschland zu viele Kinder übergewichtig? Dies wurde in der Basiserhebung des Kinder- und Jugendgesundheitssurvey (KIGGS), einer repräsentativen Zufallsstichprobe gezeigt: Mehr als 6 % der 3- bis 17-Jährigen waren adipös, mehr als 15 % übergewichtig.
Ist Prävention gegenüber kindlicher Adipositas möglich? Wenn die Zahl der übergewichtigen Kinder und Jugendlichen in einem kurzen Zeitraum zugenommen hat, müssen veränderte Lebensverhältnisse dafür verantwortlich sein. Bei Rekruten der Geburtskohorten 1971–1979 wurde gezeigt, dass der Anteil der adipösen jungen Männer in einem Zeitraum von nur 10 Jahren von 3,4 % auf 5,7 % zugenommen hatte. Bemerkenswert an diesen Daten war, dass nicht alle Kinder und junge Erwachsene betroffen waren. Schlanke und normalgewichtige Personen wurden nicht „dicker“, während der BMI bei den Übergewichtigen und Adipösen deutlich zunahm: Die Dicken wurden immer dicker – wie auch aus Erhebungen in den USA beschrieben. Offenbar haben sich die Lebensverhältnisse in dieser Dekade so verändert, dass sich die Rate an Adipositas im Alter von 18 Jahren nahezu verdoppelt hat. Bei den Geburtskohorten 1982 bis ca. 1998 in Deutschland zeigte sich eine deutliche Zunahme des Anteils übergewichtiger und adipöser Kinder bei der Einschulung.
Die Identifikation von Risikofaktoren, die diesen veränderten Lebensverhältnissen zugrunde liegen, erlaubt Präventionsmaßnahmen. Eine Vielzahl von Programmen zur Adipositasprävention bei Kindern wurden in Deutschland initiiert. In den letzten Jahren ist es in vielen Bundesländern zu einer Trendwende bei Übergewicht und Adipositas bei der Einschulung gekommen: Kein weiterer Anstieg mehr und in einigen Bundesländern eine Abnahme der Prävalenz.

Maßeinheiten in der Epidemiologie

Die Häufigkeit von Krankheiten in Populationen wird üblicherweise als Verhältniszahl angegeben. Hierbei steht im Zähler die Zahl der Erkrankten und im Nenner die Zahl der Personen, die potenziell erkrankt sein könnten. So muss z. B. beim Vergleich von Fehlbildungshäufigkeiten sehr präzise angegeben werden, ob hierbei nur Fehlbildungen bei Lebendgeborenen oder auch Fehlbildungen bei Totgeburten erfasst worden sind. Im ersten Fall muss die Zahl der Lebendgeburten im Nenner stehen, im zweiten Fall die Zahl der Lebend- und Totgeburten. Angaben zu Krankheitshäufigkeiten können als Prävalenz oder Inzidenz angegeben werden.

Prävalenz

Die (Punkt-)Prävalenz einer Krankheit beschreibt die Häufigkeit der Krankheit in einer definierten Population zu einem definierten Zeitpunkt. Eine Prävalenzangabe wäre z. B. die Rate der an hypoplastischem Linksherzsyndrom erkrankten Kinder in Deutschland zu einem willkürlich gewählten Stichtag (z. B. 01.01.2000). Im Nenner dieser Berechnung stünden alle Kinder der Altersgruppe 0–18 Jahre, die zum Stichtag in Deutschland leben. Im Zähler stünden alle Kinder, die die Kriterien für den Nenner erfüllen und zusätzlich am Erhebungszeitpunkt das Merkmal „hypoplastisches Linksherzsyndrom“ aufweisen.
Prävalenzzahlen sind nicht geeignet, um das Risiko für das Auftreten von Krankheiten zu beurteilen. So war mit ziemlicher Sicherheit die Prävalenz von „am hypoplastischen Linksherzsyndrom erkrankten“ Kindern am 01.01.1980 annähernd Null, da fast alle Kinder mit dieser Krankheit in der 1. Lebenswoche verstarben. In den 1990er-Jahren wurden palliative Operationstechniken entwickelt, die für einige dieser Kinder ein Überleben zumindest im 1. Lebensjahr ermöglichen. So wird am 01.01.2010 die Prävalenz der Kinder mit hypoplastischem Linksherzsyndrom sicher größer als 20 Jahre zuvor sein. Obwohl die Prävalenz der Krankheit größer geworden ist, kann hieraus nicht abgeleitet werden, dass das Risiko, am hypoplastischen Linksherzsyndrom zu erkranken, in den 1990er-Jahren größer geworden ist als in den 1980er-Jahren.

Inzidenz

Das Risiko für das Auftreten von Krankheiten wird durch die Erkrankungsinzidenz beschrieben. Wie groß war z. B. die Wahrscheinlichkeit für Kinder, die im Januar 1988 geboren waren, in den ersten 5 Lebensjahren an einer systemischen Haemophilus-influenzae-b-Infektion zu erkranken? Die Wahrscheinlichkeit bzw. das Risiko für das Auftreten von Krankheiten kann empirisch bestimmt werden durch die Häufigkeit des Auftretens von Krankheiten in einer definierten Population über einen definierten Zeitraum. Eine Möglichkeit zur Bestimmung der Wahrscheinlichkeit des Auftretens systemischer Haemophilus-influenzae-b-Erkrankungen bei Kindern, die im Januar 1988 geboren wurden, bestünde in einer systematischen Registrierung aller Kinder, die im Januar 1988 in Deutschland geboren wurden und der vollständigen Erfassung systemischer Haemophilus-influenzae-b-Erkrankungen bei diesen Kindern bis einschließlich beispielsweise Januar 1993.
Die Erkrankungsinzidenz errechnet sich aus der Zahl der Neuerkrankungen in einer definierten Population während des definierten Zeitraums dividiert durch die Zahl der beobachteten Kinder, die während des definierten Zeitraums potenziell erkranken könnten. Die Erkrankungsinzidenz ist ein Indikator für das Erkrankungsrisiko. Erkrankungsrisiken in Abhängigkeit von unterschiedlichen Expositionen, die Risiko oder Schutzfaktoren darstellen können, werden in epidemiologischen Studien untersucht.

Methoden zur Messung der Häufigkeit von Krankheiten

Die Definition eines geeigneten Zählers und Nenners ist unverzichtbar für die Berechnung von Prävalenzen und Inzidenzen. Hierzu ist die Kenntnis der Zahl der Erkrankten wie die der Exponierten notwendig. Für manche Erkrankungen wird eine vollständige Erfassung angestrebt.

Vollerfassungen

Das Ziel von Vollerfassungen ist es Informationen über alle Mitglieder der Zielgruppe zu erhalten. Dies kann gelingen, wenn es rechtliche Vorgaben für die Untersuchung aller gibt, die auch durchgesetzt werden. Zu Zeiten der Wehrpflicht konnte kaum ein junger Mann der Musterung entgehen. Im Rahmen der Musterung wurden konsistent Länge und Gewicht erhoben. So konnte die Prävalenz von Adipositas für jeden Musterungsjahrgang erhoben und Zeitreihen dafür erstellt werden (Abschn. 2.1). Auch die Schuleingangsuntersuchungen sind als Vollerhebungen angelegt.
Auch mit Sekundärdaten, d. h. Daten, die primär für einen anderen Zweck erhoben wurden, können Vollerhebungen in definierten Subpopulationen durchgeführt werden. Hierbei werden zu anderen Zwecken vollständig erhobene Daten – wie z. B. Krankenversicherungsdaten – ausgewertet. Die deutliche Zunahme der Ritalin-Verordnungen wurde so erfasst. Daten der kassenärztlichen Vereinigungen werden für die Erfassung von altersspezifischen Impfraten genutzt.
Krankenkassendaten können – bei Verwendung validierter Algorithmen – auch zur Erfassung von Prävalenzen/Inzidenzen von z. B. entzündlichen Darmerkrankungen bei Kindern und Jugendlichen genutzt werden.
Eine Vollerhebung meldepflichtiger Ereignisse wie Geburten und Todesfälle erfolgt nach den Personenstandsgesetzen der einzelnen Bundesländer. Hierbei kann aufgrund der administrativen Vorgaben und rechtlichen Implikationen erwartet werden, dass alle Geburten und Todesfälle erfasst werden. Im Infektionsschutzgesetz gibt es eine Meldepflicht für ausgewählte Infektionskrankheiten. Im Infektionsschutzgesetz wird z. B. die Meldung von systemischen Hämophilus-influenzae- oder Meningokokken-Erkrankungen gefordert (Meldepflicht). Es werden jedoch trotzdem nicht alle Fälle gemeldet, wie Untersuchungen mit einem unabhängigen Erfassungssystem gezeigt haben.
In der Kinder- und Jugendmedizin wird eine Vollerfassung für Krebsfälle weitgehend erreicht. Bei freiwilligen Erhebungen zu seltenen Erkrankungen in ESPED, einem Surveillance-System mit monatlicher Abfrage in allen deutschen Kinderkliniken, erhalten alle Chefärzte bzw. Leiter von selbstständigen Abteilungen in deutschen Kinderkliniken eine monatliche Postkarten- bzw. E-Mail-Anfrage, auf der sie gebeten werden anzugeben, ob und wie häufig eine Auswahl von bis zu 12 unterschiedlichen Krankheiten in ihrer Institution im vorangegangenen Monat beobachtet worden ist. Die Kollegen werden gebeten, die Postkarte auch dann zurückzusenden, wenn kein Fall der aufgeführten Krankheiten in ihrer Klinik beobachtet worden ist. Anhand der Rücklaufquoten der Postkarten kann überprüft werden, wie groß der Anteil der an der Erhebung teilnehmenden Kliniker ist.
Auch bei solch aktiven Surveillance-Systemen kann jedoch nicht von einer vollständigen Erfassung aller interessierenden Fälle ausgegangen werden. Der Abgleich der Datenerfassung zur Diabetes-Inzidenz bei Kindern bis zum Alter von 15 Jahren mit einer 2. unabhängigen Datenquelle zeigte, dass nur mit ESPED allein 72 % der tatsächlichen Fälle, durch Abfrage bei Kinder behandelnden Ärzten der Studienregion allein 46 % der tatsächlichen Fälle und mit beiden Erfassungssystemen zusammen 85 % der geschätzten, tatsächlichen Fallzahl zu erfassen waren.

Stichprobenerhebungen

Eine Stichprobe liegt z. B. der KIGGS Erhebung zugrunde. Ziel des KIGGS war es, den Gesundheitsstatus und das Gesundheitsverhalten von Kindern und Jugendlichen in Deutschland abzubilden. Es ist evident, dass es nicht möglich ist, alle Kinder zu befragen oder gar zu untersuchen. Deshalb erfolgte die Erhebung in einer Stichprobe. Eine valide Stichprobe ist für die Erhebung der interessierenden Daten völlig ausreichend. Hierbei sind zwei wesentliche Aspekte zu berücksichtigen: die Unschärfe und Validität. Die Unschärfe ergibt sich aus dem statistischen Fehler bei der Gewinnung einer Zufallsstichprobe. Diese Unschärfe wird mit dem 95 %-Konfidenzintervall geschätzt. Validität – Vermeidung von Selektionsbias – wird angestrebt, indem die Erhebung auf eine Zufallsstichprobe begrenzt wird. Gelingt bei allen randomisierten Personen die Erhebung, ist der Selektionsfehler null und die Validität gesichert. Leider gelingt die Datenerhebung nicht immer bei allen randomisierten Personen – im KIGGS waren dies 33 % der Stichprobe. Um abzuschätzen, ob und welche Verzerrung sich hieraus ergibt, wurde die Ursache der Nichtteilnahme analysiert. Hierbei fanden sich zu einem kleineren Teil Effekt-neutrale Ausfälle, die per definitionem keinen Einfluss auf das Ergebnis haben können. Weiterhin wurde in einer Nicht-Teilnehmeranalyse überprüft, ob z. B. der Gesundheitszustand die Teilnahme beeinflusste. Nach diesen Analysen kann der KIGGS als repräsentativ angesehen werden und bildet somit den Gesundheitszustand der Kinder in Deutschland valide ab.

Studientypen zur Erfassung möglicher Kausalzusammenhänge und deren häufige Fehlerquellen

Sind die Inzidenzen einzelner Krankheiten in unterschiedlichen Populationen bzw. während unterschiedlicher Zeiträume in einer Population different, stellt sich die Frage, welche Ursachen diesen Unterschieden zugrunde liegen. Diese Ursachen können als protektive oder als Risikofaktoren identifiziert werden. Die Kenntnis relevanter protektiver Faktoren oder von Risikofaktoren ermöglicht rationale Präventionsmaßnahmen.

Ökologische Studien

Das einfachste Studiendesign ist die ökologische Studie. In Frankreich sterben weniger Menschen am Herzinfarkt als in Deutschland. Franzosen trinken pro Kopf mehr Rotwein als Deutsche. Besteht ein Zusammenhang zwischen dem Rotweinkonsum und Herzinfarkten? Solche Beobachtungen sind ausreichend, Hypothesen zu generieren – beweisen können sie solche Zusammenhänge jedoch nicht: Franzosen trinken nämlich nicht nur pro Kopf mehr Rotwein, sondern sie essen auch weniger tierische Fette, stattdessen verwenden sie mehr Olivenöl. Darüber hinaus kann man anhand solcher Daten keinen Bezug zur individuellen Exposition bei Erkrankten machen: Ob nun in Frankreich gerade die Rotweintrinker gehäuft Herzinfarkte haben oder nicht, kann nicht beurteilt werden.

Berechnungen der SMR (standarisierte Mortalitäts-/Morbiditäts-Ratio)

Treten unerwünschte Ereignisse z. B. unmittelbar nach einer Impfung auf, die nicht durch unser biologisches Verständnis erklärt werden können, wird die zeitliche Koinzidenz von Betroffenen als kausal erlebt. Nun beginnen viele chronische Erkrankungen bei Kindern in einem Alter, in dem viele Impfungen erfolgen. Ist der Beginn zu exakt dem Zeitpunkt der Impfung nun Zufall oder durch die Impfung ausgelöst? Hierzu kann die Berechnung der SMR weiterhelfen.
Eine besonders dramatische Koinzidenz war das Auftreten von >10 SIDS(sudden infant death syndrome)-Fällen am Tag der Impfung mit einem Sechsfach-Impfstoff bzw. am 1. und 2. Folgetag, die nach Einführung dieses Impfstoffes beobachtet wurden. Zufall oder Kausalität? Basierend auf der bekannten SIDS-Fallzahl pro Lebensmonat in dem Jahr, in dem die SIDS-Fälle nach Impfung auftraten, und dem Zeitpunkt der in dem Zeitraum erfolgten Sechsfachimpfungen, kann errechnet werden, wie viele SIDS-Fälle am Tag der Sechsfachimpfung und den Folgetagen rein zufällig zu erwarten sind. Um festzustellen, ob dies nun mehr Fälle sind als rein zufällig zu erwarten wären, wird eine SMR berechnet: Im Zähler steht die Zahl der an dem Lebenstag nach Impfung beobachteten Fälle, im Nenner die Zahl der zufällig zu erwartenden Fälle. Eine SMR von >1 zeigt ein erhöhtes Risiko an. Schließt die untere Grenze des 95 %-Konfidenzintervalls dieser SMR die 1 (kein Effekt) aus, kann gefolgert werden, dass der Zufall diese erhöhte SMR eher nicht erklären kann – eine zufällige Koinzidenz ist in diesem Fall unwahrscheinlich, ein kausaler Zusammenhang erscheint möglich. Bei den SMR-Berechnungen für unerklärte Todesfälle im zeitlichen Zusammenhang mit Sechsfachimpfungen waren im 1. Lebensjahr alle SMR Schätzer kleiner 1 – somit ergab sich kein Anhalt für einen Kausalzusammenhang.

Querschnittsuntersuchungen

Querschnittsuntersuchungen („cross sectional studies“) sind weit verbreitet und erlauben eine etwas bessere Beurteilung der Zusammenhänge zwischen potenziellen Schutz- und Risikofaktoren und Erkrankungen. So basiert z. B. eine der meistzitierten Studien zur Hygienehypothese bei Allergien auf einer solchen Querschnittserhebung: Bei Einschulungsuntersuchungen in ländlichen Regionen in Bayern wurde über Fragebogen die Lebenszeitprävalenz von allergischen Erkrankungen erfragt. Die Lebenszeitprävalenz erlaubt ebenso wie die Inzidenz eine Aussage über Erkrankungsrisiken. Zusätzlich wurde erfragt, ob die Kinder auf einem Bauernhof lebten – mit oder ohne Stalltieren. Bei Kindern, die auf einem Bauernhof mit Stalltieren lebten, war die Lebenszeitprävalenz von Heuschnupfen und Asthma am niedrigsten. Dies konnte nicht durch Verzerrungen (Bias) oder Störfaktoren (Confounding) erklärt werden. Offenbar gibt es Faktoren, die mit dem Stalltierkontakt in Zusammenhang stehen, die mit Heuschnupfen und Asthma assoziiert sind – als Ursache oder als Folge. Da die zeitliche Sequenz in Querschnittsuntersuchungen meist nicht erhoben wird, kann dies nur durch Plausibilitätsüberlegungen differenziert werden.
In den meisten Fällen ist eine Differenzierung von Ursache und Wirkung einfach möglich. So würde kaum ein vernünftiger Untersucher aus Ergebnissen einer Querschnittsuntersuchung, die bei Kindern mit obstruktiven Atemwegserkrankungen den häufigeren Gebrauch von Sekretolytika konstatiert, folgern, dass Sekretolytika das Auftreten von obstruktiven Bronchialerkrankungen begünstigen könnte. Im Einzelfall kann aber die Erkenntnis von Ursache und Wirkung weniger evident sein.
Jedoch ist es kaum denkbar, dass Eltern in ländlichen Gegenden Bayerns Viehbauern werden, weil ihre Kinder weder Asthma noch Heuschnupfen haben. Deshalb ist in dieser Querschnittserhebung eine Differenzierung zwischen Ursache und Wirkung („Henne und Ei“) möglich: Wahrscheinlich ist das Aufwachsen auf einem Bauernhof mit Stalltierkontakt protektiv gegenüber Asthma und Heuschnupfen.

Fall-Kontroll-Studien

Das Prinzip von Fall-Kontroll-Studien ist der Vergleich von Erkrankten und nichterkrankten Kontrollpersonen hinsichtlich verschiedener Risikofaktoren. Die Aussagekraft von Fall-Kontroll-Studien ist ähnlich wie die von Querschnittserhebungen zu bewerten. Ist der vermutete Risikofaktor für das Auftreten der Krankheit von Bedeutung, wird diese Exposition bei den Erkrankten häufiger gefunden als bei den Kontrollpersonen. Wird die betreffende Exposition bei den Fällen hingegen seltener als bei den Kontrollpersonen gefunden, kann angenommen werden, dass diese Exposition einen protektiven Faktor darstellt.
Fall-Kontroll-Studien sind per Definition retrospektiv. Nach der Identifikation von Krankheitsfällen und entsprechenden Kontrollpersonen wird überprüft, ob die interessierende Exposition bei den Krankheitsfällen häufiger oder seltener vorlag als bei den Kontrollpersonen. Die Exposition gegenüber dem vermeintlichen Risikofaktor bzw. protektiven Faktor liegt jedoch häufig längere Zeit vor der Diagnose der Krankheit. Basiert die Erfassung der Exposition auf Befragungen, muss mit Fehlangaben gerechnet werden. Ist die Richtung dieser Fehlangaben zufällig, wird ein etwaiger Effekt unterschätzt. Ist die Richtung der Fehlangaben bei Fällen und Kontrollen unterschiedlich, sind Verzerrungen in alle Richtungen möglich. Befragt man Mütter von Kindern mit SIDS zur Regelschlaflage ihrer Kinder, werden sie möglicherweise die aktuell empfohlene Regelschlaflage angeben, um Schuldgefühle zu minimieren, während Mütter von gesunden Kontrollen die tatsächliche Regelschlaflage angeben werden. In den Jahren, als die Fall-Kontroll-Studien zu SIDS durchgeführt wurden, gab es keine klaren Empfehlungen zu einer präferenziellen Schlaflage. Deshalb war die Richtung der Angaben zur Regelschaflage von Fällen und Kontrollen wahrscheinlich nicht differenziell systematisch verzerrt. Eine solche differenzielle systematische Verzerrung der Angaben wird als Recall-Bias bezeichnet. Eine Möglichkeit, Fehler durch systematisch gerichtet falsche Erhebung der Exposition zu minimieren, ist die Datenerhebung aus archivierten Dokumenten bzw. Datenträgern durch „blinde Untersucher“, die nicht wissen, ob die gesammelten Daten Krankheitsfällen oder Kontrollpersonen zuzuordnen sind.
Ein besonderes Problem bei der Durchführung von Fall-Kontroll-Studien stellt die Auswahl geeigneter Kontrollgruppen dar. Als Kontrollpersonen kommen sowohl gesunde Kinder als auch Kinder mit anderen Krankheiten infrage. Es wird hierbei angestrebt, dass die Exposition der betreffenden Kontrollpersonen gegenüber dem vermeintlichen Risikofaktor die Exposition darstellt, der die Fälle ausgesetzt wären, wenn sie nicht erkrankt wären. Fehler durch die Auswahl der Kontrollen werden als Selektionsbias bezeichnet.
Neben einem solchen systematischen Fehler (Bias) müssen auch im Rahmen von Fall-Kontroll-Studien Störfaktoren berücksichtigt werden. Im Idealfall unterscheiden sich Krankheitsfälle und Kontrollpersonen nur hinsichtlich der interessierenden Exposition. In der Praxis unterscheiden sich diese jedoch auch noch hinsichtlich anderer Risikofaktoren für die Krankheit. Um eine hierdurch bedingte Verzerrung (Confounding) der Untersuchungsergebnisse auszugleichen, sind besondere statistische Verfahren bei der Datenanalyse notwendig. Einer der wichtigsten Einwände gegen die 1992 von Golding et al. publizierte Hypothese, dass eine parenterale Vitamin-K-Prophylaxe verantwortlich für ein erhöhtes Krebsrisiko im Kindesalter sein könne, war, dass im Rahmen dieser Studie überwiegend Kinder mit besonderen perinatalen Problemen eine parenterale Vitamin-K-Prophylaxe erhalten hatten. Wären nun aber diese besonderen perinatalen Probleme und nicht die parenterale Vitamin-K-Prophylaxe verantwortlich für das vermutete erhöhte Krebsrisiko, wäre die Annahme, dass die parenterale Vitamin-K-Prophylaxe Krebs verursachen könnte, unbegründet (Confounding). Eine möglichst vollständige Erfassung aller auch nur denkbaren Störfaktoren im Rahmen derartiger Studien ist notwendig, damit diese in der Analyse berücksichtigt werden können. Durch mathematische Verfahren werden Fälle und Kontrollen so ähnlich gemacht (Adjustierung), dass die betreffenden Störfaktoren bei beiden gleich verteilt sind. Dies ist jedoch nur für die Störfaktoren möglich, für die auch entsprechende Daten erhoben worden sind, d. h. der Störfaktor muss bekannt sein. So muss bei jedem neu identifizierten Risikofaktor die Frage gestellt werden, ob tatsächlich dieser Risikofaktor oder ein hiermit assoziierter unzureichend bekannter und nicht berücksichtigter Störfaktor verantwortlich für das erhöhte Erkrankungsrisiko ist.
Fall-Kontroll-Studien kommen häufig dann zum Einsatz, wenn neue potenzielle Risiko- oder protektive Faktoren diskutiert werden. Muss eine rasche Entscheidung angestrebt werden, ob diese Expositionen tatsächlich Risiko- bzw. Schutzfaktoren darstellen, können – insbesondere bei langen Latenzen zwischen dem Auftreten der Exposition und dem Manifestwerden der Krankheit – Ergebnisse prospektiver Studien nicht abgewartet werden. Aus einer prospektiven Geburtskohortenstudie, in der u. a. explorativ nach Risikofaktoren für Krebs bei Kindern gesucht wurde, ergab sich 1990 der Verdacht, dass eine parenterale Vitamin-K-Prophylaxe Krebs im Kindesalter verursachen könne. Durch prospektive Studien mit dem Ziel der Konfirmation wäre diese Frage nicht ausreichend rasch zu beantworten, da zwischen der parenteralen Vitamin-K-Gabe bei der Geburt und dem Auftreten von Krebserkrankungen die Kinder bis zu 15 Jahre nachbeobachtet werden müssten. Deshalb wurde diese Hypothese zunächst in einer Fall-Kontroll-Studie überprüft. Nachdem diese 1. Fall-Kontroll-Studie den Verdacht zu bestätigen schien, konnte ein generelles Krebsrisiko der parenteralen Vitamin-K-Prophylaxe durch weitere Fall-Kontroll-Studien weitgehend ausgeräumt werden.
Ein weiterer Vorteil der Fall-Kontroll-Studien ist die Möglichkeit der Untersuchung von Ursachen auch seltener Krankheiten. Neuralrohrdefekte z. B. sind in Deutschland mit einer geschätzten Inzidenz von 1–1,5/1000 relativ selten. Um in Deutschland anhand prospektiver Studien eine Aussage darüber machen zu können, ob perikonzeptionelle Folsäuresupplemente das Risiko für Neuralrohrdefekte auf ein Drittel reduzieren können, müssten je ca. 20.000 Schwangerschaften mit und ohne perikonzeptionelle Folsäuresupplementierung beobachtet werden, um auf dem Signifikanzniveau von p <0,05 eine statistisch signifikante Aussage über eine solche erhebliche Risikoreduktion machen zu können. Fall-Kontroll-Studien werden deshalb immer dann eingesetzt, wenn eine rasche Antwort über die potenzielle Relevanz neu vermuteter Risiko- bzw. protektiver Faktoren notwendig ist und wenn die betreffende Krankheit ein relativ seltenes Ereignis darstellt. Die Durchführung von Fall-Kontroll-Studien ist, verglichen mit den Kosten, die bei der prospektiven Begleitung großer Gruppen unterschiedlich exponierter Populationen entstehen, kostengünstig. Ein weiterer Vorteil ist die Möglichkeit, im Rahmen von Fall-Kontroll-Studien verschiedene Risikofaktoren für das Auftreten einer Krankheit zu untersuchen. In der Studie von Golding et al. aus dem Jahr 1992 wurde z. B. nicht nur die Frage nach einer möglichen Kanzerogenität der parenteralen Vitamin-K-Gabe, sondern auch die Frage nach einer möglichen Kanzerogenität einer Dolantin-Medikation bei der Mutter unter der Geburt untersucht: Für Vitamin K ergab sich ein signifikanter Zusammenhang, für Dolantin nicht.
Auch im Kontext der Überprüfung von Präventionsmaßnahmen werden Fall-Kontroll-Studien eingesetzt – so z. B. bei der Klärung der Frage, ob Ski- und Fahrradhelme Hirnverletzungen bei Unfällen verhindern können. Prospektive randomisierte oder Beobachtungsstudien würden gigantische Fallzahlen benötigen, da erfreulicherweise in Generationen vor der Erfindung von Rad- und Skihelmen bei weitem die meisten Rad- und Skifahrer ohne Hirnverletzung durchs Leben gingen.
Auch im Kontext von Sekundärprävention können Fall-Kontroll-Studien zur Überprüfung der Wirksamkeit sinnvoll sein. So gibt es z. B. keine randomisierten Studien, die die Wirksamkeit des Ultraschall-Screenings auf Hüftdysplasie belegen konnten. Die wenigen durchgeführten Studien hatten zu geringe Fallzahlen um Aussagen über die Wirksamkeit machen zu können. Der erste formale Nachweis der Wirksamkeit gelang in einer Fall- Kontroll-Studie.

Kohortenstudien

Im Rahmen von Kohortenstudien wird die Häufigkeit des Auftretens von Krankheiten in unterschiedlich exponierten Gruppen (Kohorten) prospektiv untersucht. Wegen des prospektiven Ansatzes gelten Kohortenstudien als weniger störanfällig als die vorgenannten Studien. Tritt die untersuchte Krankheit in der Kohorte, in der der vermutete Risikofaktor häufiger ist als in einer Vergleichsgruppe, gehäuft auf, wird angenommen, dass der vermutete Risikofaktor verantwortlich ist für das gehäufte Auftreten der Krankheit in der betreffend exponierten Kohorte.
Nach Definition der unterschiedlichen Kohorten aufgrund unterschiedlicher Expositionscharakteristika wird im weiteren Verlauf die Häufigkeit des Auftretens der interessierenden Krankheiten in diesen unterschiedlich exponierten Gruppen bestimmt. Im Rahmen der Untersuchungen über einen möglichen Zusammenhang von Folsäuresupplementation und Neuralrohrdefekten untersuchten Milunsky et al. (1989) 23.491 Schwangerschaften, bei denen um die 16. Schwangerschaftswoche eine α1-Fetoproteinbestimmung oder eine Amniozentese durchgeführt wurde. Zu diesem Zeitpunkt wurden auch Daten über die Einnahme von Folsäuresupplementen in der Frühschwangerschaft erhoben. Die betreffenden Mütter konnten zu dem Zeitpunkt, als sie die Angaben über die Einnahme von Folsäuresupplementen machten, noch nicht wissen, ob sie ein gesundes Kind oder ein Kind mit Neuralrohrdefekt bekommen würden. Für 22.776 der ursprünglich 23.491 erfassten Schwangerschaften konnte eindeutig festgestellt werden, ob der Fetus (bei Spontanabort oder Schwangerschaftsabbruch) bzw. das Neugeborene einen Neuralrohrdefekt hatte oder nicht.
Geeignet sind Kohortenstudien für die Untersuchung seltener Expositionen (die Kohorten können an verschiedenen Orten gegebenenfalls auch über längere Zeiträume rekrutiert werden). Im Idealfall ist die Latenz zwischen der Exposition und dem Auftreten der Krankheit kurz, sodass nur Nachbeobachtungszeiten von wenigen Jahren notwendig sind. Begünstigt wird die Durchführbarkeit von Kohortenstudien, wenn die interessierenden Krankheiten auch in der nichtexponierten Kohorte nicht zu selten sind. Um mit einer ausreichenden Sicherheit (von mindestens 80 %) eine Verdopplung des Erkrankungsrisikos mit einer Irrtumswahrscheinlichkeit von unter 5 % erkennen zu können, wären bei einer Inzidenz der Zielerkrankung bei den Nichtexponierten von 5 % 491 Nachbeobachtungen pro Kohorte notwendig. Bei einer Inzidenz von 20 % reichten je Kohorte 91 Nachbeobachtungen aus, während bei einer Inzidenz von 1 % zwei Kohorten mit jeweils 2510 Kindern nachbeobachtet werden müssten.
Voraussetzung für die Durchführbarkeit von Kohortenstudien ist die eindeutige Definierbarkeit der Exposition und eine möglichst 100-prozentige Nachuntersuchung der unterschiedlich exponierten Gruppen. So war es in der bereits zitierten Studie von Milunsky et al. (1989) möglich, bei 22.776 von 23.491 Schwangerschaften den infrage kommenden Endpunkt, Geburt eines Kindes oder Abort bzw. Interruptio bei einem Fetus mit Neuralrohrdefekt, eindeutig zu bestimmen. Bei 686 Müttern konnte der Wohnort zum Zeitpunkt der Geburt des Kindes nicht ermittelt werden, bei 29 Müttern war die vollständige Befragung nicht möglich. Eine Verzerrung des Untersuchungsergebnisses wäre möglich, wenn z. B. in der Folsäuresupplementkohorte mehr Schwangerschaften mit Ausgang „Geburt eines Kindes mit Neuralrohrdefekt“ nicht dokumentiert worden wären als in der Kohorte ohne Folsäure. Dies erscheint jedoch nur schwer vorstellbar. Selbst wenn dies der Fall wäre, könnte dies – selbst bei Zugrundelegung der Inzidenz von 3,5 Neuralrohrdefekten/1000 in der nichtsupplementierten Kohorte – im ungünstigsten Fall nur 2 zusätzliche Krankheitsfälle in der Supplementkohorte zur Folge haben. Hierdurch würde das Ergebnis der Studie nicht beeinträchtigt.
Auch wenn Kohortenstudien aufgrund ihres prospektiven Charakters per definitionem keine Recall-Bias haben können, können die Ergebnisse dennoch falsch sein. Störfaktoren (Confounding) sind ein häufiges Problem von Kohortenstudien. Im Rahmen der bereits zitierten Studie zum Zusammenhang von Folsäuresupplementen und Neuralrohrdefekten von Milunsky et al. (1989) wäre es vorstellbar, dass gerade die Frauen perikonzeptionell keine Folsäuresupplemente eingenommen hätten, die aus anderen Gründen ein erhöhtes Risiko für die Konzeption eines Kindes mit Neuralrohrdefekt hatten. Ein niedriger Sozialstatus z. B. ist mit einem erhöhten Risiko für Neuralrohrdefekte assoziiert. Sozial benachteilige Frauen könnten möglicherweise weniger leichten Zugang zu Folsäuresupplementen haben. Würde ein niedriger Sozialstatus das Risiko von Neuralrohrdefekten erhöhen, könnte somit ein Teil des Effektes der Erhöhung des Risikos für Neuralrohrdefekte durch fehlende perikonzeptionelle Einnahme von Folsäuresupplementen in Wirklichkeit durch den niedrigen Sozialstatus der keine Folsäuresupplemente einnehmenden Frauen bedingt sein.
Eine weitere potenzielle Fehlerquelle bei Kohortenstudien ist eine Fehlbestimmung des Krankheitsstatus. Besonders bei nicht sehr präziser Definition des Krankheitsstatus könnte die Wahrscheinlichkeit der Diagnosestellung bei bekannt Exponierten höher sein als bei nicht Exponierten. In der Studie von Milunsky et al. erscheint ein solcher Fehler jedoch unwahrscheinlich, da Enzephalozelen, Myelomeningozelen und die Anenzephalie klinisch sicher erkannt werden können.

Maßeinheiten für eine Risikoerhöhung bzw. Risikoreduktion

Kohortenstudien erlauben die Messung des Erkrankungsrisikos in unterschiedlich exponierten Populationen. So war in der Studie von Milunsky et al. (1989) die Inzidenz von Neuralrohrdefekten in der Gruppe der Mütter mit perikonzeptioneller Folsäureeinnahme mit 0,9/1000 Schwangerschaften deutlich niedriger als in der Gruppe ohne perikonzeptionelle Folsäurezufuhr (3,5/1000 Schwangerschaften). Das relative Risiko, ausgedrückt als Risk Ratio (RR) von Neuralrohrdefekten in Schwangerschaften mit vs. ohne perikonzeptionelle Folsäuresupplementierung betrug 0,26. Anders ausgedrückt: Das Risiko der supplementierten Gruppe betrug nur etwa ein Viertel des Erkrankungsrisikos in der nichtsupplementierten Gruppe. Wenn die RR unter 1 liegt, spricht dies für einen protektiven Effekt der Exposition, eine RR von 1 schließt einen Einfluss der betreffenden Exposition aus, eine RR von größer als 1 spricht für eine Risikoerhöhung. Eine RR von 2 heißt, dass das Erkrankungsrisiko bei den Exponierten doppelt so hoch ist wie bei den Nichtexponierten. Die RR ist damit der klassische Parameter zur Beurteilung des relativen Risikos in Kohorten- und Interventionsstudien.
In Fall-Kontroll-Studien kann das Krankheitsrisiko nicht geschätzt werden, da in Fall-Kontroll-Studien alle erreichbaren Krankheitsfälle, jedoch nur ein kleiner, willkürlich definierter Anteil der potenziellen Kontrollpersonen berücksichtigt werden. Somit kann aus dem Anteil der Krankheitsfälle in Relation zur Summe der Krankheitsfälle und Kontrollpersonen nicht das Erkrankungsrisiko für Exponierte bzw. Nichtexponierte berechnet werden. Die Odds Ratio (OR) ist der üblicherweise in Fall-Kontroll-Studien verwendete Parameter zur Beschreibung einer Risikoerhöhung oder Risikoreduktion durch unterschiedliche Expositionen. Die OR vergleicht die „Odds“ bei Fällen und Kontrollen. Die Odds bezeichnen das Verhältnis von Exponierten (z. B. Mütter, die Folsäurepräparate genommen haben) zu Nichtexponierten (in dem Folsäurebeispiel die Mütter, die keine Folsäurepräparate genommen haben) bei Fällen und Kontrollen. Die OR ist das Verhältnis der Odds bei Fällen und Kontrollen. Dieser Parameter erlaubt für seltene Krankheiten eine gute Schätzung des relativen Risikos, wobei die Zahlenwerte von OR und RR gleich interpretiert werden können.

Fehlerquellen und Kausalität in epidemiologischen Studien

Statistischer Fehler

Anhand der vorangegangen Beispiele wurden einige häufige Fehler bei epidemiologischen Studien dargestellt. Als weiterer „Fehler“ muss der statistische Fehler vorgestellt werden. Ziel epidemiologischer Studien ist es, abzuschätzen, um wie viel das Risiko für bestimmte Krankheiten durch verschiedene Expositionen erhöht oder reduziert wird. Würde man alle potenziell Exponierten nachuntersuchen und bei allen potenziell Exponierten den exakten Krankheitsstatus feststellen, ließe sich präzise beurteilen, um wie viel die betreffende Exposition das Risiko für die betreffende Krankheit erhöht oder erniedrigt. In der Praxis erfolgt diese Untersuchung jedoch nicht bei allen potenziell Exponierten, sondern in einer Gruppe von Exponierten und Nichtexponierten, deren Krankheitsstatus man beurteilen kann. Die Unschärfe der Messungen, die sich daraus ergibt, dass nicht alle potenziell Exponierten bzw. Nichtexponierten nachuntersucht werden, bedingt den statistischen Fehler der Messung. Der statistische Fehler ist also ein Maß für die Präzision der Risikoabschätzung. Risikoverhältnisse werden in epidemiologischen Studien somit geschätzt. Deshalb werden RR und OR immer mit einem Konfidenzintervall angegeben. Der Bereich des 95 %-Konfidenzintervalls z. B. gibt den Bereich an, in dem die wahre Risk (Odds) Ratio mit 95-prozentiger Wahrscheinlichkeit zu finden ist. Die Unschärfe des 95 %-Konfidenzintervalls resultiert daraus, dass die Untersuchung nur auf einer begrenzten Anzahl von Beobachtungen beruht, und reflektiert den statistischen Fehler. Der wesentliche Vorteil des statistischen Fehlers ist somit, dass sein potenzielles Ausmaß durch das Konfidenzintervall abschätzbar ist.
Neben dem 95 %-Konfidenzintervall wird häufig auch der p-Wert angegeben. Der p-Wert steht mit dem 95 %-Konfidenzintervall in Zusammenhang, ist aber konzeptionell etwas anderes. Das 95 %-Konfidenzintervall erlaubt es, die Größe einer Effektstärke abzuschätzen. Beim p-Wert wird die Frage gestellt: Kann die beobachte OR (RR) zufällig aufgetreten sein? Der p-Wert besagt, wie wahrscheinlich es ist, dass die beobachtete OR (RR) rein zufällig aufgetreten ist, unter der Annahme, dass in Wahrheit die Risiken bei Exponierten und Nichtexponierten identisch sind. Liegt der p-Wert unter 0,05, heißt das: In weniger als 1 von 20 Fällen wird die beobachtete OR/RR aufgetreten sein, obwohl in Wahrheit kein Zusammenhang besteht. Ist der p-Wert <0,01, ist diese Wahrscheinlichkeit noch kleiner, nämlich unter 1/100.
Der statistische Fehler ist die einzige Fehlerquelle in epidemiologischen Studien, die quantitativ abgeschätzt werden kann. Alle übrigen möglichen Fehler, Störfaktoren (Confounder) oder Verzerrungen (Bias) müssen in der Studienplanung bedacht und möglichst ausgeschlossen werden.

Störfaktoren

Störfaktoren (Confounding) sind Charakteristika der untersuchten Population, die sowohl mit den interessierenden Expositionen als auch mit den interessierenden Ergebnisparametern assoziiert sind. Dies soll am Beispiel des Einflusses von Frühgeburtlichkeit auf den Zusammenhang zwischen Bauchlage und erhöhtem Risiko des plötzlichen Kindstods verdeutlicht werden. Würde der Zusammenhang von Schlafen auf dem Bauch und plötzlichem Kindstod in einer Fall-Kontroll-Studie untersucht, bei der 30 % der SIDS-Fälle ehemalige Frühgeborene waren, während nur 5 % der zufällig ausgewählten Kontrollpersonen ehemalige Frühgeborene waren, würde die Bedeutung der Bauchlage als Risikofaktor für den plötzlichen Kindstod überschätzt. Da die Bauchlage für Frühgeborene hinsichtlich der Atmungsphysiologie günstig ist, werden Frühgeborene insbesondere in den ersten Lebenswochen, z. T. aber auch noch danach, bevorzugt in der Bauchlage zum Schlafen gelegt. Somit besteht ein statistischer Zusammenhang zwischen Frühgeburtlichkeit und häufiger Bauchlage. Allerdings erhöht aber auch die Frühgeburtlichkeit an sich, unabhängig von einer etwaigen Bauchlage, das Risiko für den plötzlichen Kindstod. Somit besteht auch ein statistischer Zusammenhang zwischen Bauchlage und plötzlichem Kindstod. Frühgeburtlichkeit wäre somit in dem hier dargestellten Zahlenbeispiel ein Störfaktor bei der Beurteilung des Zusammenhangs von Bauchlage und plötzlichem Kindstod, der dadurch bedingt ist, dass 30 % der betroffenen Fälle, aber nur 5 % der Kontrollpersonen Frühgeburten waren.
Bekannte Störfaktoren können in der Planung oder in der Analyse von Studien neutralisiert werden. Eine Möglichkeit zur Neutralisierung des Störfaktors Frühgeburtlichkeit in der Studienkonzeption in dem oben dargestellten Beispiel wäre z. B. die Möglichkeit, die Studie auf reif geborene Kinder und Kontrollkinder zu begrenzen. Eine andere Möglichkeit ist das Matching: Bei diesem Studiendesign würde eine Paarbildung erfolgen, bei der zu jedem Frühgeborenenfall ein Kontrollfrühgeborenes und zu jedem Fall bei einem reifen Kind ein entsprechend reifes Kontrollkind ausgewählt würde. In diesem Fall müsste aber die Paaranalyse auch in den weiteren statistischen Berechnungen beibehalten werden, was zwar möglich, im Falle der Notwendigkeit der zusätzlichen Adjustierung für andere, noch nicht gepaarte Störfaktoren jedoch rechentechnisch aufwendig ist. Eleganter ist es, die Neutralisierung der Störfaktoren durch Adjustierung in der Analyse vorzunehmen. Durch mathematische Verfahren wie stratifizierte Analyse oder Regressionsanalyse würden betroffene Fälle und Kontrollpersonen einander so ähnlich gemacht, dass die interessierende Exposition – im oben genannten Beispiel die Bauchlage – unabhängig von der Frühgeburtlichkeit untersucht werden kann.

Verzerrung

Während der Effekt von Störfaktoren (Confounder) in der Konzeption und Analyse der Studie potenziell ausgeglichen werden kann, ist die Verzerrung (Bias) nur durch eine sehr sorgfältige Planung der Studie verhinderbar. Bias beschreibt einen Fehler in der Konzeption von Studien, für den weder die Richtung noch das Ausmaß beurteilt werden kann. Ein Bias führt somit dazu, dass die Ergebnisse der betreffenden Studien kaum interpretierbar sind. Das kann durch Fehler in der Auswahl der betroffenen Fälle und Kontrollpersonen (Selektionsbias) oder durch Fehler in der Erfassung der Information über den Expositions- oder Krankheitsstatus (Informationsbias) entstehen.
Ein Selektionsbias bei der Auswahl der Fälle kann z. B. dadurch entstehen, dass selektiv solche Fälle ausgewählt werden, bei denen die Exposition vorlag. Jedoch ist ein Selektionsbias auch bei der Auswahl der Kontrollpersonen möglich, wenn die Auswahl der Personen durch die interessierende Exposition beeinflusst wird. Selektionsbias ist ein charakteristischer Fehler bei Fall-Kontroll-Studien.
Auch der Informationsbias durch Fehlbeurteilung des Expositionsstatus ist ein typischer Fehler in Fall-Kontroll-Studien. Die Beurteilung der Exposition der betroffenen Fälle und Kontrollpersonen stützt sich häufig auf die Erinnerung der Betroffenen bzw. ihrer Eltern; menschliche Erinnerung ist bekanntlich selten objektiv. Dies wäre ein geringeres Problem, wenn Ausmaß und Richtung der Fehlerinnerung bei den betroffenen Fällen und Kontrollpersonen gleich wäre. Der wesentliche Unterschied zwischen beiden Gruppen ist jedoch häufig das Maß der Betroffenheit. Betroffene suchen nach Erklärungen für ihr Betroffensein, in diesem Fall für ihre Krankheit bzw. für die Krankheit ihres Familienangehörigen. Hieraus kann ein Erinnerungsfehler (Recall-Bias) entstehen. Wären in den Studien über den Zusammenhang von perikonzeptioneller Folsäureeinnahme ausschließlich Mütter gesunder Kontrollkinder gefragt worden, wäre ein Recall-Bias bei der Erinnerung an die interessierende Exposition wahrscheinlich gewesen. Deshalb wurden z. B. in der Studie von Mulinaire et al. (1988) als Kontrollpersonen Mütter von Kindern mit anderen Fehlbildungen ausgewählt, bei denen angenommen werden konnte, dass diese sich in gleicher Weise wie die Mütter von Kindern mit Neuralrohrdefekten erinnern würden.
Ein Informationsbias bei der Erfassung des Krankheitsstatus ist ein typischer Fehler von Kohortenstudien. Häufig ist es in den Kohortenstudien bekannt, ob das untersuchte Individuum, dessen Krankheitsstatus zu überprüfen ist, exponiert war oder nicht. Insbesondere bei nicht sehr genau definierten Krankheitsbildern könnte somit die Diagnose der Krankheit bei Exponierten häufiger gestellt werden als bei Nichtexponierten, wodurch eine Verzerrung bei der Beurteilung des Erkrankungsrisikos durch die betreffenden Expositionen entstünden. In Interventionsstudien wird versucht, diesen Fehler zu vermeiden, indem die Studie als randomisierte Doppelblindstudie konzipiert wird, bei der weder der Untersuchte noch der Untersucher über die Art der Exposition informiert ist.

Verwechslung von Ursache und Wirkung („reverse causation“)

Im täglichen Leben ist es meist evident, wer die „Henne“ und wer das „Ei“ ist. Im Bereich von epidemiologischen Studien jedoch, in denen primär nur ein irgendwie bestehender statistischer Zusammenhang zwischen zwei Beobachtungen festgestellt wird, kann dies im Einzelfall nicht immer evident sein. Im Rahmen der Fall-Kontroll-Studien über den Zusammenhang von Bauchlage und plötzlichem Kindstod musste z. B. sehr genau differenziert werden, was verglichen wurde: Die Lage, in der das an plötzlichem Kindstod verstorbene Kind aufgefunden wurde vs. Regelschlaflage des Kontrollkindes oder Regelschlaflage des an plötzlichem Kindstod verstorbenen Kindes und Regelschlaflage des Kontrollkindes. Bei der ersteren Gegenüberstellung wäre eine Verwechslung von „Henne“ und „Ei“ möglich, wenn eine Drehung auf den Bauch eine häufige terminale Reaktion der an plötzlichem Kindstod verstorbenen Kinder wäre.

Kausalität in der Epidemiologie

Während das Kausalitätsverständnis der naturwissenschaftlich orientierten Schulmedizin die Identifikation von Pathomechanismen auf physikalischer, biochemischer oder molekularer Ebene fordert, ist für die Annahme eines Kausalzusammenhangs auf Grundlage epidemiologischer Studien die Kenntnis eines exakten Pathomechanismus nicht notwendig. Lange vor der Identifikation der Choleravibrionen gelang es in London, eine Cholera-Epidemie durch Analyse der inzidenten Fälle zu beenden. Aufgrund von Beobachtungen, wie viele Menschen während dieser Epidemie wann und wo an Cholera erkrankten, konnten Verhaltensempfehlungen gegeben werden, die die Cholera-Epidemie beendeten: Nur die Wasserentnahme aus bestimmten Brunnen war mit dem Auftreten der Cholera assoziiert, während bei Wasserentnahme aus einem anderen Brunnen keine Erkrankungen beobachtet wurden. Dies erlaubte die richtige Empfehlung, choleraträchtige Brunnen zu meiden.
Für ein solches, sich auf reine Empirie stützendes Kausalitätsverständnis sind sehr klar definierte Kriterien erforderlich. Epidemiologische Kausalitätskriterien wurden 1965 von Hill entworfen.
Epidemiologische Kausalitätskriterien (mod. nach Hill 1965)
  • Valide statistische Assoziation?
    • Zufall? Beurteilbar durch statistische Signifikanz.
    • Systematische Fehler (Bias)? Fehlerhafte Konzeption oder Ausführung der Studie?
    • Störfaktoren (Confounding)? Ist der beobachtete Effekt der Exposition durch eine Assoziation der Exposition mit einem anderen (bekannten) Risikofaktor bedingt?
    • Verwechslung von Ursache und Folge ausgeschlossen?
  • Kausalität?
    • Starke Assoziation? Risk Ratio bzw. Odds Ratio >2?
    • Biologische Glaubwürdigkeit?
    • Konsistenz mit anderen Studien? Sind die Ergebnisse der meisten Studien mit der Hypothese vereinbar?
    • Dosis-Wirkungszusammenhang?
    • Nimmt nach der Vermeidung des vermeintlichen Risikos auch die Häufigkeit der Krankheit ab?
Unverzichtbar ist zunächst der Nachweis einer validen statistischen Assoziation. Die bereits dargestellten potenziellen Fehlerquellen epidemiologischer Studien betreffen allein die Frage nach einer validen statistischen Assoziation. Eine valide statistische Assoziation wird ausgeschlossen durch erkennbare Bias oder Störfaktoren, die in der Analyse nicht berücksichtigt wurden. „Statistische Signifikanz“ besagt nur, wie wahrscheinlich die zufällige Beobachtung der gefundenen Assoziation wäre. Üblicherweise wird eine statistische Signifikanz angenommen, wenn der p-Wert 0,05 unterschreitet. Ein p-Wert von <0,05 heißt, dass die Wahrscheinlichkeit eines statistischen Fehlers geringer ist als 1:20.
Ist die Wahrscheinlichkeit eines statistischen Fehlers hinreichend klein und scheinen Fehler durch Störfaktoren, Bias oder „reverse causation“ nach Ermessen des Untersuchers und der Fachwelt hinreichend unwahrscheinlich, kann davon ausgegangen werden, dass die Studie in sich schlüssig, d. h. intern valide ist.
Die Validität einer Assoziation sagt primär nur etwas über Zusammenhänge aus, nicht jedoch über Kausalzusammenhänge. Als ein Kriterium für Kausalität wird üblicherweise eine starke Assoziation gefordert, wobei die Festlegung, welche Assoziation als stark erachtet wird, willkürlich ist. Eine Verdoppelung des Risikos oder eine Halbierung des Risikos wird meist als starke Assoziation bewertet (OR oder RR =2 bzw. OR oder RR =0,5). Unzweifelhaft können jedoch auch schwächere statistische Assoziationen kausal sein. Die Begründung für das Kausalitätsmerkmal „starker Risikofaktor“ ist pragmatisch. Die Adjustierung in der Analyse der Studie ist der klassische Weg, um Fehler durch Störfaktoren auszugleichen. Eine Adjustierung ist jedoch nur für bekannte Störfaktoren möglich, zu denen auch Daten gesammelt wurden. Gleichzeitig ist es aber vorstellbar, dass andere, unbekannte Risikofaktoren für einen Teil des vermuteten Kausalzusammenhangs verantwortlich sind. Wenn diese Risikofaktoren gleichermaßen eng mit dem postulierten „Kausalfaktor“ und dem Outcome des Kausalfaktors assoziiert sind, könnten sie für den Effekt des vermuteten Kausalfaktors verantwortlich sein. Dies wird aber einer starken Assoziation des putativen Kausalfaktors als unwahrscheinlich angesehen.
Auch Dosiseffekte können, wenn tatsächlich immer „viel macht viel“ gilt, Hinweis auf Kausalität geben. Konsistente Ergebnisse können zwar auch konsistent falsch sein, grundsätzlich spricht aber die Tatsache, dass unterschiedliche Untersucher in unterschiedlichen Populationen die gleichen Zusammenhänge finden, eher für deren Richtigkeit.
Widersprechen die Ergebnisse einer epidemiologischen Kausalkette dem biologischen Verständnis, spricht dies gegen die Annahme einer Kausalität. Hierbei ist jedoch zu berücksichtigen, dass auch das biologische Verständnis zeitlichen Wandlungen unterliegt und mitunter eher eine Kette von Irrtümern als die reine Wahrheit reflektiert. Allerdings kann im Einzelfall der vermutete Zusammenhang so absurd sein, dass die Annahme eines Kausalzusammenhangs kaum gerechtfertigt erscheint. Ein Beispiel hierzu veröffentlichten Davey-Smith et al. (1992). Hierbei wurde nach allen Regeln epidemiologischer Kunst ein valider statistischer Zusammenhang zwischen Rauchen und Selbstmordgefährdung demonstriert. Die Autoren dieser Studie verweisen auf den gesunden Menschenverstand, der eine derartige kausale Verknüpfung wenig plausibel erscheinen lässt. Umgekehrt kann eine „plausible biologische Erklärung“ die Annahme von Kausalität stützen. Allerdings sind auch plausible biologische Erklärungen nicht in Stein gemeißelt. Manche plausible biologische Erklärung erwies sich als falsch. Bis zur Entdeckung des Helicobacter pylori galt das Magenulkus als psychosomatische Erkrankung.
Der kritische Leser wird beim Lesen dieses Abschnitts, den Eindruck gewinnen, dass „nur“ epidemiologische Kausalität auf wackeligen Beinen steht. In der Tat erwiesen sich viele postulierte Risikofaktoren als falsch. Weitgehend sichere empirische Evidenz kann nur mit randomisierten kontrollierten Studien generiert werden.
Ist nun aber ein RCT nicht möglich – wie z. B. bezüglich der Regelschlaflage und SIDS – kann der Nachweis, dass die Vermeidung des vermeintlichen Risikos auch zu einer Abnahme der Häufigkeit der Krankheiten führt, einen wichtigen Hinweis auf die Richtigkeit eines epidemiologischen Kausalzusammenhang erbringen.
Die Annahme, dass die Präferenz der Bauchlage als bevorzugte Schlafposition junger Säuglinge das Risiko für den plötzlichen Kindstod erhöhen könnte, erschien noch vor einigen Jahren sehr spekulativ. In den 1960er-Jahren war die Bauchlage für die kindliche Entwicklung als besonders vorteilhaft empfohlen worden. Seit dieser Zeit hatten viele tausend Kinder tausende von Nächten auf dem Bauch geschlafen und davon offenbar keinen Schaden genommen.
Ausgehend von Einzelbeobachtungen, dass Kinder, die an SIDS verstorben waren, häufig auf dem Bauch liegend aufgefunden wurden, wurde die Hypothese generiert, dass die Bauchlage SIDS begünstigen könnte. In verschiedenen Studien wurde gezeigt, dass diese Kinder auch sehr viel häufiger als Kontrollkinder zum Schlafen auf den Bauch gelegt wurden. Diese Assoziation wurde in verschiedenen, ganz unterschiedlich konzipierten Studien bestätigt. Diese Studien waren so angelegt, dass Fehler durch Confounding oder Bias unwahrscheinlich erschienen. Die Ergebnisse waren konsistent und zeigten fast immer ein signifikantes und mit OR von deutlich über 2 erhebliches SIDS-Risiko für die Bauchlage. Auch gab es zahlreiche biologische Hypothesen, warum die Bauchlage das SIDS-Risiko erhöhen könnte.
Ein weiterer wichtiger Mosaikstein in der Kausalkette war der überzeugende Nachweis, dass in den Niederlanden nach Empfehlungen, die Bauchlage als Regelschlaflage des gesunden Säuglings zu vermeiden, die Zahl der Kinder, die regelmäßig in Bauchlage zum Schlafen gelegt wurden, deutlich zurückging und parallel dazu auch die Rate des plötzlichen Kindstods deutlich abnahm. Somit erschien die Annahme eines Kausalzusammenhangs von Bauchlage und erhöhtem SIDS-Risiko gut begründet. Deshalb wurden auch in Deutschland Empfehlungen gegeben, die Bauchlage als Regelschlaflage des jungen Säuglings zu vermeiden.
Auch Beobachtungen aus Deutschland und Norwegen unterstreichen die Richtigkeit dieser Empfehlung: Nach Herausgabe der Empfehlungen nahm nicht nur die Zahl der SIDS-Fallrate von 1283 (1990) auf 372 (2003) ab, sondern auch die postneonatale Säuglingssterblichkeit von 5102 (1995) auf 3618 (2003) Fälle deutlich ab. Deshalb konnte ausgeschlossen werden, dass veränderte diagnostische Gewohnheiten beim Ausfüllen des Totenscheins für die Veränderungen verantwortlich waren.
Der Einwand, dass nach der Herausgabe der Empfehlungen nicht nur die Prävalenz der Bauchlage, sondern auch die Prävalenz anderer Risikofaktoren drastisch reduziert worden sei, sodass letztlich dies und nicht die Abnahme der Bauchlagenprävalenz verantwortlich für die Abnahme der Rate des plötzlichen Kindstods sei, ist kaum zu belegen: Weder die Stillfrequenz noch die mütterlichen Rauchgewohnheiten – gestillte Kinder haben ein niedrigeres, Kinder von rauchenden Müttern ein erhöhtes SIDS-Risiko – hatten sich in dem Zeitraum verändert, während die Prävalenz der Bauchlage deutlich abgenommen hatte. Seit 1992 empfiehlt auch die American Academy for Pediatrics, junge Säuglinge zum Schlafen nicht auf den Bauch zu legen.
Dieses Beispiel belegt eindrücklich, wie basierend auf epidemiologischen Studien richtige Präventionsempfehlungen auch dann gegeben werden können, wenn die Ursache der Erkrankung unbekannt ist: Bis heute hat niemand die Pathomechanismen des plötzlichen Kindstods verstanden. Häufig werden aber aufgrund fehlerhafter Beobachtungsstudien Zusammenhänge postuliert, die sich als falsch erweisen. So war der postulierte Zusammenhang von intramuskulärer Vitamin-K-Prophylaxe und Leukämie im Kindesalter wahrscheinlich ein Artefakt, das nicht ohne Folge blieb: Aufgrund des Verdachts wurden in einigen Ländern die Empfehlungen für die sehr effektive intramuskuläre Vitamin-K-Prophylaxe verlassen – mit der Folge von Todesfällen und schwerer Behinderung durch späte Vitamin-K-Mangel-Blutungen.
Deshalb muss jeder Kinderarzt, der Präventionsempfehlungen gibt wissen, auf welcher Grundlage diese ausgesprochen wurden. Häufig liegen epidemiologische Studien zugrunde – richtige oder falsche.
Weiterführende Literatur
American Academy of Pediatrics AAP task force on infant positioning and SIDS: positioning and SIDS (1992). Pediatrics 89(6 Pt 1):1120–1126
Andermann A, Blancquaert I, Beauchamp S, Dery V (2008) Revisiting Wilson and Jungner in the genomic age: a review of screening criteria over the past 40 years. Bull World Health Organ 86(4):317–319CrossRef
Ebrahimi-Fakhari D, Zemlin M, Sauer H, Poryo M, Graf N, Meyer S (2018) 25 Years of ESPED as a surveillance tool for rare diseases in children in Germany: a critical analysis. Klin Padiatr 230:215–224CrossRef
Golding J, Greenwood R, Birmingham K, Mott M (1992) Childhood cancer, intramuscular vitamin K, and pethidine given during labour. BMJ 305(6849):341–346CrossRef
Hill AB (1965) The environment and disease: association or causation? Proc R Soc Med 58:295–300PubMedPubMedCentral
Kries R von (1998) Neonatal vitamin K prophylaxis: the Gordian knot still awaits untying. BMJ 316(7126):161–162CrossRef
Kries R von, Ihme N, Oberle D, Lorani A, Stark R, Altenhofen L, et al. (2003) Effect of ultrasound screening on the rate of first operative procedures for developmental hip dysplasia in Germany. Lancet 362(9399):1883–1887
Kries R von, Toschke AM, Strassburger K, Kundi M, Kalies H, Nennstiel U, et al. (2005) Sudden and unexpected deaths after the administration of hexavalent vaccines (diphtheria, tetanus, pertussis, poliomyelitis, hepatitis B, Haemophilius influenzae type b): is there a signal? Eur J Pediatr 164(2):61–69
Kries R von, Ihme N, Altenhofen L, Niethard FU, Krauspe R, Ruckinger S ( 2012) General ultrasound screening reduces the rate of first operative procedures for developmental dysplasia of the hip: a case-control study. J Pediatr 160(2):271–275
Kurth BM, Kamtsiuris P, Holling H, Schlaud M, Dolle R, Ellert U et al (2008) The challenge of comprehensively mapping children’s health in a nation-wide health survey: design of the German KiGGS-Study. BMC Public Health 8:196CrossRef
Milunsky A, Jick H, Jick SS, Bruell CL, MacLaughlin DS, Rothman KJ et al (1989) Multivitamin/folic acid supplementation in early pregnancy reduces the prevalence of neural tube defects. JAMA 262(20):2847–2852CrossRef
Moss A, Klenk J, Simon K, Thaiss H, Reinehr T, Wabitsch M (2012) Declining prevalence rates for overweight and obesity in German children starting school. Eur J Pediatr 171(2):289–299CrossRef
Mulinare J, Cordero JF, Erickson JD, Berry RJ (1988) Periconceptional use of multivitamins and the occurrence of neural tube defects. JAMA 260(21):3141–3145CrossRef
Sulheim S, Holme I, Ekeland A, Bahr R (2006) Helmet use and risk of head injuries in alpine skiers and snowboarders. JAMA 295(8):919–924CrossRef
Thompson DC, Rivara FP, Thompson RS (1996) Effectiveness of bicycle safety helmets in preventing head injuries. A case-control study. JAMA 276(24):1968–1973CrossRef
Toschke AM, Ludde R, Eisele R, von Kries R (2005) The obesity epidemic in young men is not confined to low social classes--a time series of 18-year-old German men at medical examination for military service with different educational attainment. Int J Obes 29(7):875–877CrossRef
Von Ehrenstein OS, Von Mutius E, Illi S, Baumann L, Bohm O, von Kries R (2000) Reduced risk of hay fever and asthma among children of farmers. Clin Exp Allergy: J Br Soc Allergy Clin Immunol 30(2):187–193CrossRef