Definition
Die Basis evidenzbasierter Diagnostik in der Medizin soll durch sogenannte Health Technology Assessment (HTA)-Berichte gesichert werden (siehe auch „Gesundheitspolitik“). Für die Diagnostik der Schlafapnoe wurden ein
HTA-Bericht in Deutschland und ein weiterer in den USA erarbeitet. Die Ergebnisse der HTA-Berichte gingen auch in die Leitlinie
Nicht erholsamer Schlaf ein. Das diagnostische Vorgehen in der Schlafmedizin ist im klinischen „Algorithmus Nicht erholsamer Schlaf“ der Leitlinie dargestellt. Ein wesentlicher Teil des Algorithmus beschreibt nichtapparative Vorgehensweisen basierend auf einer spezifischen schlafmedizinischen Anamnese („Beschwerden und Symptome“; „Differentialdiagnostischer Leitfaden“). Erst am Ende des Algorithmus steht die apparative Vorgehensweise in Gestalt der „Messung im Schlaflabor“ mittels „Kardiorespiratorische Polysomnographie“ (KRPSG) beziehungsweise von Taguntersuchungen wie dem Multiplen Schlaflatenztest
Multipler Schlaflatenztest und Multipler Wachbleibetest, durchgeführt von Personen mit einer schlafmedizinischen Ausbildung („Qualitätsmanagement in der Schlafmedizin“ „Qualitätsmanagement in der Diagnostik“). Mittels
Kardiorespiratorischer Polysomnographie lassen sich alle
schlafmedizinischen Erkrankungen diagnostizieren bzw. ausschließen.
Zur Bestimmung der Evidenz von diagnostischen Methoden werden im optimalen Fall beim Erstellen von HTA-Berichten systematische Übersichten und
Metaanalysen herangezogen. Liegen solche nicht vor, sollen ausreichend große, methodisch hochwertige, randomisierte kontrollierte Studien herangezogen werden.
Eine systematische Übersicht und
Metaanalyse liegt bisher allein zur Diagnostik der Schlafapnoe vor, die auch die Basis des amerikanischen HTA-Berichts ist (Ross et al.
2000). Diese Metaanalyse kommt zu dem Schluss, dass Messmethodik und Auswertemethodik der zugrunde liegenden Studien so unterschiedlich sind, dass keine Evidenz für eine spezifische beste Diagnostik mit den reduzierten Verfahren außerhalb der KRPSG vorliegt. Die reduzierten Verfahren versuchen, mit einem oder wenigen ausgewählten Parametern einer Polygraphie eine Diagnostik bei
Schlafbezogenen Atmungsstörungen durchzuführen (siehe auch „Ambulantes Monitoring“ und „Indikationsbezogenes ambulantes Monitoring“). Angesichts der ansonsten negativen Ergebnisse bleibt es weiterhin notwendig, zur Diagnostik der Obstruktiven Schlafapnoe eine
Kardiorespiratorische Polysomnographie als Ganznachtableitung unter Überwachung durch ausgebildetes Personal durchzuführen. Für die Bewertung von reduzierten diagnostischen Verfahren sind dagegen weitere Studien erforderlich. Auch für andere schlafmedizinische Diagnosen gibt es noch keine systematischen Übersichten und Metaanalysen der höchsten Evidenzgrade zur Diagnostik (siehe auch „Evidenzbasierung und Leitliniengestaltung“; „Diagnostik der Schlafbezogenen Atmungsstörungen“).
Grundlagen
Das diagnostische Vorgehen in der Schlafmedizin beginnt mit einer systematischen Erfragung der Beschwerden. Es folgt eine spezifische schlafmedizinische Anamnese und die Erhebung von Befunden aus einer allgemeinen klinischen Untersuchung. Wenn sich die Beschwerden auf diese Weise nicht klären lassen, aber dennoch eine erhebliche Beeinträchtigung infolge nicht erholsamen Schlafs von Seiten der Betroffenen geklagt wird, folgt eine apparative Untersuchung im Schlaflabor. Erst zu diesem Zeitpunkt ist im diagnostischen Vorgehen eine Untersuchung mit der
Kardiorespiratorischen Polysomnographie erforderlich. Dieses Vorgehen ist in einer evidenzbasierten Leitlinie der Stufe 3 festgehalten (Mayer et al.
2009). Derzeit wird diese Leitlinie auf der Basis der aktuellen Literatur überarbeitet. Stufe 3 bedeutet, dass sich alle Entscheidungen eines klinischen Algorithmus auf evidenzgesicherte Studien stützen können. Es müssen dazu ausreichend viele kontrollierte Studien zu diagnostischen Entscheidungen vorliegen, die mittels
Metaanalysen systematisch bewertet worden sind. Denn systematische Übersichtsarbeiten auf der Basis methodisch hochwertiger randomisierter kontrollierter Studien haben die höchste Evidenz (Berner et al.
2001).
Die höchste Evidenz liegt in dem verhältnismäßig jungen Fach Schlafmedizin nur für wenige diagnostische Verfahren vor, in den letzten Jahren sind aber viele hochwertige Therapiestudien publiziert worden. Für das diagnostische Vorgehen bei Schlafapnoe wurde eine systematische Übersicht und
Metaanalyse der zwischen 1980 und 1997 publizierten Studien durchgeführt (Ross et al.
2000). Sensitivität und Spezifität sind Beispiele für geeignete Maße zur Beschreibung der
Validität eines Diagnosetests und damit zur Quantifizierung der Güte eines Diagnosetests aus einer nosologischen Fragestellung heraus.
Sensitivität bezeichnet den Anteil der Kranken, die ein positives Testergebnis haben.
Spezifität bezeichnet den Anteil der Gesunden, die einen negativen Testbefund aufweisen. Die beiden Werte geben jedoch keine Auskunft über das Vorliegen einer Erkrankung bei Patientengruppen, bei denen bereits positive Hinweise für deren Vorhandensein vorliegen. Um diese Auskunft zu erhalten, muss der prädiktive Wert, also die Wahrscheinlichkeit für das Vorliegen der Erkrankung bei dem positiven Hinweis, bestimmt werden. Häufig werden diagnostische Validierungsstudien nicht in der allgemeinen Bevölkerung an repräsentativen
Stichproben durchgeführt, sondern in solchen Patientengruppen, die bereits Hinweise auf das Vorliegen der Erkrankung haben und die damit eine hohe
Vortestwahrscheinlichkeit aufweisen. Die
Reproduzierbarkeit der Untersuchungen ist ebenfalls ein wichtiges Kriterium.
Wird bei zwei diagnostischen Methoden die eine im Vergleich mit dem Referenzstandard untersucht, so wird meist der
Korrelationskoeffizient r berechnet. Der
Korrelationskoeffizient kann jedoch zu einem falschen Eindruck der Güte eines Tests führen, wenn die untersuchte Größe über einen weiten Bereich variiert. Man spricht dann von einer
Scheinkorrelation. Um die Abweichungen besser zu beurteilen, wird zusätzlich ein Methodenvergleich nach Bland und Altman vorgenommen, bei dem die Differenzen der Verfahren über deren Mittelwert aufgetragen werden. Als quantitativer Wert sollte die Gesamtrichtigkeit bezogen auf ein Testkriterium zusätzlich angegeben werden. Die alleinige Angabe eines Korrelationskoeffizienten ist obsolet. Das gilt insbesondere auch für inhomogene
Stichproben, wenn beispielsweise Patienten mit sehr niedrigem Apnoeindex einerseits und Patienten mit sehr hohem Apnoeindex andererseits in einer Validierungsstudie mit zwei unterschiedlichen diagnostischen Verfahren untersucht werden. Dann ist von vornherein ein hoher Korrelationskoeffizient bei dem insgesamt inhomogenen Kollektiv zu erwarten, obwohl weder bei dem Teil der Patienten mit niedrigem Apnoeindex allein, noch bei dem Teil der Patienten mit hohem Apnoeindex allein eine hohe Korrelation für die Messergebnisse aus beiden Methoden besteht.
Für die Bewertung der Qualität diagnostischer Verfahren stehen spezifische Bewertungsfaktoren (Tab.
1) zur Verfügung, die zur anschließenden systematischen Ermittlung von Evidenzebenen herangezogen werden. Die Faktoren und Ebenen können gut für vorgelegte Studien bestimmt werden.
Tab. 1
Bewertungsfaktoren, die für zu analysierende methodische Studien bestimmt werden müssen, um daraus die Evidenzebenen der diagnostischen Verfahren zu bestimmen. Die Kriterien sind für die Bewertung einer konventionellen
Kardiorespiratorischen Polysomnographie ebenso herzustellen wie für die computergestützten Verfahren
1 | Studie beinhaltet gesunde Kontrollpersonen und eine klinisch relevante Patientengruppe. |
2 | Es wurden weniger als 5 % der Messungen aufgrund mangelnder Qualität ausgeschlossen. |
3 | Die untersuchte Gruppe und Diagnose richtet sich nach ICSD beziehungsweise nach DSM IV. |
4 | Schlafaufzeichnungen, sofern durchgeführt, richten sich nach den Empfehlungen für eine KRPSG und eine Polysomnographie (PSG). |
5 | Die Schlafauswertungen erfolgten unabhängig und verblindet. |
6 | Die visuellen Auswertungen wurden von mehreren Personen durchgeführt, um eine Inter-Scorer-Variabilität festzulegen. |
7 | Die Gesamtdauern der Aufzeichnungen werden ausgewertet. |
8 | Die Methodenbeschreibung erlaubt eine Wiederholungsmessung. |
Ziel ist die Bestimmung der sogenannten
efficacy, unter der die experimentelle Wirkung in Studien verstanden wird, und zusätzlich die Bestimmung der sogenannten
effectiveness. Darunter wird die Wirksamkeit einer diagnostischen Methode im Alltag verstanden. Dahinein geht auch die Wirtschaftlichkeit einer diagnostischen Maßnahme mit ein (Chervin et al.
2005). Gültige Richtlinien zur Bestimmung von efficacy und effectiveness liegen für die diagnostischen Verfahren bisher noch nicht vor.
Systematische Übersichten zum apparativen diagnostischen Vorgehen werden im Rahmen des Health Technology Assessment (HTA) ausgeführt. Eine solche HTA-Übersicht liegt für Deutschland zur Schlafapnoe vor (Perleth et al.
2003). Diese Übersicht beinhaltet eigene Analysen und die Analyse der amerikanischen HTA-Agentur unter dem Namen Agency for Healthcare Research and Quality (AHRQ). Die Analyse der AHRQ ist im Wesentlichen deckungsgleich mit der publizierten
Metaanalyse von Ross et al. (
2000). Dabei handelt es sich um den amerikanischen HTA-Bericht zur Diagnostik der Obstruktiven Schlafapnoe. Danach werden die folgenden apparativen Vorgehensweisen für die Diagnostik der Schlafapnoe identifiziert und – mit der
Kardiorespiratorischen Polysomnographie im Schlaflabor durchgeführt – von schlafmedizinisch ausgebildetem Personal verglichen:
-
-
-
Teilzeitpolysomnographie
-
Modelle der Vorhersagbarkeit (Wahrscheinlichkeitsmodelle)
-
Volumen-Fluss-Kurven der Lungenfunktion
-
Klinischer Eindruck
-
Polysomnographie mit einer reduzierten Anzahl von Kanälen
-
Fragebögen
-
Modelle zur Herzschlagvariabilität
In der Übersicht (Ross et al.
2000) wurden insgesamt 937 diagnostische Studien zur Schlafapnoe identifiziert. Von diesen erfüllten 249 Studien die Einschlusskriterien bezogen auf das Untersuchen des diagnostischen Vorgehens bei Schlafapnoe und die minimale Studiengröße. Von diesen wiederum erfüllten 71 die Anforderung, ausreichende Informationen über die diagnostische Methodik so darzustellen, dass eine statistische Aufarbeitung für eine
Metaanalyse möglich wurde. Dazu gehörte die Durchführung einer KRPSG über eine ganze Nacht und Angaben zur Sensitivität, Spezifität und/oder
Korrelationskoeffizienten. In der Summe konnten aus den 71 komplett aufgearbeiteten Studien die Ergebnisse von 7572 Untersuchungen an Patienten berücksichtigt werden.
Fast alle Studien beziehen sich auf ausgewählte Patienten in einem Schlaflabor und haben daher eine hohe Vortestwahrscheinlichkeit. Fast alle Studien untersuchen fast ausschließlich die diagnostische Genauigkeit auf der Grundlage von Sensitivität und Spezifität. Die Fragen nach der diagnostischen Aussage und nach dem Einfluss auf die therapeutischen Endpunkte wurden allerdings bedauerlicherweise außer Acht gelassen. Die Studien mit tragbaren Geräten wurden fast alle parallel zum Referenzstandard der
Kardiorespiratorischen Polysomnographie mit Überwachung durch ausgebildetes Personal durchgeführt. Dadurch wird zwar die bestmögliche Leistungsfähigkeit ermittelt, nicht jedoch die diagnostische Aussagekräftigkeit für Patienten in Praxen von niedergelassenen Ärzten mit einer anderen, wahrscheinlich niedrigeren Vortestwahrscheinlichkeit, sodass die Werte voneinander abweichen. Ein paralleles Untersuchungsdesign ist aber immer dann gut, wenn es um die Möglichkeit der Reduktion der Anzahl der Kanäle geht.
Die Ergebnisse der
Metaanalyse zeigen, dass ein klinischer Eindruck nicht ausreicht, um eine Diagnose zu stellen, wenngleich erfahrene Schlafmediziner eine recht hohe diagnostische Genauigkeit erzielen. Die Studien mit tragbaren Systemen weisen darauf hin, dass damit tatsächlich eine gute Patientenauswahl im Sinne der Erhöhung der Vortestwahrscheinlichkeit für ein positives Ergebnis in der
Kardiorespiratorischen Polysomnographie (KRPSG) vorgenommen werden kann. Die Studien zur
Pulsoxymetrie belegen, dass sie an diese Genauigkeit nicht heranreichen. Die Studien zu den übrigen apparativen Verfahren zeigen aufgrund der methodischen Einschränkungen oder der sich ergebenden Genauigkeit, dass sie nur bedingt zu einer Diagnostik zu gebrauchen sind. Insgesamt gesehen sind die untersuchten Studien sehr unterschiedlich und schwer vergleichbar. In der Summe aller Studien zeigt sich daher deutlich, dass die evidenzbasierte Methode für die
Diagnostik der Schlafbezogenen Atmungsstörungen die Kardiorespiratorische
Polysomnographie mit ausgebildetem Überwachungspersonal ist. Keines der untersuchten reduzierten Verfahren der Polygraphie und auch keine der weiteren alternativen diagnostischen Vorgehensweisen konnten eine Evidenz für eine gute Diagnostik erlangen. Daher bleibt als Schlussfolgerung der Metastudie die Notwendigkeit, alternative diagnostische Methoden in prospektiven Multicenter-Studien mit repräsentativen Patienten und patientenrelevanten Endpunkten zu untersuchen und bis zum Erreichen entsprechend aussagefähiger Studienergebnisse für alternative Verfahren die
Schlafbezogenen Atmungsstörungen weiterhin mittels KRPSG zu diagnostizieren. In den entsprechenden Studien sollte dann nicht nur die diagnostische Genauigkeit, sondern auch der Einfluss auf die diagnostische Kaskade und auf die Konsequenzen für die Auswahl und den Erfolg der Therapie mit einbezogen werden.
Der deutsche HTA-Bericht zur Schlafapnoe (Perleth et al.
2003) kommt bezogen auf die Diagnostik zu den gleichen Schlussfolgerungen, da er sich auf die Ergebnisse des amerikanischen Berichts bezieht. Er befasst sich darüber hinaus auch mit der Therapie der Schlafapnoe und der Kosteneffektivität des diagnostisch-therapeutischen Vorgehens. Er stellt fest, dass 70 % der Kosten im Bereich der Hilfsmittel anfallen und sieht daher eine dringende Notwendigkeit für weitere gesundheitsökonomische Untersuchungen. Der deutsche Bericht betont zusätzlich die Bedeutung der „Qualitätssicherung“ im diagnostischen und therapeutischen Vorgehen. Siehe auch „Gesundheitspolitik“ und „Pharmakoökonomie“.