Skip to main content
Open AccessOriginalarbeit

Der Epidemiologische Suchtsurvey 2015

Studiendesign und Methodik

Published Online:https://doi.org/10.1024/0939-5911/a000444

Abstract

Zusammenfassung.Ziel: Der vorliegende Beitrag beschreibt die Methodik und das Studiendesign des Epidemiologischen Suchtsurveys (ESA) 2015. Methodik: Zielpersonen des ESA waren deutschsprachige und in Privathaushalten lebende Personen im Alter zwischen 18 und 64 Jahren. Die Ziehung der Personenstichprobe erfolgte auf Basis der Einwohnermelderegister disproportional zur Verteilung der Geburtsjahrgänge in einem zweistufigen Zufallsverfahren. Die Befragungen wurden schriftlich, telefonisch und online durchgeführt. Ergebnisse: Insgesamt konnte im ESA 2015 mit n = 9204 Teilnehmern eine Nettoausschöpfung von 52.2 % erreicht werden. Durch die verwendete Gewichtung konnte die Stichprobe hinsichtlich Bundesland, BIK-Gemeindegrößenklasse, Geschlecht, Jahrgangsgruppe und Schulbildung an die Verteilung in der Grundgesamtheit angepasst werden. Mit der Studie nicht erreichte Personen zeigten problematischere Konsummuster als Teilnehmer der Befragung. Schriftlich befragte Personen gaben häufiger Substanzkonsum an als telefonisch und online Befragte. Schlussfolgerungen: Durch den Einsatz verschiedener Befragungsmethoden und die Gewichtung der Daten konnte sichergestellt werden, dass mit dem ESA 2015 bevölkerungsrepräsentative Daten zum (klinisch relevanten) Konsum von legalen und illegalen Substanzen sowie Medikamenten vorliegen.

The 2015 Epidemiological Survey of Substance Abuse: Study Design and Methodology

Abstract.Aims: The paper gives an overview on methods and study design of the 2015 Epidemiological Survey of Substance Abuse (ESA). Methods: The sampling frame of the ESA included German-speaking individuals living in private households aged 18 to 64 years. A sample was drawn from population registers using a two-stage probability design oversampling younger birth cohorts. The survey was realized using paper-and-pencil questionnaires, telephone interviews, and online questionnaires. Results: A total of 9204 individuals participated in the survey, resulting in a response rate of 52.2 %. Using redressement weights, the sample could be adjusted to the distribution of the general population according to federal state, size of the community, sex, year of birth, and school education. Survey nonrespondents showed more problematic consumption patterns than respondents. Individuals in the paper-and-pencil mode reported higher rates of substance use compared to those in the telephone and online mode. Conclusions: By using different modes of administration and weighting procedures, representativeness of the 2015 ESA data on (clinically relevant) consumption of legal and illegal substances and pharmaceuticals is ensured.

Einführung

Der Epidemiologische Suchtsurvey (ESA) ist eine bevölkerungsrepräsentative Studie zur Erfassung des Konsums psychoaktiver Substanzen, der Indikatoren klinisch relevanter Konsummuster sowie deren Risikofaktoren in der deutschen Allgemeinbevölkerung ( www.esa-survey.de). Der Survey wird seit über 30 Jahren regelmäßig durchgeführt. Die gewonnenen Informationen dienen u. a. der Berichterstattung zur Lage in Deutschland im Rahmen europäischer und internationaler Verpflichtungen (Pfeiffer-Gerschel et al., 2015), der Planung und Verbesserung der Prävention und gesundheitlichen Versorgung (Gomes de Matos, Kraus, Pabst & Piontek, 2013; Kraus, Piontek, Pfeiffer-Gerschel & Rehm, 2013) oder der Beurteilung der Auswirkungen von gesetzlichen und anderen regulatorischen Interventionen auf das Konsumverhalten sowie dessen Folgen (Ludwig, Kraus, Müller, Braun & Bühringer, 2012; Müller, Kraus, Piontek & Pabst, 2010). Die mit dem Survey verbundenen Arbeiten beinhalten die Planung des Fragebogens, die Auswertung und Berichterstattung der Ergebnisse sowie Maßnahmen zur Sicherung der wissenschaftlichen Qualität der Studie.

Der vorliegende Beitrag beschreibt die Methodik und das Studiendesign des Epidemiologischen Suchtsurveys (ESA) 2015 mit dem Ziel, das Verständnis der darauffolgenden Ergebnispublikationen (Gomes de Matos, Atzendorf, Kraus & Piontek, 2016; Kraus, Piontek, Atzendorf & Gomes de Matos, 2016) zu verbessern und deren Interpretation zu erleichtern. Zunächst erfolgt eine ausführliche Beschreibung des Designs und der Stichprobenziehung, der Durchführung der Feldarbeiten, der Erhebungsinstrumente sowie des Vorgehens beim Datenmanagement und der Auswertung. Schließlich werden Analysen zur realisierten Stichprobe, der Ausschöpfung, der Gewichtung und Repräsentativität sowie zu Non-response- und Modus-Analysen dargestellt.

Methodik

Design und Stichprobenziehung

Zielpersonen des ESA 2015 waren deutschsprachige und in Privathaushalten lebende Personen im Alter zwischen 18 und 64 Jahren (Geburtsjahrgänge 1951 bis 1997). Die Grundgesamtheit beträgt somit etwa 51.00 Mio. Personen (Statistisches Bundesamt, Stichtag 31. 12. 2014).

Die Stichprobenziehung war zweistufig angelegt. In der ersten Stufe wurden Gemeinden bzw. Sample Points ausgewählt. Dies erfolgte zufallsgesteuert innerhalb von Schichtungszellen, die sich aus der Kombination von Kreisen mit zehn BIK-Gemeindegrößenklassen ergaben. Die Verteilung von Regierungsbezirken und Bundesländern wurde dabei kontrolliert. Datenbasis bildeten die gemeindestatistischen Daten des Statistischen Bundesamts und der Statistischen Landesämter. Innerhalb der Schichtungszellen wurden die Gemeinden zufällig mit einer der Zahl der Zielpersonen entsprechenden Auswahlwahrscheinlichkeit gezogen. Großstädte gelangten aufgrund der bevölkerungsproportionalen Auswahl teilweise mehrfach in die Stichprobe und waren mit mehreren Sample Points vertreten. Insgesamt wurden auf diese Weise 254 Sample Points aus 226 Gemeinden gezogen.

In der zweiten Stufe erfolgte die Ziehung der Zielpersonen in den Sample Points aus den Einwohnermelderegistern über eine systematische Zufallsauswahl (Intervallziehung). Dabei wurden, jeweils ausgehend von einer zufälligen Startadresse, über eine feste Schrittweite Personenadressen ausgewählt. Unter der Annahme einer Ausschöpfung von 50 Prozent sowie eines Anteils neutraler Ausfälle von 20 Prozent mussten pro Sample-Point 80 Adressen eingesetzt werden, um die angestrebte minimale Stichprobengröße von n = 8000 Fällen zu erreichen. Die Verteilung von Geburtsjahrgangsgruppen in der Stichprobe wurde disproportional zur Verteilung in der Grundgesamtheit gewählt, d. h. aus den Personenadressen erfolgte eine nach Jahrgangsgruppe geschichtete zufallsgesteuerte Auswahl, sodass jüngere Geburtsjahrgänge disproportional häufig und ältere Geburtsjahrgänge disproportional selten gezogen wurden. Da es in einigen Gemeinden zu geringfügen Ausfällen kam (z. B. weil nicht in allen Jahrgangsgruppen ausreichend Fälle vorhanden waren), betrug die Einsatzstichprobe letztlich n = 19 867 Fälle.

Durchführung der Feldarbeiten

Die Feldarbeiten im Rahmen des ESA 2015 wurden zwischen März und Juli 2015 von infas Institut für angewandte Sozialwissenschaften GmbH durchgeführt. Für die Realisierung der Befragungen wurde ein Methodenmix eingesetzt, d. h. die Daten wurden schriftlich, telefonisch und im Internet erhoben. Die gezogene Stichprobe wurde zunächst in zwei Studienarme aufgeteilt, je nachdem ob für die jeweilige Adresse eine Telefonnummer recherchiert werden konnte oder nicht.

Alle Zielpersonen erhielten eine schriftliche Studieninformation mit Anschreiben, Datenschutzerklärung und Begleitschreiben des Bundesministeriums für Gesundheit (BMG). Zudem wurde ihnen die Möglichkeit angeboten, den Fragebogen online auszufüllen. Hierfür wurde der Link zur Online-Befragung sowie ein individueller Zugangscode angegeben.

Probanden des telefonischen Studienarms wurde in dem Anschreiben die telefonische Kontaktaufnahme angekündigt. Die Durchführung des Interviews erfolgte durch speziell für die Studie geschulte Telefoninterviewer. Konnten Zielpersonen nicht telefonisch erreicht werden oder war die Telefonnummer ungültig, erfolgte der Versand des schriftlichen Fragebogens mit erneuter Übermittlung des Online-Zugangscodes. Im Fall eines erfolgten telefonischen Kontakts mit Personen, die nicht zur Teilnahme an der Studie bereit waren, erfolgte die Bitte, direkt telefonisch an der Non-response-Befragung teilzunehmen.

Alle Zielpersonen des schriftlichen Studienarms erhielten mit dem Erstanschreiben den schriftlichen Selbstausfüller-Fragebogen. Im Abstand von vier Wochen wurden zwei Erinnerungsschreiben versendet. Auf Wunsch der Zielpersonen bestand auch die Möglichkeit, ein telefonisches Interview durchzuführen.

An Zielpersonen sowohl des schriftlichen als auch des telefonischen Arms, für die bis zum Feldende keine Antwort vorlag, erfolgte der Versand des schriftlichen Non-response-Fragbogens mit der Option, diesen auch online zu beantworten.

Instrumente

Der Fragebogen des ESA enthält neben einem über die Erhebungen gleichbleibenden Kernmodul wechselnde Elemente, um den Zielen eines konstanten Monitorings und der flexiblen Bedarfsanpassung gerecht zu werden. Im Zentrum stehen das Konsumverhalten, Hinweise auf klinisch relevanten Konsum und Störungen im Zusammenhang mit dem Gebrauch von Tabak, Alkohol, illegalen Substanzen und Medikamenten. Zusätzlich werden soziodemographische Daten und Informationen zum körperlichen und psychischen Gesundheitszustand erfasst. Der vollständige Fragebogen der Erhebung kann auf der Internetseite des ESA eingesehen werden ( www.esa-survey.de).

Soziodemographie

Die Erfassung soziodemographischer Merkmale orientierte sich an den demographischen Standards für persönlich-mündliche und schriftliche Befragungen des Statistischen Bundesamts (Statistisches Bundesamt, 2010). Neben grundlegenden Informationen zu Geschlecht und Geburtsjahr wurden folgende Aspekte erfragt: (a) Migrationshintergrund (Geburtsland und Staatsbürgerschaft des Probanden sowie der Eltern), (b) Familiensituation (Familienstand, Kinder, Haushaltsgröße), (c) Bildung (Schulbildung, berufliche Ausbildung), (d) Erwerbstätigkeit (Erwerbsstatus, berufliche Stellung), (e) Haushaltsnettoeinkommen.

Gesundheit und gesundheitsbezogenes Verhalten

Der allgemeine Gesundheitszustand der Teilnehmer wurde mithilfe zweier 5-stufiger Ratings zur körperlichen und psychischen Gesundheit erfasst. Darüber hinaus wurden die Probanden gebeten anzugeben, ob sie eine chronische Krankheit haben und ob ein Arzt jemals eine neurologische Erkrankung festgestellt hat. Als Screening für das Vorliegen psychischer Störungen in den letzten 12 Monaten wurden elf Screeningfragen des Composite International Diagnostic Interview (CIDI; Wittchen et al., 1995) verwendet, welche auch im Zusatzmodul Psychische Gesundheit der Studie zur Gesundheit Erwachsener in Deutschland (DEGS1-MH; Jacobi et al., 2014) eingesetzt wurden.

Das Verhalten der Teilnehmer in Bezug auf körperliche Aktivität und Sport wurde mit insgesamt vier Fragen erfasst, die sich auf den Zeitraum der letzten drei Monate vor der Befragung bezogen. Diese Fragen wurden mit Genehmigung des Robert Koch-Instituts von der DEGS-Studie übernommen. Zur Erfassung des Ernährungsverhaltens wurde die Kurzform der Lebensmittelliste (LML-6; Keller, 1998) eingesetzt, welche die Häufigkeit des Konsums gesunder Lebensmittel nach den Empfehlungen der Deutschen Gesellschaft für Ernährung (DGE) erhebt. Auch für diese Fragen wurden die letzten drei Monate als Referenzzeitraum vorgegeben.

Substanzkonsum

In Bezug auf den Konsum von Tabak wurde die Prävalenz des Konsums von Zigaretten/Zigarren/Zigarillos/Pfeifen in der Lebenszeit, den letzten 12 Monaten sowie den letzten 30 Tagen erfragt. Darüber hinaus wurde der Menge-Frequenz-Index für die letzten 30 Tage erhoben, in den Informationen zur Anzahl der Konsumtage sowie zur durchschnittlichen Konsummenge pro Konsumtag eingingen. Ein weiteres Modul beschäftigte sich mit dem Gebrauch von E-Zigaretten/E-Zigarren/E-Shishas. Neben der Prävalenz und Frequenz des Gebrauchs wurden Bezugsquellen, Gebrauchsmotive und Risikoeinschätzungen erfragt.

Informationen zur durchschnittlichen Menge des Alkoholkonsums wurden über einen getränke-spezifischen Menge-Frequenz-Index für die letzten 30 Tage bzw. die letzten 12 Monate erhoben. Hierfür wurden für Bier, Wein/Sekt, Spirituosen sowie alkoholhaltige Mixgetränke die Häufigkeit des Konsums sowie die durchschnittliche Konsummenge pro Trinktag erfragt. Zusätzlich wurde die Häufigkeit des episodischen Rauschtrinkens (5 oder mehr Gläser Alkohol an einem Tag) erfasst.

Für den Bereich der illegalen Drogen wurde die Prävalenz und Frequenz (Lebenszeit, 12 Monate, 30 Tage) des Konsums von Cannabis (Haschisch, Marihuana), Aufputschmitteln/Amphetaminen, Ecstasy, LSD, Heroin, anderen Opiaten (z. B. Codein, Methadon, Opium, Morphium), Kokain und Crack erfragt. Zusätzliche Module erfassten die Konsumprävalenz und -frequenz von neuen psychoaktiven Substanzen (NPS) sowie von Amphetaminen und Methamphetamin.

Informationen zum Gebrauch von Medikamenten (12–Monats- und 30-Tage-Prävalenz, 30-Tage-Frequenz) wurden für Schmerzmittel, Schlafmittel, Beruhigungsmittel, Anregungsmittel, Appetitzügler, Antidepressiva, Neuroleptika und Anabolika erfasst. Um den Befragten die Zuordnung spezifischer Präparate zu diesen Gruppen zu erleichtern, wurde eine Liste der gebräuchlichsten Medikamente vorgegeben. In einem zusätzlichen Modul zum Gebrauch von Schmerzmitteln wurde die 12-Monats-Prävalenz getrennt für opioidhaltige und nicht-opioidhaltige Präparate erfragt.

Hinweise auf klinisch relevanten Substanzkonsum und substanzbezogene Störungen

Zur Erfassung des klinisch relevanten Substanzkonsums in den 12 Monaten vor der Befragung wurden Screening-Skalen verwendet. Eingesetzt wurden die deutschen Versionen des Fagerström-Tests für Nikotinabhängigkeit (FTND; Heatherton, Kozlowski, Frecker & Fagerström, 1991) für Tabak, des Alcohol Use Disorders Identification Test (AUDIT; Babor, Higgins-Biddle, Saunders & Monteiro, 2001) für Alkohol, der Severity of Dependence Scale (SDS; Gossop et al., 1995) für Cannabis, Kokain und Amphetamine/Methamphetamin sowie des Kurzfragebogens zum Medikamentengebrauch für Medikamente (KFM; Watzl, Rist, Höcker & Miehle, 1991).

Für den Bereich der Schmerzmittel wurde das Vorliegen von Störungen nach DSM-5 in den letzten 12 Monaten mithilfe des Münchener Composite International Diagnostic Interview (M-CIDI; Wittchen et al., 1995) getrennt für opioidhaltige und nicht-opioidhaltige Schmerzmittel erfasst.

Non-response-Fragebogen

Im Rahmen einer Non-response-Befragung wurden alle Personen, die nicht bereit waren, an der Studie teilzunehmen, oder von denen keine Rückmeldung vorlag, gebeten, einen Kurzfragebogen mit acht Fragen zu beantworten. Erfasst wurden zentrale Indikatoren des Konsums von Alkohol (Lebenszeit-, 12-Monats- und 30-Tage-Prävalenz des Konsums, 30-Tage-Prävalenz des episodischen Rauschtrinkens), Tabak (Menge-Frequenz-Index des Zigarettenkonsums bezogen auf die letzten 30 Tage), Cannabis (Lebenszeit- und 12-Monats-Prävalenz des Konsums) und Medikamenten (12-Monats-Prävalenz des Gebrauchs von Schmerz- und Schlafmitteln).

Datenmanagement

Die Steuerung und Kontrolle des Feldprozesses erfolgte am Feldinstitut über eine Datenbank, in die der tägliche Rücklauf und der aktuelle Bearbeitungsstatus eingetragen wurden. Eingehende Fragebögen wurden zunächst manuell auf Vollständigkeit und Plausibilität geprüft. Die Datenerfassung erfolgte je nach Befragungsmodus maskengestützt durch professionelle Kodierer/innen (schriftliche Selbstausfüller-Fragebogen) bzw. direkt in die integrierte Software (telefonische Interviews und Online-Fraugebögen). Das zugrundeliegende Maskenprogramm wurde auf Basis des Fragebogens erstellt und berücksichtigte Filtersprünge und gültige Wertebereiche. Die Daten wurden schließlich manuell auf Filterfehler, Plausibilität und Inkonsistenzen geprüft. Auftretende Fehler sowie die entsprechende Bereinigung wurden variablen- und personenspezifisch dokumentiert.

Auswertung

Für den vorliegenden Beitrag wurden Non-response- und Modus-Analysen durchgeführt. Hierfür wurden zunächst Teilnehmer und Nicht-Teilnehmer des Surveys hinsichtlich der in der Non-response-Befragung erhobenen Indikatoren verglichen. Es wurden logistische bzw. lineare Regressionsmodelle für dichotome (Prävalenzen) bzw. kontinuierliche Variablen (Konsummenge) berechnet, wobei für die Variablen Alter, Geschlecht, Bundesland und Interviewart kontrolliert wurde. In Bezug auf Modus-Effekte wurde zunächst anhand von Regressionsanalysen geprüft, inwiefern sich die Nutzer der unterschiedlichen Erhebungsmethoden hinsichtlich soziodemographischer Variablen unterschieden. Danach wurden logistische bzw. lineare Regressionsmodelle berechnet, um Unterschiede der Modi auf verschiedenen Konsumindikatoren zu prüfen. Hierfür wurde für die Variablen Alter, Geschlecht, Bundesland, Schulbildung und Haushaltsnettoeinkommen kontrolliert.

Bei allen Datenauswertungen wurde das komplexe Stichprobendesign der Studie berücksichtigt. Dies beinhaltet sowohl das mehrstufige Auswahlverfahren (Clusterung) als auch die Gewichtung der Daten. Für die Datenbereinigung und -auswertung wurden die Programme SPSS 22.0 (SPSS Inc., Chicago, IL) sowie Stata 12.1 SE (Stata Corp. LP, College Station, TX) genutzt.

Ergebnisse

Realisierte Stichprobe

Insgesamt konnte im ESA 2015 mit n = 9231 realisierten Befragungen eine Bruttoausschöpfung von 46.5 % erreicht werden. Davon wurden n = 3164 Interviews telefonisch durchgeführt (34.3 %), n = 3119 Personen beantworteten den Fragebogen schriftlich (33.8 %) und n = 2948 Befragte nahmen online an der Studie teil (31.9 %).

In Abbildung 1 ist der Stichprobenverlauf getrennt für die beiden Studienarme dargestellt. Insgesamt wurden n = 19’867 Adressen eingesetzt. Für 59.5 % (n = 11’823) davon konnte eine Telefonnummer recherchiert werden, die verbleibenden 40.5 % (n = 8044) wurden dem schriftlichen Studienarm zugeordnet.

Abbildung 1 Stichprobenverlauf nach Studienarm

Im schriftlichen Studienarm wurde eine Bruttoausschöpfung von 43.3 % erreicht. Mit dem Erstversand der Unterlagen wurde ein Rücklauf von 27.5 % erzielt, die zwei Erinnerungsschreiben erbrachten zusätzliche 15.8 Prozentpunkte. Die Mehrheit der Teilnehmer beantwortete den Fragenbogen schriftlich (78.4 %), weitere 21.4 % nutzten die Möglichkeit, online zu antworten. Ein kleiner Anteil von 0.2 % führte ein telefonisches Interview durch. Von den Zielpersonen, die nicht an der Befragung teilnahmen (56.7 %), entfiel der größte Teil (87.5 %) auf die Kategorie „kein Rücklauf“, d. h. es erfolgte bis zum Feldende keine Reaktion der angeschriebenen Personen.

In der Einsatzstichprobe mit Telefonnummer wurde ein Realisierungsanteil von 48.6 % erreicht. Mehr als die Hälfte der Teilnehmer (55.0 %) führte ein Telefoninterview durch, 38.3 % füllten den Fragebogen online aus und 6.7 % nahmen schriftlich teil. Der Prozentsatz an Nicht-Teilnehmern lag in diesem Studienarm bei 51.4 %. Mehrheitlich handelte es sich hierbei um systematische Ausfälle (76.7 %), wobei die meisten Personen in der Feldzeit nicht erreichbar waren (und auf die Nachsendung des schriftlichen Fragebogens nicht reagierten).

Die Einsatzstichprobe für die Non-response-Befragung umfasste n = 7269 Adressen, von denen n = 3391 Fälle aus dem schriftlichen und n = 3878 Fälle aus dem telefonischen Studienarm kamen. Für die Befragung kamen alle Nicht-Teilnehmer der Studie in Frage mit Ausnahme derer, die eine Teilnahme explizit verweigert hatten. Insgesamt haben sich n = 887 Personen in der Non-response-Befragung beteiligt, was einer Realisierungsquote von 12.2 % entspricht. Von den Teilnehmern beantworteten n = 728 (82.1 %) den Fragebogen schriftlich, n = 53 (6.0 %) telefonisch und n = 106 (12.0 %) online.

Ausschöpfung

Die Nettoausschöpfung des ESA 2015 ergibt sich als Verhältnis der Anzahl auswertbarer Fälle an der bereinigten Einsatzstichprobe. Die den Berechnungen zugrundeliegende Bruttorealisierung zeigt Tabelle 1 für beide Studienarme. Von den insgesamt realisierten 9231 Befragungen mussten im Rahmen der Datenprüfung 27 Fälle (0.1 %) ausgeschlossen werden, sodass die Auswertungsstichprobe insgesamt n = 9204 Fälle umfasst.

Tabelle 1 Bruttorealisierung nach Studienarm, n (%)

Die Aufgliederung der Bruttorealisierung in Tabelle 1 zeigt, dass 24.5 % der unbereinigten Einsatzstrichprobe als systematische Ausfälle klassifiziert werden konnten, die prinzipiell für die Studie verfügbar waren, sich aber nicht beteiligt haben. Dies betraf Zielpersonen, die (a) die Teilnahme explizit verweigerten, (b) in der Feldzeit nicht erreichbar waren, (c) aufgrund gesundheitlicher Probleme nicht befragbar waren oder (d) trotz Ankündigung den Fragenbogen nicht zurücksandten bzw. online ausfüllten oder einen Telefontermin nicht einhielten. Im telefonischen Studienarm war der Anteil systematischer Ausfälle höher als im schriftlichen Studienarm (39.4 % vs. 2.4 %), wobei die meisten Fälle auf die Kategorien „nicht erreichbar“ und „Verweigerung“ entfielen.

Die Bestimmung der bereinigten Einsatzstichprobe erfolgte in zwei Schritten. Zunächst wurde der Anteil qualitätsneutraler Ausfälle an der Gesamtstichprobe bestimmt. Hierbei handelt es sich um Fälle, die niemals die Möglichkeit hatten, in die Studie aufgenommen zu werden. Hierzu zählen Zielpersonen, (a) die unbekannt waren, (b) deren Telefonnummer ungültig war, (c) die nicht deutsch sprachen, (d) die nicht in der Zielgruppe des Surveys waren oder (e) die verstorben waren. Insgesamt betraf dies n = 1791 Personen oder 9.0 % der Einsatzstichprobe. Der Anteil neutraler Ausfälle war im telefonischen Studienarm aufgrund der Kategorie „Telefonnummer ungültig“ höher als im schriftlichen Studienarm (11.9 % vs. 4.8 %). Unter Ausschluss der neutralen Ausfälle ergibt sich eine bereinigte Bruttostichprobe von n = 18 076 Fällen.

In einem zweiten Schritt wurde der Anteil neutraler Ausfälle an allen Fällen ohne Rücklauf geschätzt. Zielpersonen ohne Rücklauf waren solche, zu denen bis zum Ende der Feldzeit keine Information vorlag. Insgesamt betraf dies 4002 Fälle oder 20.1 % der Einsatzstichprobe, wobei der Anteil im schriftlichen Studienarm deutlich höher war als im telefonischen Studienarm (49.6 % vs. 0.1 %). Da nicht bekannt ist, wie viele dieser Personen nicht zur Grundgesamtheit der Studie gehörten (neutrale Ausfälle), wurde hierfür der Prozentsatz der neutralen Ausfälle an allen Personen mit bekanntem Rücklaufstatus als Schätzwert herangezogen. Bekannt war der Rücklaufstatus für n = 15 865 Personen (Einsatzstichprobe – kein Rücklauf), sodass sich ein Anteil neutraler Ausfälle von 1791/15’865 * 100 = 11.3 % ergibt. Nimmt man diesen Anteil ebenfalls für Personen ohne Rücklauf an, ergibt sich eine Anzahl von n = 452 Fällen (11.3 % * 4002). Durch diese reduziert sich die finale bereinigte Einsatzstichprobe auf n = 17’624 Fälle. Bildet man abschließend das Verhältnis der Anzahl auswertbarer Fälle (n = 9204) an der bereinigten Einsatzstichprobe (n = 17.624), ergibt sich eine Nettoausschöpfung von 52.2 %.

Gewichtung

Mit dem ESA 2015 sollen repräsentative Aussagen für die deutsche Bevölkerung im Alter zwischen 18 und 64 Jahren getroffen werden. Um dies zu gewährleisten, ist es notwendig, die Daten zu gewichten und die realisierte Stichprobe somit hinsichtlich zentraler Merkmale an die Grundgesamtheit anzupassen. Insgesamt wurden drei Gewichte berechnet: ein Designgewicht, ein Redressementgewicht für Querschnittsauswertungen und ein Redressementgewicht für Trendanalysen.

Das Designgewicht gleicht zunächst die disproportionale Ziehung der Stichprobe nach Jahrgangsgruppen aus, welche im Studiendesign vorgesehen war. Dieser Gewichtungsfaktor wurde umgekehrt proportional zur Auswahlwahrscheinlichkeit auf der jeweiligen Auswahlstufe gebildet. Zur Bewertung des Einflusses der Gewichtung wurde das Effektivitätsmaß E und die daraus abgeleitete effektive Fallzahl n‘ berechnet (Gabler, Hoffmeyer-Zlotnik & Krebs, 1994; Little, Lewitzky, Heeringa, Lepkowski & Krebs, 1997). Da das Ausmaß der Disproportionalität der Stichprobenziehung moderat war, ergibt sich eine hohe Effektivität des Designgewichts von 89.7 %, was einer effektiven Fallzahl von 8146 Fällen entspricht. Der Gewichtungsfaktor weist ein Minimum von 0.38 und ein Maximum von 1.39 auf.

Redressementgewichte werden berechnet, um die Stichprobe hinsichtlich zentraler externer Merkmale an die Grundgesamtheit anzupassen. Die dafür benötigten Randverteilungen der 18- bis 64-jährigen Bevölkerung wurden dem Mikrozensus 2014 entnommen. Für die Redressementgewichtung wurde ein Iterative Proportional Fitting Algorithmus verwendet (Gelman & Carlin, 2001). Für alle Querschnittsauswertungen der Erhebung 2015 wurden die externen Merkmale Bundesland, BIK-Gemeindegrößenklasse, Geschlecht, Geburtsjahrgang sowie höchster Schulabschluss für die Gewichtung herangezogen. Da das Designgewicht im Redressementgewicht enthalten ist und die beschriebenen Anpassungsmerkmale zusätzlich in die Gewichtung einbezogen werden, wirkt sich das Redressementgewicht zwangsläufig stärker auf die effektive Fallzahl aus. Diese liegt für die Gewichtungsvariable für Querschnittsanalysen bei n′ = 5952; die Effektivität beträgt 65.5 %. Der Wertebereich des Gewichtungsfaktors liegt zwischen 0.19 und 5.63.

Für die Trendauswertungen wurde ein zusätzliches Redressementgewicht berechnet, welches im Vergleich zu dem eben beschriebenen Gewichtsfaktor auf das Anpassungsmerkmal höchster Schulabschluss verzichtet, da dies in den Erhebungen bis 2009 nicht in die Gewichtung einbezogen werden konnte. Mit einer effektiven Fallzahl von 7839 erzielt dieser Gewichtungsfaktor eine Effektivität von 86.3 %. Der Wertebereich liegt zwischen 0.24 und 2.35.

Repräsentativität

Durch die verwendete Gewichtung kann die Stichprobe hinsichtlich der zentralen Merkmale Bundesland, BIK-Gemeindegrößenklasse, Geschlecht und Jahrgangsgruppe an die Verteilung in der Grundgesamtheit angepasst werden. Bezogen auf diese Indikatoren kann von repräsentativen Ergebnissen gesprochen werden. Die Verteilung zusätzlicher Variablen, die nicht in die Gewichtung eingegangen sind, zeigt Tabelle 2 für die ungewichtete und die gewichtete Stichprobe (getrennt nach Querschnitts- und Trendgewichtung) sowie die Grundgesamtheit. Deutliche Unterschiede zeigen sich für den höchsten Schulabschluss. Ohne Gewichtung sowie unter Verwendung des Redressementgewichts für die Trendauswertungen war der Anteil der Personen mit Abitur im Vergleich zur Grundgesamtheit deutlich erhöht. Da der höchste Schulabschluss in der Querschnittsgewichtung als zusätzliches Anpassungsmerkmal verwendet wurde, zeigen sich hier keine Unterschiede zur Bevölkerung. In der ungewichteten Stichprobe waren ledige Personen deutlich überrepräsentiert. Dies konnte durch die Gewichtung ausgeglichen werden, sodass der Familienstand der gewichteten Stichprobe dem der Grundgesamtheit sehr gut entspricht. In der Studie unterrepräsentiert sind Personen mit nichtdeutscher Staatsbürgerschaft, was auch durch die Gewichtung nicht ausgeglichen werden konnte.

Tabelle 2 Verteilung soziodemographischer Merkmale in der ungewichteten und gewichteten Stichprobe und in der Grundgesamtheit

Non-response-Effekte

Hinsichtlich aller in der Non-response-Befragung erhobenen Indikatoren zeigten sich statistisch signifikante Unterschiede zwischen Teilnehmern und Nicht-Teilnehmern des ESA 2015 (Tabelle 3). Personen, die nicht an der Hauptstudie teilnahmen, zeigten eine niedrigere 30-Tage-Prävalenz des Alkoholkonsums. Bezogen auf die aktuellen Konsumenten war der Anteil derer, die mindestens einmal episodisches Rauschtrinken praktiziert hatten, in dieser Gruppe höher als unter den Teilnehmern. In ähnlicher Weise war auch die Prävalenz des Tabakkonsums bei Nicht-Teilnehmern geringer, die durchschnittliche Anzahl gerauchter Zigaretten aber höher als in der Vergleichsgruppe. Die Prävalenz des Cannabiskonsums war bei Teilnehmern höher als bei Nicht-Teilnehmern, wohingegen letztere eine höhere Prävalenz des Medikamentengebrauchs aufwiesen.

Tabelle 3 Vergleich von Konsumvariablen nach Teilnahmebereitschaft, n (%) a)

Modus-Effekte

Die Wahl einer bestimmten Erhebungsmethodik ist von unterschiedlichen individuellen Merkmalen abhängig. So war beispielsweise der Anteil der Männer bei online Befragten höher (55.8 %) als bei telefonisch (51.6 %) und schriftlich Befragten (44.8 %). Personen, die telefonisch an der Studie teilnahmen, waren älter (M = 43.6) als Personen, die schriftlich (M  = 42.0) und online teilnahmen (M = 41.2). Darüber hinaus waren in der Online-Befragung Personen mit Abitur deutlich häufiger vertreten (48.1 %) als im schriftlichen (33.2 %) und im Telefon-Modus (28.4 %).

Auch unter Konstanthaltung individueller Merkmale, welche die Wahl des Erhebungsmodus beeinflussen, zeigten sich zum Teil statistisch bedeutsame Unterschiede zwischen den Modi (Tabelle 4). Im Vergleich zu Personen, die den schriftlichen Fragebogen ausfüllten, wiesen online Befragte eine niedrigere Prävalenz des Tabak- und Cannabiskonsums sowie eine ebenfalls niedrige Prävalenz des Schmerzmittelgebrauchs auf. In vergleichbarer Weise war auch unter telefonisch Befragten der Anteil der Cannabiskonsumenten und der Schmerzmittelnutzer niedriger als bei schriftlich Befragten.

Tabelle 4 Vergleich von Konsumvariablen nach Art der Erhebungsmethode, n (%) a)

Diskussion

Mit dem Epidemiologischen Suchtsurvey sollen bevölkerungsrepräsentative Aussagen zum Konsum von psychoaktiven Substanzen und damit verbundenen Problemen gemacht werden. Die Analysen zeigten, dass für die Querschnittsauswertungen Repräsentativität bezüglich der Variablen Bundesland, BIK-Gemeindegrößenklasse, Geschlecht, Jahrgangsgruppe, Schulbildung sowie Familienstand gegeben ist. Aufgrund der in früheren Erhebungen abweichenden Gewichtung sind jedoch Trendanalysen in Bezug auf die Schulbildung nicht repräsentativ, sondern zeigen einen in Bevölkerungsstudien bekannten „Mittelschichtsbias“ (Diekmann, 2007; Kraus, Piontek, Pabst & Gomes de Matos, 2013). Generell können Selektionseffekte in bevölkerungsepidemiologischen Studien nie vollständig ausgeschlossen werden. Im vorliegenden Fall sind beispielsweise Personen mit Migrationshintergrund unterrepräsentiert, weil der Survey ausschließlich in deutscher Sprache durchgeführt wurde.

Insbesondere für Subgruppen-Analysen ist es wichtig, dass sich möglichst viele Personen an der Studie beteiligen. Aufgrund verschiedener Strategien und Anstrengungen war es möglich, im ESA 2015 eine Gesamtzahl von 9204 Teilnehmern zu gewinnen, was einer Netto-Ausschöpfung von 52.2 % entspricht. Damit hat sich die Antwortrate in den letzten Erhebungen bei über 50 % stabilisiert (2009: 50.1 %, 2012: 53.6 %). Im nationalen und internationalen Vergleich ist diese Beteiligung als sehr positiv zu bewerten. So erzielte beispielsweise die Studie zur Gesundheit Erwachsener in Deutschland (DEGS1) bei den erstmals eingeladenen Personen eine Response von 42 % (Kamtsiuris et al., 2013). Lediglich bei den Wiedereingeladenen, die sich bereits an einer früheren Erhebung beteiligt hatten, lag die Teilnahmebereitschaft mit 62 % deutlich höher. Im Vergleich zur letzten Erhebung des ESA im Jahr 2012 ist auffällig, dass sich der Anteil der qualitätsneutralen Ausfälle deutlich reduziert hat (9.0 % vs. 20.1 %), es also weniger ungültige bzw. unbekannte Adressen gab. Negativ auf die Antwortrate hat sich der vergleichsweise hohe Anteil nicht erreichbarer Personen im telefonischen Studienarm ausgewirkt. Für zukünftige Erhebungen sollte überlegt werden, inwiefern neue Zugangswege und Befragungsmethoden die Antwortrate weiter erhöhen könnten. Eine viel diskutierte Möglichkeit bieten z. B. an Smartphones und Tablets angepasste Befragungen (Toepoel & Lugtig, 2015).

Die Daten des ESA bieten die Möglichkeit, sowohl Non-response- als auch Modus-Effekte zu überprüfen. Dabei zeigten Nicht-Teilnehmer eine niedrigere Konsumprävalenz für Tabak, Alkohol und Cannabis als Teilnehmer. Allerdings waren der Gebrauch von Medikamenten sowie die Konsummengen für Alkohol und Tabak in dieser Gruppe signifikant erhöht. Dies fügt sich in die internationale Literatur, die belegt, dass Non-responder ein eher ungünstigeres Gesundheitsverhalten und eine vorzeitige Sterblichkeit aufweisen (Christensen, Ekholm, Gray, Glümer & Juel, 2015; Kraus et al., 2013). Bezogen auf die Ergebnisse des ESA legen diese Analysen nahe, dass Konsumprävalenzen vermutlich überschätzt, die Prävalenz problematischer Konsummuster aber vermutlich unterschätzt wird.

Bei der Entscheidung für oder gegen eine bestimmte Erhebungsmethodik in Bevölkerungssurveys sind unterschiedliche Aspekte zu berücksichtigen. So ist beispielsweise die Datenqualität bei Selbstausfüllern höher als bei der Anwesenheit dritter Personen, insbesondere wenn es um sensible Themen geht (Kreuter, Presser & Tourangeau, 2008). Online durchgeführte Befragungen bieten die Vorteile einer größeren Flexibilität, höherer wahrgenommener Vertraulichkeit und vergleichsweise geringer Kosten (Evans & Mathur, 2005), haben in der Regel aber niedrigere Antwortraten (Lozar Manfreda, Bosnjak, Berzelak, Haas & Vehovar, 2008). Die Erfahrungen des ESA zeigen, dass durch den Einsatz verschiedener Erhebungsmethoden die Antwortraten in den letzten zwölf Jahren insgesamt gesteigert bzw. stabilisiert werden konnten. Allerdings belegen die Analysen auch, dass nicht nur unterschiedliche Personengruppen bestimmte Befragungsmethoden bevorzugen, sondern dass sich auch unter Kontrolle soziodemographischer Variablen das Antwortverhalten zwischen den Modi unterscheidet. Für die Analyse inhaltlicher Fragestellungen ist es deshalb wichtig, den Befragungsmodus als Kontrollvariable zu berücksichtigen.

Der Epidemiologische Suchtsurvey muss sich auch in Zukunft mit den in der Surveyforschung bekannten Herausforderungen wie möglichen Selektionseffekten, im Allgemeinen sinkenden Antwortraten und Fragen der Datenqualität auseinandersetzen. Durch den Einsatz verschiedener Befragungsmethoden und die Gewichtung der Daten konnte jedoch sichergestellt werden, dass mit dem ESA 2015 bevölkerungsrepräsentative Daten zum (klinisch relevanten) Konsum von legalen und illegalen Substanzen sowie Medikamenten vorliegen.

Kurzvita

Dr. Daniela Piontek 1999 bis 2004 Diplom-Studium Psychologie an der TU Chemnitz 2008 Promotion zum Dr. phil. an der TU Chemnitz 2004 bis 2013 wissenschaftliche Mitarbeiterin am IFT Institut für Therapieforschung in München Seit 2013 Leiterin der Arbeitsgruppe Epidemiologie und Diagnostik am IFT Institut für Therapieforschung in München

Deklaration möglicher Interessenkonflikte

Ludwig Kraus und Daniela Piontek wurden in einem Forschungsprojekt zur Epidemiologie von Alkoholabhängigkeit von Lundbeck GmbH gefördert.

Manuskript eingereicht: 07. 03. 2016 Angenommen nach Revision: 04. 05. 2016

Der Epidemiologische Suchtsurvey 2015 wurde aus Mitteln des Bundesministeriums für Gesundheit (BMG) gefördert (AZ: IIA5 – 2514DSM200). Mit der Finanzierung sind keine Auflagen verbunden.

Literatur

  • Babor, T. F., Higgins-Biddle, J. C., Saunders, J. B. & Monteiro, M. G. (2001). AUDIT. The Alcohol Use Disorders Identification Test. Guidelines for use in primary care. Geneva: World Health Organization. First citation in articleGoogle Scholar

  • Christensen, A. I., Ekholm, O., Gray, L., Glümer, C. & Juel, K. (2015). What is wrong with non‐respondents? Alcohol‐, drug‐and smoking‐related mortality and morbidity in a 12‐year follow‐up study of respondents and non‐respondents in the Danish Health and Morbidity Survey. Addiction, 110, 1505 – 1512. First citation in articleCrossrefGoogle Scholar

  • Diekmann, A. (2007). Empirische Sozialforschung: Grundlagen, Methoden, Anwendungen. (17. Auflage) Reinbek: Rowohlt. First citation in articleGoogle Scholar

  • Evans, J. R. & Mathur, A. (2005). The value of online surveys. Internet Research, 15, 195 – 219. First citation in articleCrossrefGoogle Scholar

  • Gabler, S., Hoffmeyer-Zlotnik, J. & Krebs, D. (1994). Gewichtung in der Umfragepraxis. Opladen: Westdeutscher Verlag. First citation in articleCrossrefGoogle Scholar

  • Gelman, A. & Carlin, J. (2002). Poststratification and weighting adjustments. In R. M. GrovesJ. L. EltingeR. J. A. LittleEds., Survey nonresponse (pp. 289 – 203). New York: Wiley. First citation in articleGoogle Scholar

  • Gomes de Matos, E., Atzendorf, J., Kraus, L. & Piontek, D. (2016). Substanzkonsum in der Allgemeinbevölkerung in Deutschland: Ergebnisse des Epidemiologischen Suchtsurveys 2015. Sucht, 62 (5), 271 – 281. First citation in articleGoogle Scholar

  • Gomes de Matos, E., Kraus, L., Pabst, A. & Piontek, D. (2013). Problembewusstsein und Inanspruchnahme von Hilfe bei substanzbezogenen Problemen. Sucht, 59, 355 – 366. First citation in articleLinkGoogle Scholar

  • Gossop, M., Darke, S., Griffiths, P., Hando, J., Powis, B., Hall, W. & Strang, J. (1995). The Severity of Dependence Scale (SDS): Psychometric properties of the SDS in English and Australian samples of heroin, cocaine and amphetamine users. Addiction, 90, 607 – 614. First citation in articleCrossrefGoogle Scholar

  • Heatherton, T. F., Kozlowski, L. T., Frecker, R. C. & Fagerström, K. O. (1991). The Fagerström test for nicotine dependence: A revision of the Fagerström tolerance questionnaire. British Journal of Addiction, 86, 1119 – 1127. First citation in articleCrossrefGoogle Scholar

  • Jacobi, F., Höfler, M., Strehle, J., Mack, S., Gerschler, A., Scholl, L. & …Maier, W. (2014). Psychische Störungen in der Allgemeinbevölkerung: Studie zur Gesundheit Erwachsener in Deutschland und ihr Zusatzmodul Psychische Gesundheit (DEGS1-MH). Der Nervenarzt, 85, 77 – 87. First citation in articleCrossrefGoogle Scholar

  • Kamtsiuris, P., Lange, M., Hoffmann, R., Rosario, A. S., Dahm, S., Kuhnert, R. & Kurth, B. M. (2013). Die erste Welle der Studie zur Gesundheit Erwachsener in Deutschland (DEGS1). Bundesgesundheitsblatt-Gesundheitsforschung-Gesundheitsschutz, 56, 620 – 630. First citation in articleCrossrefGoogle Scholar

  • Keller, S. (1998). Zur Validität des Transtheoretischen Modells – Eine Untersuchung zur Veränderung des Ernährungsverhaltens Marburg(Dissertation, Universität Marburg). Verfügbar unter https://archiv.ub.uni-marburg.de/diss/z1998/0303/ First citation in articleGoogle Scholar

  • Kraus, L., Piontek, D., Atzendorf, J. & Gomes de Matos, E. (2016). Zeitliche Entwicklungen im Substanzkonsum in der deutschen Allgemeinbevölkerung: Ein Rückblick auf zwei Dekaden. Sucht, 62 (5), 283 – 294. First citation in articleGoogle Scholar

  • Kraus, L., Piontek, D., Pabst, A. & Gomes de Matos, E. (2013). Studiendesign und Methodik des Epidemiologischen Suchtsurveys 2012. Sucht, 59, 309 – 320. First citation in articleLinkGoogle Scholar

  • Kraus, L., Piontek, D., Pfeiffer-Gerschel, T. & Rehm, J. (2015). Inanspruchnahme gesundheitlicher Versorgung durch Alkoholabhängige. Suchttherapie, 16, 18 – 26. First citation in articleCrossrefGoogle Scholar

  • Kreuter, F., Presser, S. & Tourangeau, R. (2008). Social desirability bias in CATI, IVR, and web surveys: The effects of mode and question sensitivity. Public Opinion Quarterly, 70, 847 – 865. First citation in articleCrossrefGoogle Scholar

  • Little, R. J. A., Lewitzky, S., Heeringa, S., Lepkowski, J. & Kessler, R. C. (1997). Assessment of weighting methodology for the National Comorbidity Survey. American Journal of Epidemiology, 146, 439 – 449. First citation in articleCrossrefGoogle Scholar

  • Lozar Manfreda, K., Bosnjak, M., Berzelak, J., Haas, I., Vehovar, V. & Berzelak, N. (2008). Web surveys versus other survey modes: A meta-analysis comparing response rates. Journal of the Market Research Society, 50, 79 – 104. First citation in articleGoogle Scholar

  • Ludwig, M., Kraus, L., Müller, S., Braun, B. & Bühringer, G. (2012). Has gambling changed after major amendments of gambling regulations in Germany? A propensity score analysis. Journal of Behavioral Addictions, 1, 151 – 161. First citation in articleCrossrefGoogle Scholar

  • Müller, S., Kraus, L., Piontek, D. & Pabst, A. (2010). Changes in exposure to second hand smoke and smoking behaviour in the general population after the introduction of new smoke-free laws in Germany. Sucht, 56, 373 – 384. First citation in articleLinkGoogle Scholar

  • Pfeiffer-Gerschel, T., Jakob, L., Dammer, E., Karachaliou, K., Budde, A. & Rummel, C. (2015). Bericht 2015 des nationalen REITOX-Knotenpunkts an die EBDD. Deutschland, Workbook Drogen. München: Deutsche Beobachtungsstelle für Drogen und Drogensucht DBDD. First citation in articleGoogle Scholar

  • Statistisches Bundesamt. (2010). Demographische Standards Ausgabe 2010 (Statistik und Wissenschaft, Band 17). Wiesbaden: Statistisches Bundesamt. First citation in articleGoogle Scholar

  • Toepoel, V. & Lugtig, P. (Hrsg.). (2015). The collection of survey data using mixed devices. Methods, data, analyses. Journal for Quantitative Methods and Survey Methodology, 9, 155 – 291. First citation in articleGoogle Scholar

  • Watzl, H., Rist, F., Höcker, W. & Miehle, K. (1991). Entwicklung eines Fragebogens zur Erfassung von Medikamentenmissbrauch bei Suchtpatienten. In M. HeideH. LiebHrsg., Sucht und Psychosomatik. Beiträge des 3. Heidelberger Kongresses (S. 123 – 139). Bonn: Nagel. First citation in articleGoogle Scholar

  • Wittchen, H.-U., Beloch, E., Garczynski, E., Holly, A., Lachner, G., Perkonigg, A. & … Zieglgänsberger, S. (1995). Münchener Composite International Diagnostic Interview (M-CIDI), Paper-pencil 2.2, 2/95. München: Max-Planck-Institut für Psychiatrie, Klinisches Institut. First citation in articleGoogle Scholar

Dr. phil. Daniela Piontek, IFT Institut für Therapieforschung, Parzivalstraße 25, 80804 München, Deutschland, E-Mail