Einleitung
Das Konzept der NAKO Gesundheitsstudie basiert auf einem biopsychosozialen Verständnis von Gesundheit und Krankheit und es berücksichtigt dementsprechend auch demografische und soziale Merkmale der Teilnehmerinnen und Teilnehmer [
1]. Abgesehen davon, dass es zum Standard in epidemiologischen Studien gehört, soziodemografische und erwerbsbezogene Merkmale zu erheben, soll mit der NAKO eine Datenbasis geschaffen werden, die international wegweisende Forschung zu Themen der Sozialepidemiologie ermöglicht.
Dass soziodemografische und erwerbsbezogene Merkmale eine wichtige Rolle bei der Erklärung gesundheitlicher Phänomene spielen, ist unstrittig [
2‐
6]. Alter und Geschlecht sind Kerndeterminanten der Gesundheit, Gleiches gilt für die sozioökonomische Position (üblicherweise als Trias aus Bildung, Einkommen und Beruf verstanden), die familiäre Situation und den Erwerbsstatus. Aus diesem Grund werden soziodemografische Unterschiede in vielen epidemiologischen Untersuchungen berücksichtigt. Darüber hinaus gibt es mit der Sozialepidemiologie eine eigene Forschungsrichtung in der Epidemiologie, die sich explizit mit dieser Art von Einflussfaktoren beschäftigt [
7]. Beginnend mit Pionierstudien, wie der britischen Whitehall-Studie, hat diese Forschung eine enge Verbindung insbesondere zwischen der sozioökonomischen Position (folgend als SEP,
Socioeconomic Position, abgekürzt) und einer Fülle von Risikofaktoren und gesundheitsrelevanten Verhaltensweisen aufdecken können und gezeigt, dass mit sinkender SEP das Morbiditäts- und Mortalitätsrisiko steigt [
7‐
13].
In den vergangenen zwei Jahrzehnten hat sich in Deutschland das Bewusstsein für die Bedeutung sozialepidemiologischer Ansätze deutlich geschärft, nachdem die Forschung in der Vergangenheit vor allem durch die angelsächsischen und skandinavischen Länder geprägt war und aus Deutschland nur wenige sowie regional begrenzte Daten zur Forschung beigesteuert wurden [
14,
15]. Mittlerweile gibt es hierzulande auch eine wachsende Datenbasis für entsprechende Analysen, sei es in Form von Routinedaten, Bevölkerungsumfragen der Gesundheitsberichterstattung oder verschiedenen Kohortenstudien [
14‐
16]. Aus der Forschung mit diesen Datenquellen ist z. B. bekannt, dass auch in Deutschland erhebliche soziale Ungleichheiten der Gesundheit existieren [
17], die sich sowohl entlang von horizontalen Unterschieden (z. B. Geschlecht) als auch von vertikalen Unterschieden (z. B. Bildung oder Einkommen) manifestieren.
Vor diesem Hintergrund ist eine intensive Erforschung der diesen Ungleichheiten zugrunde liegenden Mechanismen von hohem Interesse. Die bisher verfügbare Datenbasis unterliegt jedoch bestimmten methodischen Einschränkungen. Eine Schwierigkeit ist die oft geringe Tiefe der Differenzierung soziodemografischer Gruppen (etwa in Registerdaten). Diese ist aber notwendig, um (Hoch‑)Risikogruppen sicher zu identifizieren und konkrete Zielgruppenbeschreibungen für eine verbesserte Prävention und Versorgung zur Verfügung stellen zu können. Zusätzlich limitierend wirkt eine vergleichsweise geringe Stichprobengröße mancher Studien, die die Subgruppenbildung weiter erschwert. Zudem konnten in bisherigen Studien soziale Faktoren nur selten direkt in Zusammenhang mit biomedizinischen Indikatoren wie genetischen Informationen, Laborwerten oder bildgebender Diagnostik untersucht werden.
Diese Limitationen können durch große populationsbasierte Kohortenstudien zumindest teilweise ausgeglichen werden. Dies zeigen internationale Beispiele wie die französische CONSTANCES-Studie [
18], die niederländische LifeLines-Studie [
19], LifeGene aus Schweden [
20], CONOR aus Norwegen [
21] oder die UK Biobank aus dem Vereinigten Königreich [
22]. Die NAKO Gesundheitsstudie folgt diesen Vorbildern und kann so der sozialepidemiologischen Forschung in Deutschland neue Möglichkeiten eröffnen. Die Potenziale der NAKO sind, neben ihrem Längsschnittdesign, die Realisierung einer sehr hohen Fallzahl, die Detailtiefe der Messung von Gesundheit, Krankheit und sozialen Faktoren sowie die Einbeziehung der gesamten in Deutschland lebenden Bevölkerung inklusive jüngerer Altersgruppen ab 20 Jahren [
1,
23].
In diesem Beitrag sollen primär die in der NAKO eingesetzten Instrumente zur Messung soziodemografischer und erwerbsbezogener Merkmale vorgestellt werden. Hierzu werden der Prozess der Fragebogenentwicklung und die im Einzelnen ausgewählten Instrumente beschrieben. Ergänzend gibt der Beitrag einen ersten deskriptiven Einblick in die sozialstrukturelle Zusammensetzung der Kohorte und damit auch die konkrete Variablenbildung. Abschließend sollen die eingesetzten Instrumente anhand einer exemplarischen Reproduktion bekannter Zusammenhänge mit dem Body-Mass-Index (BMI) und selbst berichteter Gesundheit validiert werden. Diese Zielgrößen wurden gewählt, weil soziodemografische Unterschiede bei Untergewicht und Adipositas [
24,
25] sowie schlechter selbst berichteter Gesundheit [
26] in der Forschung gut belegt sind.
Material und Methoden
Fragebogen und Instrumente
Der Entwurf des Instruments zur Messung soziodemografischer Angaben einschließlich der sozioökonomischen Position und der Erwerbssituation wurde in den Jahren 2010–2012 von der interdisziplinären „Arbeitsgruppe Fragebogen“ der NAKO Gesundheitsstudie erstellt. Er orientierte sich wesentlich an den „Demographischen Standards“ (DS) des Statistischen Bundesamts in der zum Zeitpunkt der Erstellung gültigen Fassung von 2010 [
27]. Diese Standards werden unter anderem beim Mikrozensus eingesetzt und können als Referenzinstrument für Befragungen in Deutschland gelten. Ausgewählt wurden insbesondere Kernvariablen (s. unten). In einzelnen Fällen wurde die Abfrage gegenüber dem Original leicht gekürzt oder im Wortlaut etwas verändert, da der Fragebogen der NAKO-Studie aus erhebungsökonomischen Gründen eine gewisse Länge und Komplexität nicht überschreiten durfte. Bei der Erstellung des ersten Entwurfs wurden die Fragen zusätzlich auf Übereinstimmung mit den Instrumenten deutscher Kohortenstudien bzw. Studien der Gesundheitsberichterstattung abgeglichen. Referenzstudien waren beispielsweise CARdiovascular Disease, Living and Ageing in Halle (CARLA), die Studie zur Gesundheit Erwachsener in Deutschland (DEGS), Gesundheit in Deutschland aktuell (GEDA), Heinz Nixdorf Recall (HNR), Kooperative Gesundheitsforschung in der Region Augsburg (KORA), LIFE-Adult des Leipziger Forschungszentrums für Zivilisationserkrankungen und der Study of Health in Pomerania (SHIP). Einzelne Fragen oder Antwortskalen wurden aus diesen Studien übernommen, wenn die entsprechende Abfrage in den DS entweder nicht vorhanden war (zum Beispiel im Falle der Erfassung von Arbeitslosigkeit) oder wenn die Abfrage in den DS zu komplex erschien. Zudem wurden wenige, meist einfache Fragen neu entwickelt.
Der auf dieser Basis erstellte Fragebogenentwurf wurde externen Expertinnen und Experten, beispielsweise des Robert Koch-Instituts und des Rats für Sozial- und Wirtschaftsdaten, zur Kommentierung vorgelegt. Die finale Fassung wurde dann als Teil des Core-Interviews implementiert, ein für alle Studienteilnehmenden obligatorisches, persönliches, computerassistiertes Interview. Die Interviewenden wurden entsprechend geschult und führten die Interviews als Zweiergespräch in eigenen Räumlichkeiten in den Erhebungszentren durch.
Tab.
1 gibt einen Überblick über die erfassten Themengebiete und verweist auf die Referenzen der eingesetzten Fragen. Durch die Abfrage der Haushaltszusammensetzung ist zudem die Ableitung des Nettoäquivalenzeinkommens [
28] möglich, das zusammen mit der Bildung und der beruflichen Stellung ein zentraler Indikator der SEP ist [
29]. Anzumerken ist, dass ebenfalls Angaben zum Migrationshintergrund erhoben wurden (siehe Beitrag von Wiessner et al. in diesem Themenheft). Ebenfalls ist darauf hinzuweisen, dass zusätzlich einzelne soziale und berufsbezogene Expositionen erhoben wurden (z. B. soziale Isolation, Arbeitsstress), die hier nicht Gegenstand der Betrachtung sind.
Tab. 1
Übersicht Demografie, sozioökonomische Position, Erwerbstätigkeit, soziale und berufliche Expositionen
Basisdemografie | Geschlecht | – | DS 2010 |
Alter, kontinuierlich | Berechnet aus Geburtsdatum (erfragt) und Untersuchungsdatum | NAKO |
Familienstand und Familie | Familienstand | – | DS 2010/DEGS 2009 |
Partnerschaft und Zusammenleben mit Partner | – | DEGS 2009 |
Anzahl leiblicher Kinder | – | NAKO |
Angaben zum Haushalt | Wohnsituation (Art der Wohnung, z. B. Miete, Eigentum, Pflegeheim) | – | CARLA |
Gesamtzahl Personen im Haushalt und Anzahl Personen im Alter von 14 Jahren oder älter | Die Zahl der Personen ≤14 Jahre wird zur Berechnung von Gewichtungsfaktoren das Äquivalenzeinkommens benötigt | DS 2010 |
Schul- und Ausbildung | Höchster allgemeinbildender Schulabschluss | – | DS 2010 |
Berufliche Ausbildungsabschlüsse (Mehrfachnennung) | – | DS 2010 |
Einkommen | Monatliches Haushaltsnettoeinkommen | Kategoriale Abfrage | DS 2010 |
Erwerbstätigkeit | Aktuelle Erwerbssituation | – | DS 2010 |
Wochenarbeitszeit (in Stunden) | Nur erwerbstätige Personen | DS 2010 |
Nichterwerbstätige: aktuelle Situation | – | DS 2010 |
Frühere Erwerbtätigkeit bei aktuell Nichterwerbstätigen | – | DS 2010 |
Aktueller oder letzter Beruf | Klartextangaben | DS 2010 |
Berufliche Stellung (Selbstständige, Arbeiter, Angestellte, Beamte, Auszubildende) | Im aktuellen oder letzten Beruf | DS 2010 |
Rente/Pension/Vorruhestand | Berentungsgrund, -jahr, Erwerbsminderungsrenten Diagnose | Nur berentete Personen | NAKO |
Erwerbslosigkeit | Dauer der aktuellen Arbeitslosigkeit | Nur arbeitslos gemeldete Personen und Personen in Maßnahmen | NAKO |
Frühere Arbeitslosigkeit: jemals arbeitslos gemeldet, Zahl und Gesamtdauer der jeweiligen Perioden | – | NAKO |
Bildungsstand Partner | Höchster Schulabschluss und Ausbildungsabschlüsse Partner | – | DS 2010 |
Bildung und Beruf der Eltern | Höchster Schulabschluss und berufliche Stellung Vater und Mutter | Berufliche Stellung zum 13. Lebensjahr der Befragten | DS 2010 |
Daten
Die folgenden Analysen beruhen auf dem Datensatz zur Halbzeit der Basiserhebung der NAKO Gesundheitsstudie. Der Datensatz enthält Informationen zu Teilnehmenden, die zwischen März 2014 und März 2017 in insgesamt 18 Studienzentren die Basisuntersuchung absolviert haben. Allgemeine Angaben zum Studiendesign, zu Ethikvotum und Datenschutz der NAKO sind an anderer Stelle zu finden [
1]. Eine Beschreibung der hier verwendeten Stichprobe zur Halbzeit der Basiserhebung und eine detaillierte Beschreibung der Responseraten werden im Beitrag von Schipf et al. in diesem Themenheft präsentiert. Die dort berichtete mittlere Responserate betrug zur Halbzeit 18 %, variierte jedoch mit dem Alter.
Studienpopulation
Der Datensatz für diese Analyse beinhaltet n = 101.724 Fälle. Zur Formung der für diese Auswertungen verwendeten Studienpopulation wurden alle nicht vollständig und ordnungsgemäß abgeschlossenen Interviews von den Analysen ausgeschlossen (n = 63). Es wurden zudem weitere 10 Fälle ausgeschlossen, die bei der Altersvariable Werte außerhalb des plausiblen Wertebereichs aufwiesen. So ergab sich für die Auswertungen eine Stichprobe von n = 101.651 Fällen. Die in diese Stichprobe eingeschlossenen Personen waren zum Zeitpunkt der Untersuchung zwischen 20 und 73 Jahre alt. Alle Teilnehmenden waren in Übereinstimmung mit dem Studienprotokoll bei Stichprobenziehung maximal 69 Jahre alt.
Variablen
Die hier untersuchten Variablen umfassen Informationen zu Alter, Geschlecht, Bildung, Familienstand, Partnerschaft, Wohnsituation, Erwerbsstatus, Beruf, Body-Mass-Index (BMI) und selbst berichteter Gesundheit. Abgeleitete und zusammengefasste Variablen werden im Folgenden beschrieben.
Statistische Analysen
In einem ersten Schritt wurde die Verteilung soziodemografischer und erwerbsbezogener Merkmale in der NAKO-Teilpopulation stratifiziert nach Geschlecht und Studienzentrum beschrieben. Absolute sowie relative Häufigkeiten wurden zur Deskription von kategorialen Merkmalen verwendet und Mittelwerte (MW), Standardabweichungen (SD) sowie Mediane und Interquartilsabstände (IQR) zur Beschreibung von kontinuierlichen Merkmalen. Um die Messung soziodemografischer und erwerbsbezogener Merkmale hinsichtlich ihrer Validität zu beurteilen, wurden exemplarisch Zusammenhänge mit dem BMI und selbst berichteter Gesundheit analysiert. Hierfür wurde die Häufigkeit von Untergewicht, Adipositas und schlechter selbst berichteter Gesundheit nach Geschlecht, Alter, Bildung, Familienstand, Partnerschaft, Erwerbsstatus, Umfang der Erwerbstätigkeit und Berufsstand deskriptiv dargestellt. Abschließend wurde exemplarisch der Zusammenhang zwischen Bildung und den Gesundheitsvariablen adjustiert für Alter und Studienzentrum, getrennt für Männer und Frauen, mithilfe von Marginsplots dargestellt. Alle Analysen wurden mit Stata 15.1 MP durchgeführt (StataCorp LLC, College Station, TX, USA).
Diskussion
Die NAKO Gesundheitsstudie erhebt eine Reihe relevanter soziodemografischer Variablen, die sowohl als Kontrollvariablen für allgemeine Analysen als auch für spezifische sozialepidemiologische Forschung auf international konkurrenzfähigem Niveau verwendet werden sollen. Neben einer technischen Darstellung der zu diesem Zweck verwendeten Instrumente wurde in diesem Beitrag – zunächst theoretisch-methodisch – bewertet, ob dieser Anspruch eingelöst werden kann.
Die eingesetzten Instrumente zur Messung soziodemografischer Merkmale in der NAKO umfassen Geschlecht, Alter, Familienstand, Partnerschaft, Anzahl leiblicher Kinder, Wohnsituation, Haushaltsgröße (Zahl der Personen gesamt und 14 Jahre oder älter), Einkommen sowie die Abfrage des höchsten schulischen und beruflichen Ausbildungsabschlusses. Die Erfassung erfolgte weitgehend in Übereinstimmung mit den vom Statistischen Bundesamt herausgegebenen Demographischen Standards [
27] und erlaubt somit direkte Vergleiche mit dem Mikrozensus sowie mit anderen Gesundheitsstudien in Deutschland wie DEGS, CARLA, GEDA, HNR, CORA, Life-Adult und SHIP [
36,
37]. Zudem ermöglicht die Erfassung der schulischen und beruflichen Bildungsabschlüsse die Ableitung der hierarchischen, international vergleichbaren ISCED-Skala [
32]. Nach erfolgter Codierung der offenen Berufsabfrage wird in Zukunft auch die Bestimmung der beruflichen Stellung nach Standards wie dem Erikson-Goldthorpe-Portocarero-Schema (EGP) möglich sein [
38]. Ebenso ist durch die Abfrage der Haushaltszusammensetzung die Ableitung des haushaltsgewichteten Nettoäquivalenzeinkommens gegeben [
28]. Letztendlich sind mit Bildung, Einkommen und beruflicher Stellung die wichtigsten Indikatoren zur Bestimmung der sozioökonomischen Position abgedeckt.
In der NAKO wurden zudem weitere Informationen zur Erwerbstätigkeit erfasst. Dazu zählen der Erwerbsstatus nach international vergleichbarem Labour-Force-Konzept [
33], der Umfang der Wochenarbeitsstunden und der aktuelle bzw. zuletzt ausgeübte Beruf. Weiter existieren Module, die detailliertere Informationen zu Rente und Erwerbslosigkeit sowie zu Bildung und Beruf des Partners und der Eltern erfassen. Hierdurch bietet die NAKO auch Potenzial für die Lebenslaufepidemiologie, die sich mit Gesundheit und Krankheit in Abhängigkeit von Faktoren wie der Erwerbsbiografie oder sozialer Mobilität befasst [
39].
Insgesamt ist die NAKO hinsichtlich der Erhebung soziodemografischer Merkmale nicht nur mit den bereits erwähnten Gesundheitsstudien aus Deutschland, sondern auch mit internationalen Studien ähnlichen Aufbaus wie CONSTANCES [
18], LifeLines [
19], CONOR [
21], LifeGene [
20] und der UK Biobank [
22] vergleichbar. Einschränkend ist jedoch anzumerken, dass die Abfrage der Merkmale im persönlichen Interview eine Begrenzung der Fragenanzahl nötig machte, um die zeitliche Belastung der Befragten in Grenzen zu halten. Daher ist die Tiefe der Abfrage an manchen Stellen geringer als in den Vorlagen der Demographischen Standards (z. B. fehlen eine Abfrage des Wirtschaftszweigs der aktuellen oder letzten beruflichen Tätigkeit und eine genaue Abfrage der Haushaltszusammensetzung).
Um neben der qualitativen Einordnung auch einen ersten quantitativen Eindruck von der NAKO zu erhalten, wurden Analysen mit dem Datensatz zur Halbzeit der Datenerhebung durchgeführt. Bei der Beschreibung der sozialstrukturellen Zusammensetzung der NAKO fanden wir weitgehend die erwarteten Verteilungen. So war beispielsweise der Anteil von Einpersonenhaushalten in Studienzentren mit urbaner Lage höher als bei weniger urbaner Lage. Ein Vergleich der Studienzentren zeigte zudem eine höhere Quote an Erwerbslosen in ostdeutschen Gebieten im Vergleich zu westdeutschen Standorten. Ein weiteres Beispiel ist, dass bei den Frauen ein höherer Anteil an Verwitweten, Nichterwerbstätigen und Teilzeitbeschäftigten zu verzeichnen war. Diese Verteilungen spiegeln bekannte regionale bzw. soziodemografische Verteilungsmuster in Deutschland wider, was als Hinweis für die Validität der Messung gewertet werden kann [
30,
40,
41]. Eine systematische Prüfung der soziodemografischen Repräsentativität der Stichprobe im Vergleich zur Grundgesamtheit der in Deutschland lebenden Bevölkerung wird zu einem späteren Zeitpunkt erfolgen, sobald die Basiserhebung abgeschlossen ist und somit die Gesamtstichprobe verfügbar ist. Erste testweise Vergleiche des Datensatzes zur Halbzeit der Basiserhebung mit dem Mikrozensus deuten auf einen tendenziell höheren Anteil an Frauen, Höhergebildeten und Älteren in der NAKO hin [
30]. Da bekannt ist, dass entsprechende soziodemografische Merkmale mit einer höheren Teilnahmebereitschaft an Gesundheitsstudien einhergehen, sollte das Ausmaß möglicher Stichprobenverzerrungen mit Vorliegen des vollständigen Datensatzes untersucht werden [
42]. Eine ausführlichere Diskussion hierzu findet sich im Beitrag von Schipf et al. in diesem Themenheft.
Abschließend wurden Analysen zur Kriteriumsvalidität durchgeführt und exemplarische Untersuchungen hinsichtlich des Zusammenhangs soziodemografischer Merkmale mit der Häufigkeit von Untergewicht, Adipositas und selbst berichteter Gesundheit angestellt. Wir fanden ausgeprägte Alters- und Bildungsgradienten und konnten somit bereits bekannte Gesundheitszusammenhänge mit den Daten der NAKO replizieren [
24‐
26]. Dies spricht für eine inhaltliche Validität der in der NAKO erhobenen soziodemografischen und erwerbsbezogenen Instrumente.
Als Fazit bleibt festzuhalten, dass mit der NAKO eine neue Ressource für die sozialepidemiologische Forschung in Deutschland entsteht. Hinsichtlich der Messung soziodemografischer und erwerbsbezogener Faktoren kann eine Detailtiefe attestiert werden, die Vergleiche mit wichtigen nationalen und internationalen bevölkerungsbasierten Kohortenstudien und die Anwendung zentraler Konzepte der Ungleichheitsforschung erlaubt. Durch die Verknüpfung dieser Konzepte mit klinischen Parametern wie Laborwerten, Bildgebungsverfahren, Körperfunktionstests und inzidenten Erkrankungen im Follow-up hat die NAKO das Potenzial, wegweisende Forschung zu ermöglichen.
Einhaltung ethischer Richtlinien
Alle Teilnehmenden wurden ausführlich aufgeklärt und haben schriftlich ihr informiertes Einverständnis zur Studienteilnahme gegeben. Das Untersuchungsprogramm wurde im Einklang mit nationalem Recht sowie gemäß der Deklaration von Helsinki von 1975 (in der aktuellen, überarbeiteten Fassung) durchgeführt.
Open Access Dieser Artikel wird unter der Creative Commons Namensnennung 4.0 International Lizenz veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden.
Die in diesem Artikel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Commons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen Rechteinhabers einzuholen.