Skip to main content
Erschienen in: Die Ophthalmologie 3/2021

28.07.2020 | Makuladegeneration | Originalien

Merkmalsextraktion aus klinischen Routinedaten mittels Text-Mining

verfasst von: Bastian Grundel, Marc-Antoine Bernardeau, Holger Langner, Christoph Schmidt, Daniel Böhringer, Marc Ritter, Paul Rosenthal, Andrea Grandjean, Stefan Schulz, Philipp Daumke, Andreas Stahl

Erschienen in: Die Ophthalmologie | Ausgabe 3/2021

Einloggen, um Zugang zu erhalten

Zusammenfassung

Hintergrund

Anti-VEGF-Medikamente prägen heute die Therapie von Makulaerkrankungen. In diesem Zusammenhang wird eine Fülle zusätzlicher Daten erhoben. Damit ließen sich Behandlungsverläufe besser verstehen und vorhersagen. Allerdings sind diese Informationen meist nur in freitextlicher Form verfügbar.

Ziel der Arbeit

Wie weit auswertbare Information aus Kliniktexten automatisch gewonnen werden kann, sollte in einer retrospektiven Studie analysiert werden. Ziel war die Einschätzung der Eignung eines zu diesem Zweck parametrierten Text-Mining-Verfahrens.

Material und Methoden

Es standen Daten zu 3683 Patienten zur Verfügung, davon 40.485 Arztbriefe. Für einen Teil waren die interessierenden Daten (Visus, Tensio und Begleitdiagnosen) auch strukturiert erfasst worden und konnten so als Goldstandard für die Textanalyse dienen. Diese wurde mit dem System Averbis Health Discovery durchgeführt. Zur Optimierung auf die Extraktionsaufgabe wurde dieses mit Regelwissen sowie mit einem deutschsprachigen Fachvokabular für die internationale Medizinterminologie SNOMED CT angereichert.

Ergebnisse

Die Übereinstimmung der Datenextrakte mit den strukturierten Datenbankeinträgen wird durch den F1-Wert beschrieben. Hierbei ergab sich eine Übereinstimmung von 94,7 % für den Visus, 98,3 % für die Tensio und 94,7 % für begleitende Diagnosen. Die manuelle Analyse nicht übereinstimmender Fälle zeigte zur Hälfte, dass Textinhalte aus verschiedenen Gründen von Datenbankinhalten abwichen. Nach einer daraus berechneten Adjustierung lagen die F1-Werte noch 1–3 % über den zuvor ermittelten Werten.

Diskussion

Für den betrachteten Arztbriefkorpus und die beschriebene Fragestellung sind Text-Mining-Verfahren sehr gut geeignet, um Inhalte zur weiteren Auswertung strukturiert aus Kliniktexten zu extrahieren.
Fußnoten
2
Die Terminologie steht auf den Seiten der Averbis GmbH (Freiburg, Deutschland) kostenfrei zum Download zur Verfügung: https://​topos.​averbis.​de/​.
 
4
Auf Wunsch kann ein Zugang zu einer webbasierten Averbis Health Discovery-Instanz eingerichtet werden, worin dann die TOPOS-Extraktionspipeline getestet werden kann.
 
5
Über die Averbis-Homepage kostenlos verfügbar.
 
Literatur
1.
Zurück zum Zitat Griffon N, Charlet J, Darmoni SJ (2014) Managing free text for secondary use of health data. Yearb Med Inform 9:167–169CrossRef Griffon N, Charlet J, Darmoni SJ (2014) Managing free text for secondary use of health data. Yearb Med Inform 9:167–169CrossRef
2.
Zurück zum Zitat Schlegel DR, Ficheur G (2017) Secondary use of patient data: review of the literature published in 2016. Yearb Med Inform 26(1):68–71CrossRef Schlegel DR, Ficheur G (2017) Secondary use of patient data: review of the literature published in 2016. Yearb Med Inform 26(1):68–71CrossRef
3.
Zurück zum Zitat Safran C, Bloomrosen M, Hammond WE, Labkoff S, Markel-Fox S, Tang PC et al (2007) Toward a national framework for the secondary use of health data: an American Medical Informatics Association White Paper. J Am Med Inform Assoc 14(1):1–9CrossRef Safran C, Bloomrosen M, Hammond WE, Labkoff S, Markel-Fox S, Tang PC et al (2007) Toward a national framework for the secondary use of health data: an American Medical Informatics Association White Paper. J Am Med Inform Assoc 14(1):1–9CrossRef
4.
Zurück zum Zitat Wang Y, Wang L, Rastegar-Mojarad M, Moon S, Shen F, Afzal N et al (2018) Clinical information extraction applications: a literature review. J Biomed Inform 77:34–49CrossRef Wang Y, Wang L, Rastegar-Mojarad M, Moon S, Shen F, Afzal N et al (2018) Clinical information extraction applications: a literature review. J Biomed Inform 77:34–49CrossRef
5.
Zurück zum Zitat Böhringer D, Lang SJ, Daniel MC, Lapp T, Reinhard T (2019) Automatisierte Zuordnung von ICD- und Alpha-ID-Codes zu „Real-World“-Arztbriefdiagnosen durch die „word2vec“-Methode. Klin Monbl Augenheilkd 236(12):1413–1417CrossRef Böhringer D, Lang SJ, Daniel MC, Lapp T, Reinhard T (2019) Automatisierte Zuordnung von ICD- und Alpha-ID-Codes zu „Real-World“-Arztbriefdiagnosen durch die „word2vec“-Methode. Klin Monbl Augenheilkd 236(12):1413–1417CrossRef
6.
Zurück zum Zitat Névéol A, Dalianis H, Velupillai S, Savova G, Zweigenbaum P (2018) Clinical natural language processing in languages other than English: opportunities and challenges. J Biomed Semantics 9(1):12CrossRef Névéol A, Dalianis H, Velupillai S, Savova G, Zweigenbaum P (2018) Clinical natural language processing in languages other than English: opportunities and challenges. J Biomed Semantics 9(1):12CrossRef
7.
Zurück zum Zitat Bodenreider O, Cornet R, Vreeman DJ (2018) Recent developments in clinical terminologies – SNOMED CT, LOINC, and Rxnorm. Yearb Med Inform 27(1):129–139CrossRef Bodenreider O, Cornet R, Vreeman DJ (2018) Recent developments in clinical terminologies – SNOMED CT, LOINC, and Rxnorm. Yearb Med Inform 27(1):129–139CrossRef
8.
Zurück zum Zitat Pokora RM, Le Cornet L, Daumke P, Mildenberger P, Zeeb H, Blettner M (2020) Validation of Semantic Analyses of Unstructured Medical Data for Research Purposes. Gesundheitswesen 82(S02):S158–S164 Pokora RM, Le Cornet L, Daumke P, Mildenberger P, Zeeb H, Blettner M (2020) Validation of Semantic Analyses of Unstructured Medical Data for Research Purposes. Gesundheitswesen 82(S02):S158–S164
9.
Zurück zum Zitat Kluegl P, Toepfer M, Beck PD, Fette G, Puppe F (2016) UIMA Ruta: rapid development of rule-based information extraction applications. Nat Lang Eng 22(1):1–40CrossRef Kluegl P, Toepfer M, Beck PD, Fette G, Puppe F (2016) UIMA Ruta: rapid development of rule-based information extraction applications. Nat Lang Eng 22(1):1–40CrossRef
11.
Zurück zum Zitat Wenzel M, Dick HB, Scharrer A, Schayan K, Reinhard T (2018) Umfrage von BDOC, BVA, DGII und DOG zur ambulanten und stationären Intraokularchirurgie: Ergebnisse für das Jahr 2017. Ophthalmo-Chirurgie 30:255–266 Wenzel M, Dick HB, Scharrer A, Schayan K, Reinhard T (2018) Umfrage von BDOC, BVA, DGII und DOG zur ambulanten und stationären Intraokularchirurgie: Ergebnisse für das Jahr 2017. Ophthalmo-Chirurgie 30:255–266
13.
Zurück zum Zitat O’Mara-Eves A, Thomas J, McNaught J, Miwa M, Ananiadou S (2015) Using text mining for study identification in systematic reviews: a systematic review of current approaches. Syst Rev 4:5CrossRef O’Mara-Eves A, Thomas J, McNaught J, Miwa M, Ananiadou S (2015) Using text mining for study identification in systematic reviews: a systematic review of current approaches. Syst Rev 4:5CrossRef
14.
Zurück zum Zitat Willett DL, Kannan V, Chu L, Buchanan JR, Velasco FT, Clark JD et al (2018) SNOMED CT concept hierarchies for sharing definitions of clinical conditions using electronic health record data. Appl Clin Inform 9(3):667–682CrossRef Willett DL, Kannan V, Chu L, Buchanan JR, Velasco FT, Clark JD et al (2018) SNOMED CT concept hierarchies for sharing definitions of clinical conditions using electronic health record data. Appl Clin Inform 9(3):667–682CrossRef
15.
Zurück zum Zitat Hashemian Nik D, Kasáč Z, Goda Z, Semlitsch A, Schulz S (2019) Building an experimental German user interface terminology linked to SNOMED CT. Stud Health Technol Inform 264:153–157PubMed Hashemian Nik D, Kasáč Z, Goda Z, Semlitsch A, Schulz S (2019) Building an experimental German user interface terminology linked to SNOMED CT. Stud Health Technol Inform 264:153–157PubMed
16.
Zurück zum Zitat Shen F, Zhao Y, Wang L, Mojarad MR, Wang Y, Liu S et al (2019) Rare disease knowledge enrichment through a data-driven approach. BMC Med Inform Decis Mak 19(1):32CrossRef Shen F, Zhao Y, Wang L, Mojarad MR, Wang Y, Liu S et al (2019) Rare disease knowledge enrichment through a  data-driven approach. BMC Med Inform Decis Mak 19(1):32CrossRef
Metadaten
Titel
Merkmalsextraktion aus klinischen Routinedaten mittels Text-Mining
verfasst von
Bastian Grundel
Marc-Antoine Bernardeau
Holger Langner
Christoph Schmidt
Daniel Böhringer
Marc Ritter
Paul Rosenthal
Andrea Grandjean
Stefan Schulz
Philipp Daumke
Andreas Stahl
Publikationsdatum
28.07.2020
Verlag
Springer Medizin
Schlagwort
Makuladegeneration
Erschienen in
Die Ophthalmologie / Ausgabe 3/2021
Print ISSN: 2731-720X
Elektronische ISSN: 2731-7218
DOI
https://doi.org/10.1007/s00347-020-01177-4

Weitere Artikel der Ausgabe 3/2021

Die Ophthalmologie 3/2021 Zur Ausgabe

Neu im Fachgebiet Augenheilkunde

Open Access 22.02.2024 | Peeling | Originalien

Selektive Vitalfarbstoffe in der Makulachirurgie

Erhöhen sie die Wahrscheinlichkeit der intraoperativen ILM-Identifizierung auch bei einem erfahrenen Operateur?

Update Augenheilkunde

Bestellen Sie unseren Fach-Newsletter und bleiben Sie gut informiert.