Skip to main content
Erschienen in: European Archives of Oto-Rhino-Laryngology 4/2024

12.09.2023 | Laryngology

Validity and reliability of an instrument evaluating the performance of intelligent chatbot: the Artificial Intelligence Performance Instrument (AIPI)

verfasst von: Jerome R. Lechien, Antonino Maniaci, Isabelle Gengler, Stephane Hans, Carlos M. Chiesa-Estomba, Luigi A. Vaira

Erschienen in: European Archives of Oto-Rhino-Laryngology | Ausgabe 4/2024

Einloggen, um Zugang zu erhalten

Abstract

Objectives

To evaluate the reliability and validity of the Artificial Intelligence Performance Instrument (AIPI).

Methods

Medical records of patients consulting in otolaryngology were evaluated by physicians and ChatGPT for differential diagnosis, management, and treatment. The ChatGPT performance was rated twice using AIPI within a 7-day period to assess test–retest reliability. Internal consistency was evaluated using Cronbach’s α. Internal validity was evaluated by comparing the AIPI scores of the clinical cases rated by ChatGPT and 2 blinded practitioners. Convergent validity was measured by comparing the AIPI score with a modified version of the Ottawa Clinical Assessment Tool (OCAT). Interrater reliability was assessed using Kendall’s tau.

Results

Forty-five patients completed the evaluations (28 females). The AIPI Cronbach’s alpha analysis suggested an adequate internal consistency (α = 0.754). The test–retest reliability was moderate-to-strong for items and the total score of AIPI (rs = 0.486, p = 0.001). The mean AIPI score of the senior otolaryngologist was significantly higher compared to the score of ChatGPT, supporting adequate internal validity (p = 0.001). Convergent validity reported a moderate and significant correlation between AIPI and modified OCAT (rs = 0.319; p = 0.044). The interrater reliability reported significant positive concordance between both otolaryngologists for the patient feature, diagnostic, additional examination, and treatment subscores as well as for the AIPI total score.

Conclusions

AIPI is a valid and reliable instrument in assessing the performance of ChatGPT in ear, nose and throat conditions. Future studies are needed to investigate the usefulness of AIPI in medicine and surgery, and to evaluate the psychometric properties in these fields.
Anhänge
Nur mit Berechtigung zugänglich
Literatur
4.
Zurück zum Zitat Choi JH, Hickman KE, Monahan A, Schwarcz D (2023) ChatGPT goes to law school? Minnesota legal studies research paper No. 23-03 Choi JH, Hickman KE, Monahan A, Schwarcz D (2023) ChatGPT goes to law school? Minnesota legal studies research paper No. 23-03
7.
Zurück zum Zitat Lechien JR, Georgescu BM, Hans S, Chiesa-Estomba CM (2023) ChatGPT performance in laryngology and head & neck surgery: a clinical case-series. Eur Arch Otorhinolaryngol Lechien JR, Georgescu BM, Hans S, Chiesa-Estomba CM (2023) ChatGPT performance in laryngology and head & neck surgery: a clinical case-series. Eur Arch Otorhinolaryngol
9.
Zurück zum Zitat Task Force for the Development of Student Clinical Performance Instruments, American Physical Therapy Association (2002) The development and testing of APTA clinical performance instruments. Phys Ther 82(4):329–353 Task Force for the Development of Student Clinical Performance Instruments, American Physical Therapy Association (2002) The development and testing of APTA clinical performance instruments. Phys Ther 82(4):329–353
11.
Zurück zum Zitat Jubraj B, Patel S, Naseem I, Copp S, Karagkounis D (2017) The acute care assessment tool: pharmacy ACAT. Clin Teach 14:184e8CrossRef Jubraj B, Patel S, Naseem I, Copp S, Karagkounis D (2017) The acute care assessment tool: pharmacy ACAT. Clin Teach 14:184e8CrossRef
13.
Zurück zum Zitat Gercama AJ, de Haan M, van der Vleuten CPM (2000) Reliability of the Amsterdam clinical challenge scale (ACCS): a new instrument to assess the level of difficulty of patient cases in medical education. Med Educ 34(7):519–524CrossRefPubMed Gercama AJ, de Haan M, van der Vleuten CPM (2000) Reliability of the Amsterdam clinical challenge scale (ACCS): a new instrument to assess the level of difficulty of patient cases in medical education. Med Educ 34(7):519–524CrossRefPubMed
17.
20.
Zurück zum Zitat Vasileiou I, Giannopoulos A, Klonaris C, Vlasis K, Marinos S, Koutsonasios I, Katsargyris A, Konstantopoulos K, Karamoutsos C, Tsitsikas A, Marinos G (2009) The potential role of primary care in the management of common ear, nose or throat disorders presenting to the emergency department in Greece. Qual Prim Care 17(2):145–148PubMed Vasileiou I, Giannopoulos A, Klonaris C, Vlasis K, Marinos S, Koutsonasios I, Katsargyris A, Konstantopoulos K, Karamoutsos C, Tsitsikas A, Marinos G (2009) The potential role of primary care in the management of common ear, nose or throat disorders presenting to the emergency department in Greece. Qual Prim Care 17(2):145–148PubMed
21.
Zurück zum Zitat Millstein J, Agarwal A (2023) What can doctors and patients do with ChatGPT? | Expert Opinion. Philadelphia Inquirer Millstein J, Agarwal A (2023) What can doctors and patients do with ChatGPT? | Expert Opinion. Philadelphia Inquirer
Metadaten
Titel
Validity and reliability of an instrument evaluating the performance of intelligent chatbot: the Artificial Intelligence Performance Instrument (AIPI)
verfasst von
Jerome R. Lechien
Antonino Maniaci
Isabelle Gengler
Stephane Hans
Carlos M. Chiesa-Estomba
Luigi A. Vaira
Publikationsdatum
12.09.2023
Verlag
Springer Berlin Heidelberg
Erschienen in
European Archives of Oto-Rhino-Laryngology / Ausgabe 4/2024
Print ISSN: 0937-4477
Elektronische ISSN: 1434-4726
DOI
https://doi.org/10.1007/s00405-023-08219-y

Weitere Artikel der Ausgabe 4/2024

European Archives of Oto-Rhino-Laryngology 4/2024 Zur Ausgabe

Betalaktam-Allergie: praxisnahes Vorgehen beim Delabeling

16.05.2024 Pädiatrische Allergologie Nachrichten

Die große Mehrheit der vermeintlichen Penicillinallergien sind keine. Da das „Etikett“ Betalaktam-Allergie oft schon in der Kindheit erworben wird, kann ein frühzeitiges Delabeling lebenslange Vorteile bringen. Ein Team von Pädiaterinnen und Pädiatern aus Kanada stellt vor, wie sie dabei vorgehen.

Eingreifen von Umstehenden rettet vor Erstickungstod

15.05.2024 Fremdkörperaspiration Nachrichten

Wer sich an einem Essensrest verschluckt und um Luft ringt, benötigt vor allem rasche Hilfe. Dass Umstehende nur in jedem zweiten Erstickungsnotfall bereit waren, diese zu leisten, ist das ernüchternde Ergebnis einer Beobachtungsstudie aus Japan. Doch es gibt auch eine gute Nachricht.

Real-World-Daten sprechen eher für Dupilumab als für Op.

14.05.2024 Rhinosinusitis Nachrichten

Zur Behandlung schwerer Formen der chronischen Rhinosinusitis mit Nasenpolypen (CRSwNP) stehen seit Kurzem verschiedene Behandlungsmethoden zur Verfügung, darunter Biologika, wie Dupilumab, und die endoskopische Sinuschirurgie (ESS). Beim Vergleich der beiden Therapieoptionen war Dupilumab leicht im Vorteil.

Schwindelursache: Massagepistole lässt Otholiten tanzen

14.05.2024 Benigner Lagerungsschwindel Nachrichten

Wenn jüngere Menschen über ständig rezidivierenden Lagerungsschwindel klagen, könnte eine Massagepistole der Auslöser sein. In JAMA Otolaryngology warnt ein Team vor der Anwendung hochpotenter Geräte im Bereich des Nackens.

Update HNO

Bestellen Sie unseren Fach-Newsletter und bleiben Sie gut informiert – ganz bequem per eMail.