New York Eye and Ear Infirmary of Mount Sinai (NYEE) demonstrerede, hvordan GPT-4 kan matche eller overgå menneskelige øjenlæger i diagnosticering og behandling af øjensygdomme.
Resultaterne, der er beskrevet i en undersøgelse offentliggjort i JAMA Ophthalmology, diskuterer, hvordan AI kan hjælpe øjenlæger i deres beslutningsprocesser.
Forskerteamet på Mount Sinai bestod af 12 speciallæger og tre ledende praktikanter fra Department of Ophthalmology på Icahn School of Medicine.
De sammenlignede svarene fra både den kunstige intelligens og menneskelige specialister på et sæt spørgsmål og patienttilfælde relateret til grøn stær og nethindesygdomme. GPT-4's svar blev evalueret og viste sig at matche eller overgå de menneskelige specialisters, især inden for grøn stær.
Her er lidt flere detaljer om, hvordan det fungerede:
- Opsætning af undersøgelse: Forskningen blev udført med et team på 15 øjenlæger på Mount Sinai Department of Ophthalmology, som bestod af overlæger og seniorpraktikanter med speciale i grøn stær og nethindesygdomme.
- Indsamling af data: Til evalueringen brugte teamet et velafrundet sæt af 20 oftalmologiske spørgsmål (ligeligt fordelt mellem glaukom- og nethindeemner) og 20 patientcases, der blev anonymiseret for at bevare privatlivets fred. Disse blev udvalgt for at afspejle en række cases fra Mount Sinai-klinikker.
- Brug af AI: OpenAI's GPT-4 blev bedt om at besvare spørgsmålene og analysere patienttilfældene. AI'en forsøgte at svare som en praktiserende øjenlæge og brugte klinisk stenografi, hvor det var relevant, for at afspejle den kortfattede stil, der er typisk for kliniske notater.
- Evaluering: Undersøgelsen anvendte et bedømmelsessystem til at vurdere både nøjagtigheden og fuldstændigheden af svarene fra GPT-4 og de menneskelige specialister. Det gav mulighed for en direkte sammenligning af AI'ens præstation med uddannede fagfolks.
- Resultater af glaukom: I forbindelse med grøn stær gav GPT-4 meget præcise og mere omfattende svar end de menneskelige specialister. Dette indikerer GPT-4's stærke evne til at forstå og rådgive om glaukomtilfælde, hvilket potentielt kan give værdifuld støtte til øjenlæger i denne subspecialitet.
- Resultater fra nethinden: Ved nethinde-relaterede forespørgsler og patientscenarier matchede GPT-4 menneskelige specialister og demonstrerede sin evne til at diagnosticere og anbefale behandlinger af nethindesygdomme korrekt. Desuden gav GPT-4 ofte mere udførlige svar, hvilket tyder på en grundig analyse og forståelse af sagerne, hvilket kan være særligt gavnligt ved håndtering af mere komplekse eller nuancerede patientsituationer.
Dr. Andy Huang, der er reservelæge i oftalmologi på NYEE og undersøgelsens hovedforfatter, delte sin indsigt"GPT-4's præstationer i vores undersøgelse var en øjenåbner. Vi indså det enorme potentiale i dette AI-system fra det øjeblik, vi begyndte at teste det, og vi var fascinerede over at se, at GPT-4 ikke bare kunne assistere, men i nogle tilfælde matche eller overgå erfarne øjenlægers ekspertise."
Dr. Louis R. Pasquale, næstformand for oftalmologisk forskning og seniorforfatter på undersøgelsen, var også imponeret over resultaterne og sagde: "AI var især overraskende i sin evne til at håndtere både glaukom- og nethindepatientsager og matchede nøjagtigheden og fuldstændigheden af diagnoser og behandlingsforslag fra menneskelige læger i et klinisk notatformat."
"Ligesom AI-programmet Grammarly kan lære os at blive bedre til at skrive, kan GPT-4 give os værdifuld vejledning i, hvordan vi bliver bedre klinikere, især med hensyn til, hvordan vi dokumenterer resultaterne af patientundersøgelser."
Dr. Huang ser en fremtid for kunstig intelligens inden for oftalmologi og bemærker dens potentiale til at støtte øjenlæger ved at yde diagnostisk assistance og reducere deres arbejdsbyrde, især i komplekse tilfælde.
AI har taget godt imod applikationer inden for øjensundhed, som f.eks. i 2018 til 2020, hvor DeepMind brugte maskinlæring til nøjagtigt at analysere tredimensionel optisk kohærens-tomografi (OCT) i høj opløsning for at diagnosticere adskillige tilstande.
I 2023 udviklede forskere en AI-model til nøjagtigt at opdage tidlige tegn på Parkinsons sygdom fra øjenscanninger.
En anden blev trænet til at opdage Parkinsons, hjertesygdomme og andre sygdomme, igen fra øjenscanninger, og en anden til opdage visse sygdomme hos spædbørnigen fra nethindescanninger.