L'intelligenza artificiale si sta rivelando eccezionalmente utile per diagnosticare malattie da immagini mediche, come le radiografie, su larga scala. Tuttavia, gli strumenti di IA non sono sempre in grado di riconoscere le proprie imprecisioni.
In risposta, Google ha sviluppato un nuovo sistema di intelligenza artificiale chiamato Complementarity-driven Deferral-to-Clinical Workflow (CoDoC), in grado di discernere quando fidarsi delle diagnosi basate sull'intelligenza artificiale e chiedere un secondo parere a un medico umano.
Secondo lo studioCoDoC riduce il carico di lavoro dell'analisi dei dati delle scansioni mediche di 66%, ma rileva anche quando una decisione dell'intelligenza artificiale è potenzialmente sbagliata, riducendo i falsi positivi di 25%.
CoDoC lavora in parallelo con i sistemi di intelligenza artificiale esistenti, tipicamente utilizzati per interpretare immagini mediche come radiografie del torace o mammografie.
Ad esempio, se uno strumento di intelligenza artificiale sta interpretando una mammografia, la CoDoC valuta se la fiducia percepita dallo strumento nella sua analisi è abbastanza forte da potervi fare affidamento. In caso di ambiguità, la CoDoC richiede un secondo parere a un esperto umano.
Ecco come funziona:
- Per addestrare CoDoC, Google ha preso i dati dagli strumenti di intelligenza artificiale clinica esistenti e li ha confrontati con l'interpretazione delle stesse immagini da parte di un medico umano. Il modello è stato ulteriormente convalidato con la post-analisi dei dati tramite biopsia o altri metodi.
- Questo processo consente alla CoDoC di apprendere e comprendere l'accuratezza dell'analisi e dei livelli di confidenza di uno strumento di IA rispetto ai medici umani.
- Una volta addestrato, il CoDoC può giudicare se l'analisi delle scansioni da parte dell'IA è affidabile o se è necessaria una revisione umana.
Alan Karthikesalingam di Google Health UK, che ha partecipato alla ricerca, dettoSe si utilizza CoDoC insieme allo strumento AI e ai risultati di un radiologo reale, e CoDoC aiuta a decidere quale parere utilizzare, l'accuratezza risultante è migliore rispetto alla persona o allo strumento AI da soli".
Ulteriori test di CoDoC sono stati condotti utilizzando diversi set di dati mammografici e radiografici per lo screening della tubercolosi con vari sistemi di intelligenza artificiale predittiva, ottenendo risultati positivi.
Krishnamurthy Dvijotham di Google DeepMind ha osservato: "Il vantaggio di CoDoC è che è interoperabile con una varietà di sistemi di IA proprietari".
Tuttavia, Helen Salisbury dell'Università di Oxford sottolinea che alcuni processi diagnostici medici sono più complessi di quelli con cui è stato testato il CoDoC. Dice: "Per i sistemi in cui non si ha la possibilità di influenzare, post-hoc, ciò che esce dalla scatola nera, sembra una buona idea aggiungere l'apprendimento automatico. Non so se questo avvicini l'IA che sarà con noi tutto il giorno, tutti i giorni, per il nostro lavoro di routine".
Come sottolineato dai ricercatori, l'interoperabilità di CoDoC consente di inserirlo in diversi flussi di lavoro diagnostici.
AI sistemi I possono collaborare con i sistemi AI per migliorare la loro precisione. Come dice il proverbio, quattro occhi vedono più di due.