L’algoritmo di diagnostica medica identifica la polmonite nelle immagini radiografiche pediatriche
La medicina digitale sta aprendo possibilità completamente nuove. Ad esempio, può rilevare i tumori in una fase iniziale. Ma l’efficacia dei nuovi algoritmi di intelligenza artificiale dipende dalla quantità e dalla qualità dei dati utilizzati per addestrarli.
Per massimizzare il pool di dati, è consuetudine condividere i dati dei pazienti tra le cliniche inviando copie dei database alle cliniche in cui viene addestrato l’algoritmo. Ai fini della protezione dei dati, il materiale viene solitamente sottoposto a processi di anonimizzazione e pseudonimizzazione, una procedura che è stata anche oggetto di critiche. “Questi processi si sono spesso dimostrati inadeguati in termini di protezione dei dati sanitari dei pazienti”, afferma Daniel Rueckert, professore di intelligenza artificiale Alexander von Humboldt in sanità e medicina presso TUM.
Gli algoritmi intelligenti supportano i medici
Per affrontare questo problema, un team interdisciplinare del TUM ha lavorato con i ricercatori dell’Imperial College di Londra e dell’organizzazione no profit OpenMined per sviluppare una combinazione unica di processi diagnostici basati sull’intelligenza artificiale per i dati delle immagini radiologiche che salvaguardano la riservatezza dei dati. In un documento pubblicato su Nature Machine Intelligence , il team ha ora presentato un’applicazione di successo: un algoritmo di apprendimento profondo che aiuta a classificare le condizioni di polmonite nelle radiografie dei bambini.
“Abbiamo testato i nostri modelli con radiologi specializzati. In alcuni casi i modelli hanno mostrato un’accuratezza paragonabile o migliore nella diagnosi di vari tipi di polmonite nei bambini”, afferma il Prof. Marcus R. Makowski, Direttore del Dipartimento di Radiologia Diagnostica e Interventistica presso il Klinikum rechts der Isar di TUM.
I dati rimangono in loco
“Per mantenere i dati dei pazienti al sicuro, non dovrebbero mai lasciare la clinica in cui sono stati raccolti”, afferma il leader del progetto e primo autore Georgios Kaissis del TUM Institute of Medical Informatics, Statistics and Epidemiology. “Per il nostro algoritmo abbiamo utilizzato l’apprendimento federato, in cui l’algoritmo di apprendimento profondo è condiviso, e non i dati. I nostri modelli sono stati addestrati nei vari ospedali utilizzando i dati locali e poi restituiti a noi. Pertanto, i proprietari dei dati non dovevano farlo condividere i propri dati e mantenere il controllo completo “, afferma il primo autore Alexander Ziller, ricercatore presso l’Istituto di radiologia.
I dati non possono essere ricondotti a individui
Per impedire l’identificazione delle istituzioni in cui l’algoritmo è stato addestrato, il team ha applicato un’altra tecnica: l’aggregazione sicura. “Abbiamo combinato gli algoritmi in forma crittografata e li abbiamo decrittografati solo dopo che sono stati addestrati con i dati di tutte le istituzioni partecipanti”, afferma Kaissis. E per garantire la “privacy differenziale”, ovvero impedire che i dati dei singoli pazienti vengano filtrati dai record di dati, i ricercatori hanno utilizzato una terza tecnica durante l’addestramento dell’algoritmo. “In definitiva, le correlazioni statistiche possono essere estratte dai record di dati, ma non dai contributi delle singole persone”, afferma Kaissis.
Prima combinazione in assoluto di metodi di protezione della privacy
“I nostri metodi sono stati applicati in altri studi”, afferma Daniel Rueckert. “Ma non abbiamo ancora visto studi su larga scala utilizzando dati clinici reali. Attraverso lo sviluppo mirato di tecnologie e la cooperazione tra specialisti in informatica e radiologia, siamo riusciti a formare modelli che forniscono risultati precisi rispettando elevati standard di protezione dei dati e privacy. ”
Rickmer Braren, il vicedirettore del Dipartimento di radiologia diagnostica e interventistica osserva: “Si è spesso affermato che la protezione dei dati e l’utilizzo dei dati devono essere sempre in conflitto. Ma ora stiamo dimostrando che questo non deve essere vero”. Gli scienziati aggiungono che il loro metodo può essere applicato ad altri dati medici e non solo ai raggi X. Ad esempio discorso e testo.
La protezione dei dati apre un enorme potenziale per la medicina digitale
La combinazione dei più recenti processi di protezione dei dati faciliterà anche la cooperazione tra le istituzioni, come ha dimostrato il team in un documento pubblicato su Nature Machine Intelligence nel 2020. Il loro metodo AI per la tutela della privacy può superare ostacoli etici, legali e politici, aprendo così la strada a uso diffuso dell’IA, afferma Braren. E questo è estremamente importante per la ricerca sulle malattie rare.
Gli scienziati sono convinti che la loro tecnologia, salvaguardando la sfera privata dei pazienti, possa dare un contributo importante al progresso della medicina digitale. “Per addestrare buoni algoritmi AI, abbiamo bisogno di buoni dati”, afferma Kaissis. “E possiamo ottenere questi dati solo proteggendo adeguatamente la privacy dei pazienti”, aggiunge Rueckert. “Questo dimostra che, con la protezione dei dati, possiamo fare molto di più per la conoscenza avanzata di quanto molti pensano”.
Ulteriori informazioni:
Con la nomina nel 2020 del Professor Daniel Rueckert di Alexander von Humboldt e del nuovo Direttore del Dipartimento di Radiologia Diagnostica e Interventistica Prof. Marcus R. Makowski, TUM ha decisamente rafforzato le proprie attività nella ricerca sull’IA e le sue applicazioni in radiologia.