Default Featured Image
Dire alle persone malate che sono sane può succedere quando un medico umano visita un paziente. Succede anche quando l’Intelligenza Artificiale (AI) impara a diagnosticare le malattie. Ma dare una grossa penalità a un algoritmo per i falsi negativi si traduce in una precisione molto migliore, secondo i ricercatori di UJ. La ricerca appare in Informatics in Medicine Unlocked, su https://doi.org/10.1016/j.imu.2021.100690
CREDITO : Progetto graf
  • Dire alle persone malate che sono sane può succedere quando un medico umano visita un paziente.
  • Succede anche quando l’Intelligenza Artificiale (AI) impara a diagnosticare le malattie.
  • Dare una grossa penalità a un algoritmo per i falsi negativi si traduce in una precisione molto migliore, secondo i ricercatori di UJ.

Chiunque stia aspettando i risultati di un test medico conosce la domanda ansiosa: ‘La mia vita cambierà completamente quando lo saprò?’ E il sollievo se risulta negativo.

Al giorno d’oggi, l’intelligenza artificiale (AI) è sempre più utilizzata per prevedere malattie potenzialmente letali. Ma rimane una grande sfida nell’ottenere gli algoritmi di Machine Learning (ML) sufficientemente precisi. In particolare, ottenere gli algoritmi per diagnosticare correttamente se qualcuno è malato.

Machine Learning (ML) è il ramo dell’intelligenza artificiale in cui gli algoritmi imparano dai set di dati e diventano più intelligenti nel processo.

“Diciamo che ci sia un set di dati su una malattia grave. Il set di dati ha 90 persone che non hanno la malattia. Ma 10 delle persone hanno la malattia”, afferma il dott. Ibomoiye Domor Mienye. Mienye è un ricercatore post-dottorato di intelligenza artificiale presso l’Università di Johannesburg (UJ).

“Ad esempio, un algoritmo ML dice che i 90 non hanno la malattia. Questo è corretto finora. Ma non riesce a diagnosticare i 10 che hanno la malattia. L’algoritmo è ancora considerato accurato al 90%”, afferma.

Questo perché la precisione è stata definita in questo modo. Ma per i risultati sulla salute, potrebbe essere urgente diagnosticare le 10 persone con la malattia e farle curare. Questo potrebbe essere più importante della completa accuratezza sui 90 che non hanno la condizione, aggiunge.

Sanzioni contro l’AI

In uno studio di ricerca pubblicato su Informatics in Medicine Unlocked , Mienye e il prof Yanxia Sun mostrano come gli algoritmi di machine learning possono essere migliorati in modo significativo per scopi medici. Hanno usato la regressione logistica, l’albero decisionale, XGBoost e algoritmi di foresta casuale.

Questi sono algoritmi di classificazione binaria supervisionati. Ciò significa che imparano solo dai set di dati “sì/no” forniti loro.

Il dottor Mienye e il professor Sun provengono entrambi dal Dipartimento di scienze elettriche e ingegneristiche dell’UJ.

I ricercatori hanno integrato la sensibilità ai costi in ciascuno degli algoritmi.

Ciò significa che l’algoritmo riceve una penalità molto maggiore per aver detto a una persona malata nel set di dati che è sana, rispetto al contrario. In termini medici, gli algoritmi ottengono sanzioni maggiori per i falsi negativi che per i falsi positivi.

Set di dati sulle malattie da cui l’IA apprende

Il dott. Mienye e il prof. Sun hanno utilizzato set di dati di apprendimento pubblico per diabete, cancro al seno, cancro del collo dell’utero (858 registrazioni) e malattie renali croniche (400 registrazioni).

I set di dati provengono da grandi ospedali o programmi sanitari. In questi set di dati binari, le persone sono classificate come affette da una malattia o per non averla affatto.

Anche gli algoritmi utilizzati sono binari. Questi possono dire “sì, la persona ha la malattia” o “no, non ce l’ha”. Hanno testato tutti gli algoritmi su ciascun set di dati, sia senza che con la sensibilità ai costi.

Precisione e richiamo significativamente migliorati

I risultati chiariscono che le sanzioni funzionano come previsto in questi set di dati.

Per la malattia renale cronica, ad esempio, l’algoritmo Random Forest aveva precisione a 0,972 e richiamo a 0,946, su un perfetto 1.000.

Dopo che è stata aggiunta la sensibilità al costo, l’algoritmo è migliorato in modo significativo con precisione a 0,990 e richiamo a 1.000 perfetti.

Per CKD, il richiamo degli altri tre algoritmi è migliorato da punteggi alti a 1.000 perfetti.

Precisione a 1.000 significa che l’algoritmo non ha previsto uno o più falsi positivi nell’intero set di dati. Richiama a 1.000 significa che l’algoritmo non ha previsto uno o più falsi negativi nell’intero set di dati.

Con gli altri set di dati, i risultati sono stati diversi per i diversi algoritmi.

Per il cancro della cervice uterina, gli algoritmi Random Forest e XGBoost, sensibili ai costi, sono migliorati da punteggi elevati a precisione e richiamo perfetti. Tuttavia, gli algoritmi Logistic Regression e Decision Tree sono migliorati raggiungendo punteggi molto più alti, ma non hanno raggiunto 1.000.

Il problema della precisione

In generale, gli algoritmi sono stati più precisi nel dire che le persone non hanno una malattia, piuttosto che nell’identificare quelli che sono malati, dice Mienye. Questa è una sfida continua nell’IA sanitaria.

Il motivo è il modo in cui apprendono gli algoritmi. Gli algoritmi apprendono da set di dati che provengono da grandi ospedali o programmi sanitari statali.

Ma la maggior parte delle persone in quei set di dati non ha le condizioni per le quali viene testata, afferma Mienye.

“In un grande ospedale, una persona entra per fare il test per la malattia renale cronica (CKD). Il loro medico li ha mandati lì perché alcuni dei loro sintomi sono sintomi di CKD. Il medico vorrebbe escludere la CKD. Risulta, la persona non ha CKD.

“Questo accade con molte persone. Il set di dati finisce con più persone che non hanno la CKD, rispetto alle persone che lo fanno. Lo chiamiamo un set di dati squilibrato”.

Quando un algoritmo inizia ad apprendere dal set di dati, apprende molto meno sulla CKD di quanto dovrebbe e non è abbastanza accurato nella diagnosi dei pazienti malati, a meno che l’algoritmo non sia corretto per lo squilibrio.

L’intelligenza artificiale dall’altra parte di un giro in barca

Mienye è cresciuta in un villaggio vicino all’Oceano Atlantico, non accessibile dalla strada.

“Devi usare un motoscafo dalla città più vicina per arrivarci. Il viaggio in barca dura dalle due alle tre ore”, dice.

La clinica più vicina è nella città più grande, dall’altra parte del giro in barca.

Il profondo ambiente rurale del suo villaggio natale lo ha ispirato a vedere come l’intelligenza artificiale può aiutare le persone con scarso o nessun accesso all’assistenza sanitaria.

Un’anziana signora del suo villaggio è un buon esempio di come algoritmi di intelligenza artificiale più avanzati possano aiutare in futuro, dice. Un algoritmo ML multiclasse sensibile ai costi potrebbe valutare i dati misurati per la sua pressione sanguigna, i livelli di sodio, la glicemia e altro.

Se i suoi dati vengono registrati correttamente su un computer e l’algoritmo apprende da un set di dati multiclasse, quella futura intelligenza artificiale potrebbe dire al personale della clinica in quale fase della malattia renale cronica si trova.

Tuttavia, questo scenario del villaggio è nel futuro.

Nel frattempo, i quattro algoritmi dello studio con sensibilità ai costi sono molto più precisi nella diagnosi delle malattie nei loro set di dati numerici.

E imparano in fretta, usando il normale computer che ci si aspetterebbe di trovare in una città remota.