Gli scienziati dell’Università del Wisconsin-Madison avvertono: la dipendenza dagli strumenti di intelligenza artificiale per analizzare le connessioni tra genetica e tratti fisici potrebbe portare a conclusioni errate, aumentando il rischio di interpretazioni fuorvianti in medicina e genetica.
Negli ultimi anni, l’intelligenza artificiale (AI) ha trovato sempre più applicazioni in ambito medico e genetico, rivoluzionando lo studio delle malattie e la loro prevenzione. Tuttavia, un recente studio dell’Università del Wisconsin-Madison (UW–Madison) mette in evidenza i limiti e i rischi dell’uso dell’AI in questo contesto. Secondo i ricercatori, la fiducia eccessiva in algoritmi avanzati per l’analisi di associazioni genomiche potrebbe produrre falsi positivi, portando a conclusioni fuorvianti.
L’AI negli Studi Genomici: Opportunità e Limiti
L’impiego dell’intelligenza artificiale negli studi di associazione genomica ha consentito ai ricercatori di analizzare in modo rapido e su larga scala dati genetici complessi. Gli studi di associazione genomica analizzano milioni di varianti genetiche in individui diversi, cercando di collegare specifici geni con tratti fisici o rischi di malattie. Database come la UK Biobank o il progetto All of Us del National Institutes of Health sono risorse inestimabili, fornendo ampi set di dati per l’analisi genetica. Tuttavia, nonostante l’enorme mole di dati, molti tratti fisici e condizioni di salute rimangono difficili da studiare.
Come spiega il professor Qiongshi Lu, esperto di biostatistica e informatica medica presso UW–Madison, “alcune caratteristiche sono molto costose o richiedono molto lavoro per essere misurate, quindi semplicemente non si hanno campioni sufficienti per trarre conclusioni statistiche significative”. La scarsità di campioni rappresenta quindi una sfida significativa per l’identificazione di legami tra genetica e specifiche condizioni di salute, aprendo la strada a tecnologie AI per colmare queste lacune.
Quando l’AI Introduce Pregiudizi nei Dati
Per compensare la mancanza di dati specifici, i ricercatori stanno ricorrendo sempre più a modelli di apprendimento automatico per prevedere tratti fisici e rischi di malattie. Tuttavia, questa strategia non è esente da rischi. L’uso dell’AI può introdurre bias significativi, con il rischio di generare falsi positivi che suggeriscono associazioni inesistenti.
Il team di Lu ha recentemente dimostrato come un comune algoritmo di apprendimento automatico utilizzato per gli studi di associazione genomica possa erroneamente associare varianti genetiche al rischio di sviluppare diabete di tipo 2. Questo problema emerge quando i ricercatori interpretano le previsioni dell’AI come dati effettivi, attribuendo erroneamente correlazioni tra varianti genetiche e malattie. Secondo Lu, “se ci si fida del rischio di diabete previsto dall’apprendimento automatico come rischio effettivo, si potrebbe pensare che tutte quelle variazioni genetiche siano correlate al diabete effettivo, anche se non è così”.
Questi “falsi positivi” rappresentano un rischio non solo per lo studio del diabete, ma anche per la comprensione di molte altre condizioni mediche, dove le associazioni genetiche devono essere analizzate con cautela e rigore scientifico.
Una Nuova Strategia per Ridurre gli Errori
Per ridurre il rischio di falsi positivi, il team di UW–Madison ha proposto un metodo statistico innovativo, progettato per mitigare il bias negli studi assistiti dall’intelligenza artificiale. Questo approccio statistico, descritto in un articolo pubblicato su Nature Genetics, permette di eliminare le distorsioni introdotte dagli algoritmi di apprendimento automatico, garantendo risultati più affidabili. “Questa nuova strategia è statisticamente ottimale”, spiega Lu, che l’ha già utilizzata per analizzare in modo più preciso le associazioni genetiche con la densità minerale ossea.
Grazie a questo nuovo metodo, i ricercatori possono migliorare l’accuratezza delle loro analisi, ma questo non elimina del tutto i rischi legati all’uso indiscriminato di AI negli studi genetici.
Oltre l’AI: L’Errore delle Informazioni Proxy
L’intelligenza artificiale non è l’unico problema. Molti studi di associazione genetica ricorrono a informazioni “proxy” per colmare le lacune nei dati, ma queste informazioni possono distorcere i risultati. I ricercatori di UW–Madison avvertono che l’uso di dati proxy, come le informazioni raccolte tramite indagini sulla storia clinica familiare, può portare a correlazioni fuorvianti tra genetica e malattie.
Ad esempio, alcune ricerche utilizzano dati proxy per studiare il rischio di Alzheimer, raccogliendo informazioni tramite i familiari dei pazienti piuttosto che basarsi su diagnosi cliniche dirette. Questo metodo può produrre correlazioni genetiche poco attendibili, poiché le informazioni fornite dai familiari non sempre riflettono accuratamente la presenza della malattia.
Secondo i ricercatori, l’uso di tali informazioni può portare a “correlazioni genetiche altamente fuorvianti”, creando collegamenti errati tra il rischio di Alzheimer e capacità cognitive superiori.
Il Futuro degli Studi Genetici e il Ruolo dell’AI
Le scoperte del team di UW–Madison mettono in luce i rischi dell’eccessiva dipendenza dagli strumenti di intelligenza artificiale e dalla mancanza di dati completi. Con l’aumentare della potenza statistica e della capacità dei database, aumenta anche la necessità di sviluppare metodi più rigorosi e di evitare l’uso di scorciatoie metodologiche che potrebbero compromettere l’affidabilità dei risultati.
In un’epoca in cui l’intelligenza artificiale e il machine learning sono spesso considerati strumenti infallibili, il lavoro dei ricercatori di UW–Madison ci ricorda l’importanza del rigore scientifico. La ricerca genomica continuerà a beneficiare dell’AI, ma solo se utilizzata con cautela e con metodi statistici rigorosi.