Una raccolta più completa e sofisticata di sequenze di genomi cattura una diversità umana significativamente maggiore.
I ricercatori hanno rilasciato una nuova raccolta di alta qualità di sequenze di genoma umano di riferimento che cattura sostanzialmente più diversità da diverse popolazioni umane rispetto a quanto era precedentemente disponibile. Il lavoro è stato condotto dall’International Human Pangenome Reference Consortium, un gruppo finanziato dal National Human Genome Research Institute (NHGRI), parte del National Institutes of Health.
Il nuovo riferimento al “pangenoma” include sequenze del genoma di 47 persone, con i ricercatori che perseguono l’obiettivo di aumentare quel numero a 350 entro la metà del 2024. Con ogni persona che porta un insieme accoppiato di cromosomi, l’attuale riferimento include in realtà 94 distinte sequenze di genoma, con l’obiettivo di raggiungere 700 distinte sequenze di genoma entro il completamento del progetto.
Il lavoro, apparso sulla rivista Nature , è uno dei numerosi articoli pubblicati oggi dai membri del consorzio.
Un genoma è l’insieme di istruzioni del DNA che aiuta ogni creatura vivente a svilupparsi e funzionare. Le sequenze del genoma differiscono leggermente tra gli individui. Nel caso degli esseri umani, i genomi di due persone qualsiasi sono, in media, identici per oltre il 99%. Le piccole differenze contribuiscono all’unicità di ogni persona e possono fornire informazioni sulla sua salute, aiutando a diagnosticare la malattia, prevedere gli esiti e guidare i trattamenti medici.
Per comprendere queste differenze genomiche, gli scienziati creano sequenze di genoma umano di riferimento da utilizzare come “standard”, una fusione digitale di sequenze di genoma umano che può essere utilizzata come confronto per allineare, assemblare e studiare altre sequenze di genoma umano.
La sequenza originale del genoma umano di riferimento ha quasi 20 anni ed è stata regolarmente aggiornata man mano che la tecnologia avanza e i ricercatori correggono gli errori e scoprono più regioni del genoma umano. Tuttavia, è fondamentalmente limitato nella sua rappresentazione della diversità della specie umana, poiché consiste di genomi di sole 20 persone circa e la maggior parte della sequenza di riferimento proviene da una sola persona.
“Ognuno ha un genoma unico, quindi l’utilizzo di una singola sequenza del genoma di riferimento per ogni persona può portare a disuguaglianze nelle analisi genomiche”, ha affermato Adam Phillippy, Ph.D., ricercatore senior presso il Computational and Statistical Genomics Branch all’interno del programma di ricerca intramurale di NHGRI e un coautore dello studio principale. “Ad esempio, la previsione di una malattia genetica potrebbe non funzionare altrettanto bene per qualcuno il cui genoma è più diverso dal genoma di riferimento”.
L’attuale sequenza del genoma umano di riferimento presenta lacune che riflettono informazioni mancanti, specialmente in aree ripetitive e difficili da leggere. I recenti progressi tecnologici come il sequenziamento del DNA a lettura lunga, che legge tratti più lunghi del DNA alla volta, hanno aiutato i ricercatori a colmare queste lacune per creare la prima sequenza completa del genoma umano . Questa sequenza completa del genoma umano, rilasciata lo scorso anno come parte del consorzio Telomere-to-Telomere (T2T) finanziato dal NIH, è incorporata nell’attuale riferimento al pangenoma. Infatti, molti dei ricercatori di T2T sono anche membri dello Human Pangenome Reference Consortium.
Utilizzando tecniche computazionali avanzate per allineare le varie sequenze del genoma, i ricercatori hanno costruito un nuovo riferimento del pangenoma umano con ogni assemblaggio nel pangenoma che copre oltre il 99% della sequenza prevista con una precisione superiore al 99%. Si basa anche sulla precedente sequenza del genoma di riferimento, aggiungendo oltre 100 milioni di nuove basi o “lettere” nel DNA. Mentre la precedente sequenza del genoma di riferimento era singola e lineare, il nuovo pangenoma rappresenta contemporaneamente molte versioni diverse della sequenza del genoma umano. Ciò offre ai ricercatori una gamma più ampia di opzioni per l’utilizzo del pangenoma nell’analisi di altre sequenze del genoma umano.
“Utilizzando il riferimento al pangenoma, possiamo identificare più accuratamente varianti genomiche più grandi chiamate varianti strutturali”, ha affermato Mobin Asri, Ph.D. studente presso l’Università della California Santa Cruz e co-primo autore dell’articolo. “Siamo in grado di trovare varianti che non sono state identificate utilizzando metodi precedenti che dipendono da sequenze di riferimento lineari”.
Le varianti strutturali possono coinvolgere migliaia di basi. Fino ad ora, i ricercatori non sono stati in grado di identificare la maggior parte delle varianti strutturali che esistono in ciascun genoma umano utilizzando il sequenziamento a lettura breve a causa della distorsione dell’utilizzo di una singola sequenza di riferimento.
“Il riferimento al pangenoma umano ci consentirà di rappresentare decine di migliaia di nuove varianti genomiche in regioni del genoma precedentemente inaccessibili”, ha affermato Wen-Wei Liao, Ph.D. studente alla Yale University e co-primo autore dell’articolo. «Con un riferimento al pangenoma, possiamo accelerare la ricerca clinica migliorando la nostra comprensione del legame tra geni e tratti della malattia».
Il costo totale per sostenere il lavoro del Consorzio di Riferimento per il Pangenoma Umano dovrebbe essere di circa 40 milioni di dollari in cinque anni, che include gli sforzi per creare il riferimento per il pangenoma umano, migliorare la tecnologia di sequenziamento del DNA, gestire un centro di coordinamento, condurre attività di sensibilizzazione e creare risorse per la comunità di ricerca per utilizzare il riferimento al pangenoma.
Molti degli individui i cui genomi sono stati sequenziati per costruire il nuovo pangenoma umano di riferimento sono stati originariamente reclutati come parte del Progetto 1.000 Genomes, uno sforzo collaborativo e internazionale finanziato in parte dal NIH che mirava a migliorare il catalogo delle varianti genomiche in diverse popolazioni. Poiché il riferimento al pangenoma umano è un lavoro in corso, i ricercatori dell’International Human Pangenome Reference Consortium continuano ad aggiungere più sequenze di genoma per migliorare sempre più la qualità del riferimento al pangenoma.
“I ricercatori e i clinici di base che utilizzano la genomica hanno bisogno di accedere a una sequenza di riferimento che rifletta la notevole diversità della popolazione umana. Ciò contribuirà a rendere il riferimento utile per tutte le persone, contribuendo così a ridurre le possibilità di propagazione delle disparità di salute “, ha affermato Eric Green, MD, Ph.D., direttore NHGRI. “La creazione e il miglioramento di un riferimento al pangenoma umano è in linea con l’obiettivo di NHGRI di lottare per la diversità globale in tutti gli aspetti della ricerca genomica, che è fondamentale per far progredire la conoscenza genomica e implementare la medicina genomica in modo equo”.
In linea con questo sforzo, lo Human Pangenome Reference Consortium comprende un gruppo etico incorporato che sta lavorando per anticipare problemi impegnativi e aiutare a guidare il consenso informato, dare la priorità allo studio di diversi campioni, esplorare possibili problemi normativi relativi all’adozione clinica e lavorare con organizzazioni internazionali e Comunità indigene a incorporare le loro sequenze genomiche in questi sforzi più ampi.
Le istituzioni coinvolte nello Human Pangenome Reference Consortium possono essere trovate sulla pagina principale del progetto.
Il National Human Genome Research Institute (NHGRI) è uno dei 27 istituti e centri del NIH, un’agenzia del Dipartimento della salute e dei servizi umani. La divisione NHGRI di ricerca intramurale sviluppa e implementa la tecnologia per comprendere, diagnosticare e trattare le malattie genomiche e genetiche. Ulteriori informazioni su NHGRI sono disponibili all’indirizzo: https://www.genome.gov/ .
Informazioni sui National Institutes of Health (NIH): NIH, l’agenzia di ricerca medica della nazione, comprende 27 istituti e centri ed è un componente del Dipartimento della salute e dei servizi umani degli Stati Uniti. NIH è la principale agenzia federale che conduce e sostiene la ricerca medica di base, clinica e traslazionale e sta studiando le cause, i trattamenti e le cure per le malattie comuni e rare. Per ulteriori informazioni su NIH e sui suoi programmi, visitare www.nih.gov .