Da sinistra a destra Alaina Shumate Steven Salzberg Samantha Zarate Paul Hook Michael Schatz Winnston Timp Roham Razaghi Rajiv McCoy Dylan Taylor Ariel Gershman CREDITO Will Kirk/Johns Hopkins University
Da sinistra a destra Alaina Shumate Steven Salzberg Samantha Zarate Paul Hook Michael Schatz Winnston Timp Roham Razaghi Rajiv McCoy Dylan Taylor Ariel Gershman CREDITO Will Kirk/Johns Hopkins University
Da sinistra a destra Alaina Shumate Steven Salzberg Samantha Zarate Paul Hook Michael Schatz Winnston Timp Roham Razaghi Rajiv McCoy Dylan Taylor Ariel Gershman
CREDITO: Will Kirk/Johns Hopkins University

Un gruppo di scienziati della Johns Hopkins University ha collaborato con più di 100 ricercatori in tutto il mondo per assemblare e analizzare la prima sequenza completa di un genoma umano, due decenni dopo che lo Human Genome Project ha prodotto la prima bozza.

Il lavoro fa parte del consorzio Telomere to Telomere (T2T), guidato da ricercatori del National Human Genome Research Institute (NHGRI); Università della California, Santa Cruz; e Università di Washington, Seattle.

Johns Hopkins ha contribuito alla ricerca chiave allo sforzo di decifrare il nostro DNA, che è rimasto un mistero nonostante i progressi iniziali di 20 anni fa. Le rivelazioni dovrebbero aprire nuove linee di esplorazione molecolare e genetica, fornendo agli scienziati un quadro più chiaro di come il DNA influenzi i rischi di malattie e di come i geni vengono espressi e regolati.

Un pacchetto di sei articoli che riportano il risultato appare nel numero di oggi di Science , insieme ad articoli complementari in diverse altre riviste.

“Aprendo queste nuove parti del genoma, pensiamo che ci saranno variazioni genetiche che contribuiranno a molti tratti diversi e al rischio di malattie”, ha affermato Rajiv McCoy, un assistente professore presso il Dipartimento di Biologia dell’università la cui ricerca si concentra sulla genetica umana e sull’evoluzione. “C’è un aspetto di questo che è come se non sappiamo ancora cosa non sappiamo”.

McCoy e 12 ricercatori della Johns Hopkins hanno lavorato su diversi aspetti dell’iniziativa internazionale, contribuendo al progetto principale di assemblaggio del genoma e a diversi lavori di accompagnamento analizzando ciò che si può apprendere sui modelli di variazione genetica ed epigenetica da persona a persona attraverso le sezioni appena sequenziate del genoma. 

Winston Timp, professore associato di ingegneria biomedica presso la Whiting School of Engineering, e il suo studente laureato, Ariel Gershman, hanno lavorato a una parte del progetto incentrata su come il genoma completato migliorerà la comprensione della regolazione e dell’espressione genica: il processo di trasformazione geni “on” e “off”.

I ricercatori della Johns Hopkins, guidati dalle dottorande Samantha Zarate, Stephanie Yan e Melanie Kirsche, insieme al ricercatore post-dottorato Sergey Aganezov, hanno contribuito in modo specifico a dimostrare come avere un unico genoma completo migliora la capacità degli scienziati di comprendere le variazioni nei genomi di individui di diverse popolazioni . Analizzando i dati di oltre 3.200 persone in tutto il mondo, hanno rivelato più di un milione di varianti genetiche che prima non erano note. Per fare ciò, il team di Hopkins ha utilizzato il NHGRI Analysis, Visualization, and Informatics Labspace (AnVIL), una piattaforma basata su cloud co-guidata dal distinto professor Michael Schatz di Bloomberg, che è stato anche autore dei documenti T2T.

Lo studio ha scoperto che poiché il modello precedente, noto come genoma di riferimento, era un composto di genomi di più individui essenzialmente “cuciti insieme”, ha creato “cuciture” artificiali in cui il modello passa dal genoma di una persona all’altra. La nuova versione completa elimina queste cuciture ed è più rappresentativa dell’aspetto del genoma reale di un individuo.

Utilizzando il nuovo modello del genoma umano, i collaboratori della Johns Hopkins hanno anche quantificato la frequenza con cui si verificano versioni diverse dello stesso gene in diverse popolazioni umane. Ciò funge da registrazione evolutiva sia delle fluttuazioni casuali che della potenziale selezione naturale che colpisce alcune parti del genoma. 

Coordinando la loro ricerca durante la pandemia di COVID-19 attraverso la piattaforma di messaggistica Slack, gli scienziati di 30 diverse istituzioni hanno aggiunto o corretto più di 200 milioni di coppie di basi di DNA, aumentando il numero totale nel genoma umano a 3,05 miliardi. Una coppia di basi è costituita da due basi chimiche legate l’una all’altra per formare un “grado” della scala del DNA. Attraverso il processo, hanno anche scoperto più di 100 nuovi geni in grado di produrre proteine.

Secondo Schatz, il sequenziamento ha reso accessibile un segmento del genoma delle stesse dimensioni di uno dei cromosomi umani più grandi.

“Abbiamo effettivamente aggiunto un cromosoma umano completamente nuovo alla nostra conoscenza”, ha detto. “C’è molto da guadagnare e da imparare. C’è questa nuova opportunità di scoperta.

Allo stesso tempo, ha affermato, poiché gli errori nel sequenziamento precedente sono stati identificati e corretti, gli scienziati ora hanno una visione più precisa dei “geni clinicamente rilevanti”, un potenziale vantaggio per la medicina personalizzata.  

Di particolare interesse per i ricercatori è stata una componente enigmatica del genoma nota come centromeri. Sono densi fasci di DNA che tengono insieme i cromosomi e svolgono un ruolo chiave nella divisione cellulare. In precedenza, tuttavia, erano stati considerati non mappabili perché contengono migliaia di tratti di sequenze di DNA che si ripetono più e più volte.

Timp ha spiegato come questo lavoro sia stato potenziato da una sequenza di lettura lunga, analoga ai pezzi di puzzle. In precedenza queste regioni erano irrisolte perché erano così ripetitive, quindi tutti i pezzi erano di un unico colore e forma. “È come se tutto ciò che hai fossero pezzi che sembrano cielo blu. Sono identici. Allora, come lo metti insieme? Diventa quasi un problema impossibile”, ha detto. 

Ma una tecnologia di sequenziamento più sofisticata ora consente agli scienziati di dare un senso migliore alla regione un tempo imperscrutabile utilizzando letture lunghe. “È come se i pezzi del puzzle ora fossero davvero grandi, come un puzzle per bambini”, ha detto Timp. “E abbiamo scoperto che ci sono degli oggetti nei pezzi, diciamo dell’erba o del sole. Non è solo il cielo blu”. 

Essere in grado di tracciare i cambiamenti nel tempo in queste regioni del genoma appena accessibili consentirà ai ricercatori di effettuare confronti più rigorosi da una generazione all’altra, di persone di origini diverse o da specie a specie. 

“Finalmente, da punta a punta, da telomero a telomero, abbiamo un insieme del genoma che possiamo guardare”, ha detto Timp.  

Una sfida immediata individuata da McCoy è che i laboratori clinici dovranno passare dalla precedente mappatura del genoma alla nuova versione completa, un’impresa non da poco che richiede di adattare le informazioni che hanno sui legami tra geni e malattie. 

“Ci sono tutti i tipi di database e risorse che sono stati costruiti attorno alla versione precedente e può essere difficile convincere le persone a spostarsi”, ha affermato. “Quindi uno degli obiettivi del nostro lavoro ora è incoraggiare queste importanti risorse a passare alla nuova mappatura per potenziare davvero la comunità”.

Per Schatz, che ha cambiato carriera dalla sicurezza informatica alla genomica nel 2002 dopo essere stato ispirato dall’originale Human Genome Project, l’assemblaggio completo del genoma umano, e la sua capacità di contribuire ad esso, è particolarmente gratificante.

“Ho sempre creduto che si potesse fare”, ha detto. “Ma penso che nessuno sapesse davvero quando si sarebbe potuto farlo e cosa ci sarebbe voluto davvero. Pensavo ci sarebbero voluti molti più anni. È stata davvero una sorpresa per me quanto velocemente siamo riusciti a superarlo.

“Questo è qualcosa che mi inseguo da 20 anni. Quindi, è incredibilmente soddisfacente vederlo riunirsi”.

Il team della Johns Hopkins comprende anche Steven Salzberg, Bloomberg Distinguished Professor di ingegneria biomedica, informatica e biostatistica; il ricercatore Michael Sauria; borsista post-dottorato Sergey Aganezov; e dottorandi Stephanie Yan, Melanie Kirsche, Samantha Zarate, Michael Alonge, Dylan Taylor e Alaina Shumate. Il consorzio T2T comprendeva anche ricercatori dell’Università del Connecticut, Storrs; Università della California, Davis; Istituto medico Howard Hughes; e l’Istituto nazionale di standard e tecnologia.

Il lavoro è stato finanziato principalmente da NHGRI, con il supporto aggiuntivo di NIH, NSF, NIST e Mark Foundation for Cancer Research.