È un classico esempio di come il progredire della conoscenza sia legato al progredire della tecnologia. E in vent’anni la tecnologia ha fatto, come si dice, passi da gigante. Se guardiamo alla genetica, alle tecnologie sviluppate per sequenziare il genoma – ovvero per leggere la sfilza di lettere che costituiscono il nostro dna e in sostanza racchiudono tutte le nostre informazioni biologiche – i passi in avanti sono stati veri balzi. E hanno permesso di affinare sempre di più le capacità di sequenziamento, al punto da arrivare oggi ad avere la prima mappa completa di un genoma umano. Venti anni dopo la presentazione della sua bozza.
C’era una volta una bozza del genoma umano
All’epoca, era il 2001, le presentazioni avvennero in pompa magna. E non sarebbe potuto essere altrimenti, visto la portata dell’annuncio: eravamo riusciti a leggere il dna umano, a mettere il fila i geni che lo costituiscono. Era stato anche un annuncio non privo di chiacchiere, scientifiche s’intende: accanto allo sforzo governativo internazionale del Progetto Genoma Umano, targato soprattutto Usa, c’era stato anche quello privato portato avanti dal biologo Craig Venter (quello della vita sintetica, sì).
Arrivarono al traguardo sostanzialmente insieme, con le relative pubblicazioni su Nature e Science, ma in entrambi i casi si parlò di draft, bozze. Erano sì i primi sequenziamenti del genoma umano ma non avevano letto proprio tutto tutto. Anche se già da allora l’obiettivo era di arrivare a un genoma senza gap e miglioramenti negli anni ne sono stati fatti. Oggi arriva però su Science – con la pubblicazione di uno speciale che conta sei paper e una perspective dedicata al tema, più altre pubblicazioni collegate in diversi giornali, come Nature Methods, della prima sequenza completa del genoma umano. L’ufficialità di un nuovo genoma completo di riferimento arriva dopo quanto già anticipato nei mesi precedenti.
Da telomero a telomero: un genoma davvero completo
Lo sforzo si deve a un consorzio dal nome abbastanza eloquente: Telomere to Telomere (T2T), da telomero a telomero. I telomeri sono infatti le estremità dei cromosomi, e leggere l’intera sequenza di un genoma, significa leggere tutto quello che intercorre da un’estremità all’altra. Cosa che fino a oggi mancava. Come spiegano infatti dal National Human Genome Research Institute (Nhgri), dei National Institutes of Health americani, il sequenziamento effettuato finora copriva solo il 92%. Perché non il 100%? Perché le tecniche utilizzate non lo permettevano.
Semplificando, infatti, si procedeva con lo spezzettare il genoma, leggere le sequenze di basi azotate che compongono il dna (A, C, G, T, adenina, citosina, guanina e timina) e così i geni, e ricomponendo l’ordine delle varie sequenze. Alcune parti del genoma però per loro natura sono più difficili da leggere: contengono lunghe ripetizioni di basi che complicavano stabilirne la posizione. La possibilità di leggere sequenze sempre più lunghe in un’unica volta, anche fino a un milione – grazie a metodi di sequenziamento quali e Oxford Nanopore Dna e PacBio HiFi Dna – ha semplificato man mano la lettera del genoma, coprendo anche le regioni più ostiche da decifrare, quell’8% mancante appunto, che oggi è arrivato.
Si tratta di una quantità di materiale genetico pari circa a quella contenuta in un singolo cromosoma, spiegano gli esperti, che mappa soprattutto nelle regioni dei telomeri e dei centromeri (le parti centrali dei cromosomi, fondamentali per la suddivisione dei cromosomi durante le divisioni cellulari). Detto in altre parole: l’equivalente di circa 200 milioni di coppie di basi e un centinaio di geni, per un totale di oltre tre miliardi di coppie di basi e circa 20 mila geni. Le analisi sono avvenute su una linea cellulare con coppie identici di cromosomi (quando invece normalmente in una coppia uno è di derivazione materna e uno paterno).
Perché è importante avere un genoma completo
Fin qui quanto scoperto, ma quali sono le possibili implicazioni di questo upgrade nel sequenziamento del genoma, soprannominato dagli addetti ai lavori T2T-CHM13? “Queste parti del genoma umano che non siamo stati in grado di studiare per più di venti anni sono importanti per la nostra comprensione di come funzionano i genomi, le malattie genetiche, la diversità umana e l’evoluzione”, ha spiegato Karen Miga della University of California di Santa Cruz, che ha guidato i lavori del progetto insieme ad Adam Phillippy del National Human Genome Research Institute. Miga ha poi aggiunto come questo nuovo genoma, “incredibilmente accurato”, consente di identificare delle varianti genetiche in alcune zone implicate nello sviluppo di malattie. Ma più in generale aiuterà alla comprensione della struttura, della funzione e della variabilità dei genomi.
Questo con tutti i limiti della sequenza presentata oggi. Non ha il cromosoma Y e deriva da una linea cellulare anomala, come ha ricordato in un commento che accompagna lo speciale su Science Deanna Church, esperta di genomica, riferendosi al fatto che T2T-CHM13 rappresenta una versione “semplificata” di genoma. Anche se, come anni fa, anche stavolta si guarda già oltre: i prossimi passi infatti saranno i sequenziamenti di genomi con cromosomi di derivazione paterna e materna e quindi l’estensione delle analisi a centinaia di persone, per cercare di catturare le basi della diversità genetica umana, come nella mission dello Human Pangenome Project.
“Una migliore risoluzione di entrambi i set cromosomici di una persona permetterà di avere una visione completa del genoma e senza dubbio aiuterà a migliorare al medicina personalizzata”, ha aggiunto Church. Tutto sta a partire, o meglio a continuare il viaggio iniziato decenni fa ormai. “Adesso abbiamo una stele di Rosetta per osservare la variazione completa di centinaia di migliaia di altri genomi in futuro”, ha concluso Evan Eichler, Howard Hughes Medical Institute (Hhmi) Investigator presso l’University of Washington, parte del progetto.
Galileo, Anna Lisa Bonfranceschi – 2.4.2022