Capitolo

Il sequenziamento del genoma

Accanto agli studi volti a determinare i meccanismi di controllo dell’attività genica, negli anni Settanta del Novecento si è sviluppato un altro filone di ricerca molto importante, finalizzato a sequenziare il DNA. Sequenziare vuol dire determinare l’ordine dei nucleotidi nella molecola del DNA. A volte il sequenziamento viene confuso con la «decifrazione» del DNA, ma in realtà esso è solo il primo passo in questa direzione, per quanto importante. Dopo avere sequenziato una molecola di DNA, infatti, i biologi molecolari devono studiarla per capire cosa significhino le sequenze che hanno identificato.

Le tappe storiche del sequenziamento dei genomi

Per un certo periodo l’attenzione dei ricercatori si è focalizzata sui singoli geni o, al più, sui geni di un singolo operone. Questo approccio era al contempo logico e necessario. Logico perché, nell’affrontare un nuovo campo di studio è buona norma cominciare dai casi più semplici; necessario perché le tecnologie di quegli anni non consentivano di analizzare insiemi più complessi di geni.

Alla fine degli anni Settanta divenne possibile sequenziare il DNA dei virus. Le tecniche di sequenziamento manuale utilizzate per i virus, però, non erano sufficienti per far luce sul genoma dei procarioti e degli eucarioti, i più piccoli dei quali sono centinaia di volte più grandi di quello di un batteriofago.

Soltanto nell’ultimo decennio, grazie alle tecniche di sequenziamento automatico (▶figura 8), è stato rapidamente possibile arricchire le conoscenze con molte sequenze procariotiche. Tali sequenze hanno chiarito non soltanto il modo in cui questi organismi ripartiscono fra i propri geni i vari compiti cellulari, ma anche le modalità di attuazione di loro funzioni specializzate.

Figura 8
Figura 8open

Sequenziare il DNA

(A) Questo ricercatore del Centro di Ecologia Alpina di Trento sta sequenziando il DNA del camoscio alpino nell’ambito di un progetto sul mantenimento della biodiversità della fauna selvatica. (B) La sequenza nucleotidica è rappresentata sotto forma di un grafico in cui ognuno dei quattro nucleotidi è tracciato utilizzando un colore diverso.

Capitolo

Il sequenziamento del genoma

Dalle sequenze genomiche si ricavano informazioni importanti

Da una sequenza genomica è possibile ricavare tre tipologie di informazioni:

  1. Le finestre di lettura (ORF, Open Reading Frames), ossia i tratti codificanti dei geni. Per i geni che codificano proteine, queste regioni sono riconoscibili in base ai codoni di inizio e di stop della traduzione.
  2. Le sequenze amminoacidiche delle proteine, deducibili dalle corrispondenti sequenze di DNA delle finestre di lettura, applicando le regole del codice genetico (▶capitolo B4).
  3. Le sequenze regolatrici, come ad esempio i promotori e i terminatori della trascrizione.

Capitolo

Il sequenziamento del genoma

Il Progetto Genoma Umano

I primi genomi a essere sequenziati e studiati sono stati quelli di alcuni virus e batteri che, per le loro dimensioni contenute, erano più facili da trattare per i ricercatori. Fin da subito, tuttavia, fu chiaro che l’obiettivo più interessante era giungere a sequenziare il genoma umano; questa impresa prometteva infatti le più importanti ricadute pratiche, soprattutto nel campo della medicina.

Il Progetto Genoma Umano (o HGP dall’inglese Human Genome Project) è stato uno dei più grandi progetti di ricerca in campo biologico dell’intero Novecento. Avviato all’inizio degli anni Novanta su iniziativa di James Watson, uno dei due padri della doppia elica, il progetto è stato completato ufficialmente nel 2003, anche se una prima bozza era stata pubblicata con grande clamore nel 2001.

Il progetto ha visto la collaborazione di un ente pubblico statunitense, i National Institutes of Health (NIH), e di un’azienda privata, la Celera Corporation fondata e diretta dal biochimico Craig Venter. A questi due gruppi si sono aggiunte collaborazioni di altri enti in USA, Canada, Gran Bretagna e Nuova Zelanda.

L’obiettivo del progetto sarebbe apparso inimmaginabile solo pochi anni prima; la sequenza completa del corredo cromosomico aploide di un essere umano, infatti, comprende oltre 3 miliardi di nucleotidi. Poiché ogni genoma è unico per alcuni suoi tratti, il Progetto ha previsto la comparazione di diversi campioni con un’elaborazione statistica dei dati.

I NIH hanno usato un approccio tradizionale, frammentando il genoma con diversi enzimi di restrizione, così da ottenere frammenti di piccole dimensioni, che poi sono stati collegati tra loro per ricavare frammenti di dimensioni via via maggiori. La Celera ha fatto invece ricorso a una tecnica chiamata shotgun sequencing che, sfruttando potenti computer, è in grado di trovare i collegamenti tra più frammenti, accelerando molto le operazioni, anche se con minore precisione. Attualmente l’intera sequenza del genoma umano è scaricabile da internet, dove è conservata presso siti specifici, consultabili dai ricercatori.

L’esame delle sequenze ha rivelato alcuni dati di estremo interesse. Il più sorprendente è che il nostro genoma contiene dai 28 000 ai 30 000 geni, contro i circa 100 000 che i genetisti ritenevano plausibili in precedenza. I geni sono stati individuati attraverso un algoritmo informatico di ricerca degli ORF.

A fronte di questo scarso numero di geni, risulta che circa il 95% del DNA umano è costituito da sequenze che non vengono mai tradotte in polipeptidi. Per questo tipo di DNA è stato coniato il nome poco lusinghiero di junk DNA («DNA spazzatura»). I ricercatori, tuttavia, stanno iniziando solo ora a chiarire la vera natura di questa componente, che appare molto eterogenea e comprende anche tratti di DNA che svolgono diverse funzioni, alcune delle quali potrebbero rivelarsi importanti; vediamone qualcuna:

  • I telomeri e i centromeri sono indispensabili per la corretta conservazione dei cromosomi.
  • Gli introni, attraverso il meccanismo di splicing e in particolare attraverso lo splicing alternativo, garantiscono al DNA eucariotico una versatilità sconosciuta al genoma dei batteri.
  • Alcune sequenze sono coinvolte nella regolazione dell’espressione genica, direttamente o attraverso speciali RNA, come nel caso del meccanismo detto interferenza dell’RNA.
  • Più dubbio è il giudizio sugli pseudogeni, antichi geni che hanno perso funzionalità in seguito a mutazioni. Molti biologi ritengono che la loro presenza possa favorire, per mutazione, la comparsa di nuovi geni in una specie. Vi sono inoltre rari casi di pseudogeni che hanno riacquistato la funzione perduta attraverso una successiva mutazione. Il numero degli pseudogeni presenti nel nostro genoma non è noto con precisione, ma si valuta che sia attorno a diverse migliaia, pari forse al 10% del DNA totale.
  • Un caso a sé è quello dei trasposoni, elementi in grado di moltiplicarsi e spostarsi nel DNA che da soli costituiscono fino al 50% del genoma umano. A tutt’oggi nessuna funzione utile è stata scoperta per questi elementi, che, anzi, possono essere coinvolti nell’insorgenza di tumori.
  • L’ultima componente del junk DNA è costituita dalle sequenze ripetute. Molti studiosi ritengono che tali sequenze siano importanti per dare compattezza al DNA, e recenti ricerche hanno anche fatto emergere un loro ruolo nel processo di regolazione della trascrizione.

A pochi anni di distanza, è già difficile dare l’idea della grandiosità dell’HGP, dato che i vertiginosi progressi tecnologici hanno fatto sì che un nuovo genoma possa essere sequenziato in pochi mesi. Resta il fatto che questo campo di ricerche (denominato genomica) è stato aperto proprio dalle esperienze fatte grazie all’HGP.


Capitolo

Il sequenziamento del genoma

La genomica

La possibilità di studiare i genomi segna l’inizio di quella branca della biologia molecolare che definiamo genomica e che studia la struttura del genoma, le informazioni in esso contenute, il modo in cui le sue diverse parti interagiscono e la sua evoluzione. Si può parlare di genomica funzionale e di genomica comparata:

  1. La genomica funzionale consiste nell’assegnazione di ruoli funzionali ai prodotti dei geni individuati con il sequenziamento (▶figura 9). Sequenziando un intero genoma si trovano, infatti, molte sequenze geniche sconosciute e non associabili ad alcuna funzione. Tale funzione può spesso essere ricavata da ricerche successive, comparando, per esempio, la struttura del gene scoperto a quella di altri geni. Il sequenziamento può quindi condurre all’aumento delle conoscenze sulle funzioni delle cellule.
  2. Nella genomica comparata si confrontano le sequenze genomiche di organismi diversi per individuare i geni presenti in un organismo e assenti in un altro, al fine di mettere in relazione questi risultati con la rispettiva fisiologia. La genomica comparata fornisce anche un solido sostegno alla teoria dell’evoluzione.

In questi anni, lo studio della genomica si è rivelato di grande importanza per le sue applicazioni in campo medico-sanitario, ma anche, per esempio, alimentare o ecologico. Un caso particolarmente affascinante è quello della produzione di un organismo artificiale, dotato di un genoma costruito interamente in laboratorio. Questa impresa, alla quale si è dedicato Craig Venter dopo avere completato il Progetto Genoma Umano, non è solo suggestiva, ma interessante come primo passo verso la produzione di specie batteriche costruite secondo specifiche necessità. L’organismo, chiamato Mycoplasma laboratorium, costituirebbe la base per la produzione di tutti i futuri batteri artificiali, poiché è stato dotato del genoma minimo indispensabile per una cellula.

Figura 9
Figura 9open

L’organizzazione funzionale del genoma

L’intera sequenza del DNA del batterio Haemophilus influenzae è costituita da 1830137 paia di basi.

Capitolo

Il sequenziamento del genoma

Per saperne di più

Come si determina la sequenza nucleotidica del DNA

Il sequenziamento del DNA è un’importante tecnica che permette di stabilire la sequenza delle basi di una molecola di DNA e che si basa sull’utilizzo di nucleosidi modificati artificialmente. Come abbiamo già visto, i desossiribonucleosidi trifosfati (dNTP) che costituiscono il normale substrato per la duplicazione del DNA contengono lo zucchero desossiribosio.

Se sostituiamo questo zucchero con il 2,3-didesossiribosio, i didesossiribonucleosidi trifosfati (ddNTP) risultanti sono aggiunti dalla DNA polimerasi a una catena in allungamento come se fossero nucelotidi normali; essendo però privi del gruppo ossidrile in posizione 3', essi non consentono l’aggiunta del nucleotide successivo (▶figura A). Pertanto la sintesi si arresta nella posizione in cui all’estremità in crescita del filamento di DNA è stato incorporato il nucleoside modificato.

Per stabilire la sequenza del DNA (▶figura B) si denatura un frammento di lunghezza inferiore alle 700 coppie di basi; il filamento singolo risultante viene messo in una provetta insieme a:

  • una DNA polimerasi per sintetizzare il filamento complementare;
  • alcuni brevi primer sintetizzati artificialmente;
  • i quattro desossiribonucleosidi trifosfati (dATP, dGTP, dCTP e dTTP);
  • piccole quantità dei quattro didesossiribonucleosidi trifosfati, ciascuno legato a un’«etichetta» fluorescente che emette una luce di colore diverso.

La duplicazione del DNA va avanti e ben presto nella provetta troviamo una miscela contenente i filamenti di DNA che hanno fatto da stampo e i nuovi filamenti complementari più brevi. I nuovi filamenti, che terminano ciascuno con un didesossiribonucleoside fluorescente, sono di lunghezza variabile. Infatti, ogni volta che sullo stampo compare, poniamo, una T nel filamento complementare in formazione la DNA polimerasi potrà aggiungere un dATP o un ddATP; in quest’ultimo caso però la sintesi si interrompe.

Si lascia che la duplicazione del DNA vada avanti per un certo lasso di tempo e poi si denaturano i nuovi frammenti di DNA staccandoli dai loro stampi. Quindi i frammenti vengono sottoposti a elettroforesi; mentre migrano attraverso il gel, i frammenti sono attraversati da un raggio laser che eccita i marcatori fluorescenti. La luce emessa viene intercettata e l’informazione così ottenuta – quale colore della fluorescenza ovvero quale didesossiribonucleoside si trova all’estremità del frammento – viene inserita in un computer. Il computer elabora l’informazione e produce la sequenza del frammento di DNA.

Il metodo che abbiamo descritto è il più usato attualmente e si chiama Sanger, dal nome del suo creatore, il chimico britannico che per tale scoperta (avvenuta nel 1975) vinse il premio Nobel nel 1980.

Figura A
Figura Aopen

Confronto fra dNTP e ddNTP

Le due formule chimiche evidenziano la differenza tra i nucleotidi.
Figura B
Figura Bopen

Le tappe del sequenziamento

In questo schema sono descritte le tecniche per sequenziare il DNA.

sul libro: pag

preferenze

carattere

colori: