Capitolo

La trascrizione: dal DNA all’RNA

Nelle cellule procariotiche ed eucariotiche, la sintesi di RNA è diretta dal DNA. La trascrizione, cioè la formazione di uno specifico RNA a partire da uno specifico DNA, richiede uno stampo di DNA, i corretti ribonucleotidi trifosfati (ATP, GTP, CTP e UTP) che facciano da substrato e un enzima chiamato RNA polimerasi. La trascrizione non produce soltanto mRNA; questo stesso processo è responsabile della sintesi del tRNA e dell’RNA ribosomiale (rRNA). Come i peptidi, anche tutti questi RNA sono codificati da geni specifici.

La trascrizione avviene in tre tappe

All’interno di ciascun gene viene trascritto uno solo dei due filamenti del DNA, il filamento stampo. Il filamento complementare resta non trascritto. Questa differenza funzionale non vale per tutta la molecola di DNA: il filamento che in un gene è stampo, in un altro gene può non esserlo.

La trascrizione può essere suddivisa in tre stadi distinti: inizio, allungamento e terminazione.

1. Il primo stadio, che dà inizio alla trascrizione (▶figura 4A), richiede un promotore, una speciale sequenza di DNA alla quale si lega molto saldamente la RNA polimerasi. Per ogni gene (o, nei procarioti, per ogni serie di geni) c’è almeno un promotore. I promotori sono importanti sequenze di controllo che «dicono» all’RNA polimerasi tre cose: da dove far partire la trascrizione, quale filamento del DNA trascrivere e in quale direzione procedere.

I promotori funzionano un po’ come i segni di punteggiatura che stabiliscono come debba essere letta la sequenza di parole di una frase. Una parte di ogni promotore è il sito di inizio, dove incomincia la trascrizione. Ogni gene ha un promotore, ma non tutti i promotori sono uguali; alcuni sono più efficaci di altri nel dare inizio alla trascrizione.

Esistono differenze fra i promotori degli eucarioti e quelli dei procarioti. Nei procarioti, il promotore è una sequenza di DNA situata in prossimità dell’estremità 5' della regione che codifica una proteina. Un promotore procariotico possiede due sequenze fondamentali: la sequenza di riconoscimento, ossia la sequenza riconosciuta dall’RNA polimerasi, e il TATA box (così denominato poiché ricco di coppie di basi AT), che si trova più vicino al sito di inizio e in corrispondenza del quale il DNA inizia a denaturarsi per esporre il filamento stampo.

Le cose sono notevolmente diverse negli eucarioti. L’RNA polimerasi degli eucarioti non è in grado di legarsi semplicemente al promotore e di iniziare a trascrivere; essa infatti si lega al DNA soltanto dopo che sul cromosoma si sono associate varie proteine regolatrici dette fattori di trascrizione (▶figura 5). Il primo fattore di trascrizione si lega al TATA box, inducendo un cambiamento di forma sia di sé stesso sia del DNA, favorendo così il legame di altri fattori di trascrizione (tra cui l’RNA polimerasi) che vengono a formare il complesso di trascrizione.

Alcune sequenze del DNA, come il TATA box, si trovano comunemente nei promotori di molti geni eucariotici e vengono riconosciute da fattori di trascrizione presenti in tutte le cellule dell’organismo. Altre sequenze dei promotori sono specifiche di particolari geni e vengono riconosciute da fattori di trascrizione presenti soltanto in particolari tessuti. Questi specifici fattori di trascrizione svolgono un ruolo importante nel differenziamento, ossia nella specializzazione delle cellule durante lo sviluppo.

2. Dopo che l’RNA polimerasi si è legata al promotore, incomincia il processo dell’allungamento (▶figura 4B). La RNA polimerasi apre il DNA a circa 10 basi per volta e legge il filamento di stampo in direzione 3'-5'. Come la DNA polimerasi, anche la RNA polimerasi aggiunge i nuovi nucleotidi all’estremità 3' del filamento in crescita, ma non ha bisogno di un primer per dare inizio al processo. Il nuovo RNA si allunga verso l’estremità 3' partendo dalla prima base che costituisce l’estremità 5'. Di conseguenza l’RNA trascritto è antiparallelo al filamento di stampo del DNA.

Diversamente dalla DNA polimerasi (descritta nel capitolo precedente), l’RNA polimerasi non revisiona né corregge il proprio lavoro. Gli errori di trascrizione si verificano al tasso di uno ogni 104-105 basi ma, poiché le copie di RNA sono eseguite in gran numero e spesso hanno una vita relativamente breve, tali errori non sono potenzialmente dannosi come le mutazioni del DNA.

3. Come fa l’RNA polimerasi a sapere quando smettere di aggiungere nucleotidi al trascritto di RNA in crescita? Analogamente al sito di inizio che precisa il punto di partenza della trascrizione, sul filamento stampo del DNA ci sono particolari sequenze di basi che ne stabiliscono la terminazione (▶figura 4C). Negli eucarioti il primo prodotto della trascrizione, o trascritto primario, è più lungo dell’mRNA maturo e deve andare incontro a un notevole processo di trasformazione prima di essere tradotto.

Figura 4
Figura 4open

La trascrizione del DNA porta alla formazione di RNA

Il DNA viene parzialmente srotolato a opera dell’RNA polimerasi e funge da stampo per la sintesi di RNA. Al termine del processo, il trascritto di RNA si allontana dal DNA, permettendo ai due filamenti del DNA di riavvolgersi a formare la doppia elica. La trascrizione del DNA si svolge in tre tappe: inizio, allungamento e terminazione. L’RNA polimerasi in realtà è molto più grande di come è mostrata nella figura, e copre un tratto di DNA pari a circa 50 paia di basi.
Figura 5
Figura 5open

L’inizio della trascrizione negli eucarioti

A eccezione del primo, che si lega al TATA box, ogni fattore di trascrizione di questo complesso possiede siti di legame soltanto per altre proteine del complesso e non si lega direttamente al DNA.

Capitolo

La trascrizione: dal DNA all’RNA

La traduzione richiede un codice genetico

Per mettere in relazione la sequenza dell’mRNA (e quindi del gene) con gli amminoacidi che compongono le proteine, occorre un codice genetico. Il codice genetico specifica l’amminoacido da utilizzare di volta in volta per costruire una proteina. L’informazione contenuta nella molecola di mRNA può essere vista come una serie lineare di parole di tre lettere. Ogni sequenza di tre basi (le tre «lettere») lungo la catena polinucleotidica dell’RNA è un’unità di codice, o codone, e specifica un particolare amminoacido. Ciascun codone è complementare alla corrispondente tripletta di basi nella molecola di DNA su cui è stato trascritto; così il codice genetico crea una corrispondenza tra i codoni e i loro specifici amminoacidi.

Nonostante l’uso che se ne fa comunemente, il codice genetico è il «linguaggio» in cui è scritta l’informazione e non l’informazione stessa, che viene più propriamente definita «messaggio genetico».

Il codice genetico completo si vede nella ▶figura 6. Noterai che ci sono molti più codoni di quanti siano i diversi amminoacidi delle proteine. Con quattro possibili «lettere» (le basi) si possono scrivere 64 (43) parole di tre lettere (i codoni), ma gli amminoacidi specificati da questi codoni sono soltanto 20. AUG, che codifica la metionina, è anche il codone di inizio, il segnale che avvia la traduzione. Tre codoni (UAA, UAG, UGA) funzionano da segnali di terminazione della traduzione, o codoni di stop; quando il dispositivo per la traduzione raggiunge uno di questi codoni, la traduzione si interrompe e il polipeptide si distacca dal complesso di traduzione. Il codice genetico presenta due caratteristiche principali:

Il codice è degenerato ma non è ambiguo.

Tolti i codoni di inizio e di stop, restano 60 codoni, molti di più di quelli strettamente necessari per codificare gli altri 19 amminoacidi: infatti a quasi tutti gli amminoacidi corrispondono più codoni. Per questo diciamo che il codice è degenerato (con questo si intende che è ridondante, ovvero esistono più «parole» che «oggetti»). Per esempio, la leucina è rappresentata da sei codoni diversi (vedi ▶figura 6). Soltanto la metionina e il triptofano sono rappresentati da un unico codone ciascuno.

L’aggettivo degenerato non va confuso con ambiguo. Il codice si definirebbe ambiguo se un singolo codone specificasse due o più amminoacidi diversi, lasciando incerto quale amminoacido inserire nella catena polipeptidica in accrescimento. La degenerazione del codice significa semplicemente che esistono più modi per dire «inserisci la leucina», ma ciascuno di essi è inequivocabile. Il codice genetico non è ambiguo: un dato amminoacido può essere specificato da più codoni, ma un dato codone può specificare un solo amminoacido.

Il codice genetico è (quasi) universale.

Oltre 40 anni di esperimenti su migliaia di organismi di ogni tipo dimostrano che il codice è quasi universale, cioè valido per ogni creatura del nostro pianeta. In tutte le specie, o quasi, un codone specifica sempre lo stesso amminoacido. Quindi il codice deve essersi affermato in tempi remoti e da allora deve essersi conservato immutato durante tutta l’evoluzione degli organismi viventi. Si conoscono tuttavia alcune eccezioni: il codice dei mitocondri e dei cloroplasti è un po’ diverso da quello dei procarioti e del nucleo delle cellule eucariotiche; in un gruppo di protisti, UAA e UAG codificano la glutammina anziché funzionare da codoni di stop. Il significato di queste differenze non è chiaro, ma si tratta di differenze modeste e rare.

L’esistenza di un codice comune significa che anche il linguaggio dell’evoluzione è uno solo. Poiché l’evoluzione è il risultato di cambiamenti graduali nel genoma dei vari tipi di organismi, la materia prima del cambiamento genetico è sempre rimasta la stessa. Come vedremo nel ▶capitolo B7, l’universalità del codice ha ripercussioni profonde anche sull’ingegneria genetica, perché ne deriva che un gene umano è scritto nello stesso codice di un gene batterico; perciò i dispositivi di trascrizione e di traduzione di un batterio possono utilizzare anche geni umani, oltre che i propri.

Figura 6
Figura 6open

Il codice genetico

L’informazione genetica è codificata nell’mRNA sotto forma di unità di tre lettere (codoni), formate dalle basi uracile (U), citosina (C), adenina (A) e guanina (G). Per decifrare un codone, si ricerca la prima lettera nella colonna a sinistra, quindi si scorre orizzontalmente cercando la seconda lettera nella fila in alto e infine si legge l’amminoacido corrispondente alla terza lettera della colonna di destra nella casella così selezionata.

Capitolo

La trascrizione: dal DNA all’RNA

Storia della scienza

Per decifrare il codice genetico, i biologi hanno usato messaggeri artificiali

Agli inizi degli anni Sessanta, i biologi molecolari sono riusciti a «decrittare» il codice genetico. Il problema in cui erano impegnati li lasciava perplessi: come è possibile scrivere 20 «parole» con un alfabeto di sole quattro «lettere»? Ovvero, come fanno le quattro basi (A, U, G, C) a specificare 20 diversi amminoacidi? Una possibilità era un codice a triplette, basato su codoni di tre lettere.

Disponendo di sole quattro lettere (A, U, G, C), chiaramente un codice a una sola lettera poteva codificare in modo non ambiguo soltanto quattro amminoacidi, e non 20. Un codice a due lettere ne avrebbe codificati 4 x 4 = 16, ancora troppo pochi. Ma un codice a triplette avrebbe potuto render conto di 4 x 4 x 4 = 64 codoni, più che sufficienti per 20 amminoacidi.

Il primo passo: Nirenberg e Matthaei

Il primo passo verso la decodificazione è stato compiuto nel 1961 dai biochimici Marshall W. Nirenberg e J. Heinrich Matthaei, quando capirono che come messaggero potevano usare un semplice polinucleotide artificiale invece che un mRNA naturale, ben più complesso; riuscirono quindi a identificare il polipeptide codificato da tale messaggero artificiale.

I due ricercatori prepararono un mRNA artificiale in cui tutte le basi erano costituite dall’uracile (un mRNA sintetico detto, appunto, poli U). Aggiungendo un poli U in una provetta contenente gli ingredienti necessari alla sintesi proteica, si formò una catena polipeptidica tutta composta da un solo tipo di amminoacido: la fenilalanina.

Dunque un poli U codificava la fenilalanina; di conseguenza, UUU era la parola in codice – il codone – per specificare la fenilalanina (▶figura).

Sulla scia di questo successo, Nirenberg e Matthaei dimostrarono ben presto che CCC codifica la prolina e AAA codifica la lisina (poli G presentava qualche problema dal punto di vista chimico e inizialmente non fu preso in esame). UUU, CCC e AAA erano tre codoni fra i più facili; per venire a capo degli altri fu necessario modificare l’approccio sperimentale.

Che cosa significa un singolo codone?

In seguito, altri scienziati hanno scoperto che era possibile legare a un ribosoma semplici mRNA artificiali lunghi tre sole basi (ciascuno equivalente a un codone) e che il complesso risultante induceva la formazione di un legame fra il tRNA corrispondente e il suo amminoacido specifico. Così, per esempio, un semplice UUU faceva legare al ribosoma il tRNA che trasportava la fenilalanina.

Dopo questa scoperta è stato relativamente semplice decifrare l’intero codice genetico. Per scoprire l’amminoacido rappresentato da un certo codone, Nirenberg ha ripetuto il suo esperimento usando un campione di mRNA artificiale con quel codone e ha osservato quale amminoacido si andava a legare.

open

La decifrazione del codice genetico

Nirenberg e Matthaei usarono un sistema di sintesi in vitro per determinare gli amminoacidi specificati da mRNA sintetici di composizione conosciuta.

sul libro: pag

preferenze

carattere

colori: