Proteine e DNA

Leggo che una open reading frame (ORF) è una sequenza di DNA o RNA che può essere tradotta in una proteina (da un ribosoma). D'altro canto leggo anche che, in biologia molecolare, il DNA di un gene codifica la struttura chimica di una proteina. Mi potete spiegare la differenza?
Massimo Centazzo
21 luglio 2005
In verità non esistono differenze tra Ie due definizioni, direi che la prima identifica la funzione di una parte particolare dell'mRNA e di conseguenza del DNA da cui l'mRNA deriva, mentre la seconda esprime un concetto molto più generale. Cercherò nella spiegazione estesa di chiarire alcuni fondamentali principi della biologia molecolare che credo permettano di chiarire i suoi dubbi.

Le proteine sono catene di particolari monomeri chiamati amminoacidi. Esistono 20 diversi amminoacidi nel mondo delle proteine e le migliaia di proteine che costituiscono un organismo vivente si differenziano per l'ordine sequenziale di concatenamento dei diversi amminoacidi.

Chi controlla l'assemblaggio sequenziale dei diversi amminoacidi? Lo fa il DNA tramite l'informazione contenuta nelle sue catene lineari formate da nucleotidi. Poiché i nucleotidi sono 4, sono necessari 3 nucleotidi(triplette) che daranno origine a 64 diverse combinazioni sufficienti e ridondanti per assemblare in modo ordinato le diverse proteine (le 64 combinazioni sono il codice genetico).

Il DNA è il depositario dell'informazione e non controlla direttamente l'assemblaggio degli amminoacidi, ma lo fa attraverso un intermediario chiamato RNA messaggero (mRNA). Il processo di produzione di mRNA a partire dal DNA si chiama trascrizione. L'mRNA, assieme a molte proteine (proteine ribosomiali, fattori d'inizio, d'allungamento, di terminazione ecc.), gli RNA di trasferimento e gli RNA ribosomiali, regola il processo conosciuto come sintesi delle proteine o traduzione (poiché da un codice a 4 lettere, i nucleotidi, si passa a un altro a 20 lettere, gli amminoacidi).

Un aspetto importante di questo processo è la sua regolazione che può essere sia temporale che tissutale. Ad esempio non tutte le proteine vengono assemblate e utilizzate dalle diverse cellule dei nostri tessuti (le cellule nervose ne hanno alcune specifiche che le cellule dell'intestino non hanno e viceversa), oppure nel corso della vita di una cellula. Una cellula giovane si caratterizza per proteine diverse rispetto a una cellula vecchia.

La cellula controlla la produzione delle sue proteine attraverso il suoi geni. I geni sono sequenze di nucleotidi del DNA che contengono l'informazione per svolgere una funzione. In alcuni casi la funzione è determinata dalla produzione della proteina in altri semplicemente dall'RNA. L'accensione controllata dai diversi geni nei diversi tessuti e in risposta a diverse condizioni ambientali (come descritto sopra, ad esempio giovane verso vecchio) costituisce il controllo differenziale dell'espressione genica.

Per permettere un'accensione regolata dei diversi geni e quindi della produzione delle diverse proteine esistono delle sequenze del gene che possiamo definire regolatrici. Un esempio ben conosciuto è quello del promotore che guida l'accesso del complesso macchinario trascrizionale deputato alla copiatura di un filamento di DNA in filamento di RNA.

Il promotore di un gene rappresenta un elemento fondamentale per regolare l'espressione genica (e quindi anche l'espressione della proteina corrispondente) ma non contiene le informazioni per assemblare gli amminoacidi.

Analogamente gli mRNA contengono sia sequenze nucleotidiche deputate all'assemblaggio della proteina (codoni) che sequenze regolatrici che non servono ad assemblare le proteine.

Le prime legheranno i corrispondenti anti-codoni dei tRNA, quelle parti di RNA che allineano ordinatamente gli amminoacidi alla molecola di mRNA, le seconde possono intervenire nella regolazione dell'espressione temporale e tissutale.

Le sequenze di mRNA che contengono le informazioni per assemblare gli amminoacidi vengono dette open reading frame (ORF, in italiano “cornice di lettura”) e indicano quella parte di mRNA che legando i diversi tRNA stabilirà che gli amminoacidi vengano concatenati, per formare una specifica proteina secondo l'informazione scritta nel DNA. Pressoché invariabilmente l'ORF inizierà nei diversi mRNA con lo stesso codone AUG detto d'inizio che codifica per l'amminoacido metionina e terminerà con i codoni di STOP che non trovano tRNA corrispondenti quali UAA UAG UGA.

L'ORF costituisce la parte centrale di un mRNA le sue estremità denominate 5' e 3' non tradotte (le definizioni 5' e 3' si rifanno al legame fosfodiesterico degli acidi nucleici ed è di riferimento per orientare gli stessi), contengono gli elementi regolativi.

Ad esempio l'estremità 5' non-tradotta contiene le sequenze che mediano l'interazione con il ribosoma o che regolano l'efficienza del processo di traduzione (uno stesso mRNA può produrre più o meno proteine nella stessa unità di tempo a seconda delle necessità della cellula). L'estremità 3' non-tradotta può contenere analogamente sequenze che regolano l'efficienza della traduzione o l'emivita dello stesso mRNA (quanto tempo durerà all'interno della cellula quel determinato RNA prima di essere degradato).

Claudio Brancolini Dipartimento di Scienze e Tecnologie Biomediche, Università di Udine

© Copyright SISSA - Scuola Internazionale Superiore di Studi Avanzati - Trieste (Italy) - 2001-2011