NON TUTTO QUELLO CHE SEMBRA SPAZZATURA È DA BUTTARE

  • Post Comments:0 Commenti
di Michele Stella

Il bello della scienza è che non finisce mai di scoprire. 

Tutti ben o male abbiamo un’idea di cosa sia il DNA, probabilmente la frase che dice: “il DNA è il manuale d’istruzioni che permette al nostro organismo di funzionare ed essere quello che siamo” è sicuramente una delle definizioni semplificatrici più gettonate e che ci è stata ripetuta durante le nostre esperienze scolastiche.

Molti sappiamo che l’unità fondamentale del nostro genoma è il gene, una sequenza nucleotidica di DNA che codifica per un RNA messaggero (che verrà tradotto in proteina), o RNA funzionali (se vi è piaciuta la similitudine di sopra immaginate il gene come le singole istruzioni di questo manuale).

Altri scopriranno che…. prima del Progetto Genoma Umano, si scommetteva che l’uomo avesse almeno 100.000 geni per spiegare la grande complessità propria degli individui appartenenti alla nostra specie. 

IMMAGINE 1  Dogma centrale della biologia: L’informazione genetica fluisce dal DNA all’RNA, fino ai polipeptidi (o proteine)[14]

Nel 1990 un consorzio internazionale (inclusi USA, Regno Unito, Francia, Australia e Cina) ha lanciato il Progetto Genoma Umano, con l’obiettivo di determinare l’intera sequenza e rilevare tutti i geni del genoma umano [3]. Nel 2001 è stata pubblicata una prima bozza del genoma umano [4], seguita dalla versione finale nel 2004 [5]. Fino ad allora, gli scienziati hanno cercato di stimare indirettamente il totale numero di geni umani che codificano per proteine utilizzando molti approcci, e partendo dai 100.000 geni di cui si pensava fosse composto, si arrivò a supporre un totale di 30.000-35.000 geni codificanti proteine. I risultati finali di Human Genome Project hanno rivelato che il nostro genoma comprende invece, circa 20.000-25.000 geni codificanti proteine [5], ma questo numero è stato recentemente corretto in circa 19.000 geni [6]. In maniera del tutto sorprendente, questo numero è inferiore al previsto e molto vicino al numero totale di geni codificanti le proteine di organismi meno complessi: Caenorhabditis elegans 19.735 geni, Gallus gallus 16.736 geni, Drosophila melanogaster 14.889 geni, Mus musculus 21.839 geni [7]. 

IMMAGINE 2 I virus, hanno solo una manciata di geni ma sono squisitamente ben adattati ai loro ambienti. I batteri come l’Escherichia coli hanno alcune migliaia di geni e le piante e gli animali multicellulari ne hanno da due a dieci volte di più. Al di là di queste semplici divisioni, il numero di geni in una specie ha poca relazione con le sue dimensioni o con misure intuitive di complessità [7].

Questa scoperta ha sorpreso la comunità scientifica, che era convinta che Homo sapiens avesse una maggiore complessità dovuta al maggior numero di geni rispetto agli organismi evolutivamente inferiori. Inoltre, è stato osservato che tutti i geni identificati durante il Progetto Genoma Umano rappresentano meno del 2% del l’intero genoma, mentre in altri organismi, eucariotici o procariotici, la frazione codificante del genoma è considerevolmente più alta [8].

IMMAGINE 3 confronto delle percentuali del genoma codificante tra Homo sapiens e altri organismi, sia procarioti che eucariotici [8]

I ricercatori chiamarono DNA “spazzatura” (junk DNA) tutti i pezzi del nostro genoma che sembravano non servire a nulla. E non si trattava di qualche frammento, ma di oltre il 90% del codice genetico. Forse un po’ troppo per non avere proprio alcun ruolo. 

Si è capito che una parte ce l’ha, e da poco è venuto fuori che è pure una parte da protagonista. Il risultato è frutto dell’immenso impegno del consorzio di ricerca pubblico ENCODE (Encyclopedia of DNA Elements), guidato dal National Genome Research Institute (NHGRI) statunitense e dallo European Bioinformatics Institute (EMBL-EBI), nel Regno Unito con lo scopo di identificare tutti gli elementi funzionali nel genoma umano.

“Lo Human Genome Project ci aveva mostrato che soltanto il 2% del genoma contiene le istruzioni per fare proteine. Con ENCODE, ora sappiamo che circa l’80% è impegnato in qualche attività biochimica”[15], ha detto Ewan Birney coordinatore delle analisi all’Embl-Ebi:
“E abbiamo trovato che una ben più grande parte del genoma (una quantità sorprendente, in effetti) è coinvolta nel controllo della produzione di proteine” [15].

Alcuni di questi regolatori sono molto distanti dal gene che attivano. I risultati finali, confermati da studi seguenti, hanno mostrato quindi che l’85-90% del genoma umano è trascritto: sono stati identificati numerosi nuovi siti di inizio della trascrizione, così come molte nuovi trascritti originati da geni situati in regioni non codificanti o che si sovrappongono a loci codificanti proteine [10, 11, 12]. Poiché queste nuove trascrizioni non sono state tradotte, sono state definite RNA non codificanti (ncRNA). È stato recentemente stimato che il numero di geni non codificanti tende ad aumentare esponenzialmente in modo ascendente sulla scala evolutiva, mentre il numero di geni codificanti proteine raggiunge un plateau: pertanto, potrebbe essere dovuta a questa classe di ncRNA una maggiore complessità dell’Homo sapiens rispetto ad organismi evolutivamente inferiori con un simile numero di geni codificante proteine [13]. 

ENCODE ha mandato definitivamente in soffitta il concetto di DNA spazzatura, assegnando a circa l’80% del genoma umano una funzione, attraverso l’annotazione degli elementi funzionali del DNA.

Insomma, il nostro DNA è molto di più che un semplice libretto di istruzioni, comprendere i fini meccanismi molecolari che regolano l’espressione genica e di conseguenza la biologia di ogni organismo è molto complesso e impegna ogni giorno le menti dei ricercatori.

Il bello della scienza è che non finisce mai di scoprire. “Ciò che sappiamo è una goccia, ciò che ignoriamo è un oceano”, diceva Isaac Newton.

NOTE E BIBLIOGRAFIA

DNA. L’acido desossiribonucleico (DNA) è un acido nucleico che contiene le informazioni genetiche necessarie alla biosintesi di RNA e proteine. Il DNA è un polimero organico a doppia catena (doppia elica) i cui monomeri sono chiamati nucleotidi. I nucleotidi sono costituiti da tre componenti fondamentali: un gruppo fosfato, uno zucchero pentoso (il desossiribosio) e una base azotata. Le basi azotate che entrano nella formazione dei nucleotidi sono quattro: adenina, timina, citosina e guanina. Negli eucarioti, il DNA si complessa all’interno del nucleo in strutture chiamate cromosomi. Negli altri organismi, privi di nucleo, esso può essere organizzato in cromosomi o meno.

RNA. l’acido ribonucleico (RNA), è un acido nucleico, e come il DNA, l’RNA è assemblato come una catena di nucleotidi, ma a differenza del DNA è più frequente in natura come un singolo filamento ripiegato su se stesso, piuttosto che un doppio filamento accoppiato. Gli organismi cellulari utilizzano l’RNA messaggero (mRNA) per trasmettere le informazioni genetiche. Molti virus codificano le loro informazioni genetiche utilizzando un genoma a RNA. Alcune molecole di RNA svolgono un ruolo attivo all’interno delle cellule al fine di catalizzare le reazioni biologiche, di controllo dell’espressione genica o per percepire e comunicare le risposte a segnali cellulari. Uno di questi processi attivi è la sintesi proteica, una funzione universale per cui molecole di mRNA dirigono l’assemblaggio delle proteine nei ribosomi.

  1. Crick FH. On protein synthesis. Symp Soc Exp Biol. 1958; 12:138-63.
  2. Jacob F, Monod J. Genetic regulatory mechanisms in the synthesis of proteins. J Mol Biol. 1961; 3:318-56.
  3. International Human Genome Sequencing Consortium. Initial sequencing and analysis of the human genome. Nature. 2001; 409:860-921.
  4. International Human Genome Mapping Consortium. A physical map of the human genome. Nature. 2001; 409:934-41.
  5. International Human Genome Sequencing Consortium. Finishing the euchromatic sequence of the human genome. Nature. 2004; 431:931-45.
  6. Ezkurdia I, Juan D, Rodriguez JM, Frankish A, Diekhans M, Harrow J, Vazquez J, Valencia A, Tress ML. Multiple evidence strands suggest that there may be as few as 19,000 human protein-coding genes. Hum Mol Genet. 2014; 23:5866-78.
  7. Pertea M, Salzberg SL. Between a chicken and a grape: estimating the number of human genes. Genome Biol. 2010; 11:206.
  8. Sana J, Faltejskova P, Svoboda M, Slaby O. Novel classes of non-coding RNAs and cancer. J Transl Med. 2012; 10:103.
  9. ENCODE Project Consortium. The ENCODE (ENCyclopedia Of DNA Elements) Project. Science. 2004; 306:636-40.
  10. ENCODE Project Consortium. Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project. Nature. 2007; 447:799-816.
  11. Hangauer MJ, Vaughn IW, McManus MT. Pervasive transcription of the human genome produces thousands of previously unidentified long intergenic noncoding RNAs. PLoS Genet. 2013; 9:e1003569.
  12. Jacquier A. The complex eukaryotic transcriptome: unexpected pervasive transcription and novel small RNAs. Nat Rev Genet. 2009; 10:833-44.
  13. Kristiaan Vanhercke. The power of RNA: discover next generation biomarkers and therapeutic targets. www.biogazelle.com.
  14. David Sadava David M. Hillis H. Craig Heller May R. Berenbaum. La nuova biologia.blu. 2015
  15. EMBL-EBI https://www.ebi.ac.uk/ 
  16. https://it.wikipedia.org/

Rispondi