biologìa molecolare
IndiceLessico
Branca della biologia che vuole definire tutti i processi vitali e le strutture degli organismi viventi attraverso le proprietà e le interazioni delle molecole che li compongono. Questo progetto è stato in gran parte realizzato e attualmente molte branche della biologia e della medicina progrediscono grazie a metodologie e concetti sviluppati dalla biologia molecolare (vedi anche origine della vita).
Cenni storici: gli studi sul DNA
Si possono far risalire le origini della biologia molecolare alla scoperta, nel 1944, del DNA come materiale genetico a opera di O. Avery e dei suoi collaboratori. Essi, usando il batterio pneumococco, dimostrarono che era possibile trasformare un ceppo di pneumococco non infettivo in uno infettivo, utilizzando come principio trasformante il DNA del ceppo infettivo, riprendendo alcuni esperimenti fatti tempo prima da Griffith. In seguito A. Hershey e M. Chase, usando come sistema modello i semplici batteriofagi (virus che infettano i Batteri), confermarono il risultato ottenuto da Avery sul pneumococco, dimostrando che il DNA era la loro componente genetica. Solo la molecola di DNA entrava, nel corso dell'infezione virale, all'interno del batterio ed era sufficiente alla formazione di una nuova popolazione di fagi completi. Da questo momento si aprì una folle corsa alla soluzione della struttura tridimensionale del DNA per comprenderne le caratteristiche di “molecola informazionale intelligente”. Nel 1953 J. Watson e F. Crick del Cavendish Laboratory di Cambridge proposero un modello per questa struttura e postularono immediatamente i possibili meccanismi di autoreplicazione dopo aver studiato le caratteristiche simmetriche e complementari della struttura stessa. Questi risultati furono conseguiti analizzando le immagini di diffrazione a raggi X di fibre di DNA, ottenute da R. FranklinM. Wilkins del King's College di Londra, e considerando i risultati biochimici ottenuti da E. Chargaff qualche tempo prima, il quale aveva stabilito che nel DNA il rapporto tra le basi adenina (A) e timina (T) era costante come anche quello tra citosina (C) e guanina (G). Le caratteristiche fondamentali della struttura sono le seguenti: le due catene sono avvolte a doppia elica intorno a un asse centrale e sono antiparallele; le due eliche sono appaiate mediante legami deboli tra le basi che si affacciano verso l'interno della struttura; esiste solo un possibile appaiamento tra le basi, A con T e C con G (questo spiega il loro rapporto costante), e inoltre non esiste restrizione nella sequenza delle basi lungo la catena polinucleotidica. La sequenza delle basi rappresenta l'informazione genetica e questa scoperta è stata di fondamentale importanza nella ricerca biologica, perché per la prima volta ha fatto pensare all'espressione dei geni in termini di meccanismi molecolari. Tale struttura, simmetrica e complementare, suggerì immediatamente un possibile meccanismo per la sua replicazione, che Watson e Crick definirono semiconservativo perché, al momento della duplicazione, il DNA si apre e ciascuna elica originaria, “madre”, serve da stampo per la produzione di un'elica “figlia”, rimanendo intatta e conservando in tal modo la sua sequenza e quindi l'informazione genetica. Questa ipotesi è stata dimostrata da M. Meselson e F. Stahl nel 1958, con un esperimento basato sulla separazione di molecole di DNA di peso diverso in ultracentrifugazione analitica, che ha permesso di seguire il destino di molecole di DNA “madri” e “figlie” prima e dopo la replicazione. L'informazione genetica era nascosta nelle sequenze delle basi del DNA, e in qualche maniera questa informazione veniva trasportata dal nucleo, contenente il DNA, al citoplasma, dove vengono sintetizzate le proteine che, sotto forma di enzimi, regolano le funzioni della cellula. Si ipotizzò quindi che l'RNA, dalla struttura molto simile al DNA, fungesse da messaggero tra il nucleo e il citoplasma. L'RNA messaggero è sintetizzato sullo stampo del DNA mediante un processo fondamentale dell'espressione genica che si chiama trascrizione, e il messaggio così prodotto viene trasportato nel citoplasma, dove i ribosomi traducono la sua sequenza, costituita di nucleotidi, in una sequenza corrispondente di amminoacidi, che compongono le proteine. Poiché esistono 20 amminoacidi e il DNA è composto da solo quattro basi, doveva esistere un codice che corrispondesse a tutti gli amminoacidi. Si è scoperto che il codice è scritto a gruppi di tre lettere, chiamate triplette o codoni che corrispondono a un singolo amminoacido e, avendo a disposizione 4 basi, si possono formare 64 triplette. Gli amminoacidi sono 20; quindi alcune triplette codificano per lo stesso amminoacido, segnalano ai ribosomi dove interrompere la catena e sono chiamate codoni di terminazione.
Cenni storici: gli studi sulle proteine
In quegli anni, contemporaneamente agli studi sul DNA, anche lo studio a livello molecolare delle proteine ha avuto uno sviluppo enorme. J. Kendrew e M. Perutz, scoprendo la struttura tridimensionale dell'emoglobina, hanno aperto la strada allo studio della relazione tra struttura e funzione, che è uno dei concetti fondamentali della biologia molecolare, parimenti a quello che afferma che i blocchi che costituiscono le macromolecole sono gli stessi per tutti gli organismi e che, come diceva J. Monod, scopritore insieme con F. Jacob e A. Lwoff di uno dei meccanismi di regolazione dell'espressione dei geni, “quello che vale per il batterio vale anche per l'elefante”. Tra i primi anni Sessanta e il 1975 sono state gettate le basi per lo sviluppo di alcuni principi fondamentali della biologia molecolare, come la risoluzione del codice genetico, funzione dell'RNA messaggero e dell'RNA di trasporto, la sintesi delle proteine e la formulazione del dogma centrale della biologia molecolare a opera di F. Crick che postula il flusso delle informazioni dal DNA all'RNA alle proteine. Questo dogma è stato successivamente messo in discussione, quando è stato isolato un enzima capace di produrre DNA da uno stampo fatto di RNA (trascrittasi inversa). In quegli anni sono state effettuate le prime sintesi di DNA in vitro dopo la scoperta da parte di A. Kornberg della DNA-polimerasi, l'enzima responsabile della replicazione del DNA. Il codice genetico è universale e la stessa sequenza di DNA viene tradotta nella stessa proteina in ogni organismo, quindi al suo livello non esistono barriere tra specie diverse. È stato possibile introdurre una sequenza di una proteina umana in un batterio e farla tradurre in una proteina perfettamente funzionante.
Cenni storici: gli esordi della manipolazione genetica
Questo risultato è stato molto importante per porre le basi della manipolazione genetica, che ha avuto a partire dalla metà degli anni Settanta del sec. XX un ruolo fondamentale sia da un punto di vista biotecnologico sia per quel che riguarda l'uso di strumenti sempre più sofisticati per il progresso nel campo della biologia molecolare. In quegli anni sono state sviluppate tecniche per localizzare e rimuovere geni specifici all'interno di sequenze di DNA di organismi diversi, per introdurle in Batteri e ottenere grandi quantità del prodotto del gene di interesse. La scoperta degli enzimi di restrizione è stata di importanza fondamentale per questo tipo di tecnologia, poiché essi sono in grado di riconoscere sequenze specifiche nel DNA e tagliarle. In seguito, con la scoperta della DNA-ligasi, un enzima che è in grado di ricucire il taglio introdotto dagli enzimi di restrizione, è stato possibile formare sequenze di DNA ibride tra organismi diversi. I primi esperimenti di questo genere furono condotti nel laboratorio di P. Berg a Stanford, in California, intorno al 1972; successivamente S. Cohen e H. Boyer usarono per la prima volta un piccolo cromosoma batterico (plasmide) come vettore per inserire frammenti di DNA diversi all'interno delle cellule di Escherichia coli. Questo piccolo DNA circolare era in grado di replicarsi autonomamente dal cromosoma interno del batterio, usando l'apparato enzimatico della replicazione della cellula ospite e dando origine a un clone che conteneva centinaia di copie del DNA ricombinante. L'impulso che queste tecnologie hanno dato alla ricerca biologica è incommensurabile. Da quel momento è stato possibile studiare geni umani in organismi semplici e inoltre sono state rese disponibili metodologie biotecnologiche per produrre a basso costo, nei Batteri, proteine essenziali per la biomedicina come, per esempio, l'insulina per curare il diabete. Le nostre conoscenze sui meccanismi molecolari dell'espressione e della regolazione dei geni sono progredite, da questo momento in poi, in maniera vorticosa e la biologia molecolare ha unificato in una grossa corrente metodologica la genetica, la medicina, la biologia evoluzionistica, l'immunologia, la biologia cellulare e la biotecnologia. Le frontiere della ricerca in questi campi sono il frutto della diversa applicazione dei concetti basilari della biologia molecolare. Le tecniche di sequenziamento del DNA, sviluppate da A. Maxam e W. Gilbert a Harvard e da F. Sanger a Cambridge, in Gran Bretagna, alla fine degli anni Settanta, e l'individuazione dell'RNA come molecola genetica hanno aperto nuove strade alla conoscenza sulla struttura dei geni, sulle sequenze che ne regolano l'espressione e sui meccanismi molecolari della loro regolazione. Si conosceva il ruolo di stampo e di messaggio che la molecola di RNA svolge nel meccanismo della sintesi delle proteine, ma la scoperta che alcuni virus usano l'RNA come molecola per immagazzinare le informazioni genetiche ha suggerito che potessero esistere meccanismi diversi per organismi diversi. Alcuni virus fanno del tutto a meno del DNA e la molecola di RNA viene replicata come un filamento doppio e poi trascritta e usata nella sintesi delle proteine per produrre un nuovo virus. Non tutti i virus a RNA, tuttavia, si replicano usando intermedi di RNA a doppio filamento, come nel caso dei retrovirus (per esempio l'HIV). In questo caso l'RNA infettante serve come stampo per la sintesi di una catena di DNA complementare, che si inserisce nel cromosoma della cellula ospite e viene poi trascritto per formare altro RNA virale. Furono D. Baltimore e H. Temin a scoprire, indipendentemente, l'enzima trascrittasi inversa che è capace di sintetizzare il DNA usando come stampo l'RNA. Questo nuovo concetto rendeva reversibile uno degli assunti del dogma centrale di Crick: DNA-RNA-proteine.
Cenni storici: le scoperte su gene e genomi
Alla fine degli anni Settanta, un'altra grande scoperta ha permesso di ottenere nuove informazioni sul concetto di gene e di genoma. Sorprendentemente si scoprì che le sequenze nucleotidiche che specificano per gli amminoacidi dell'emoglobina e dell'ovalbumina sono frequentemente interrotte da regioni di nucleotidi che non codificano per nessuna regione proteica. Questa non colinearità tra la sequenza del DNA e il prodotto proteico finale ha fatto ipotizzare una serie di meccanismi di regolazione complessa per l'espressione dei geni. Le regioni codificanti si dicono esoni e quelle non codificanti introni: quasi tutti i geni degli organismi eucarioti sono organizzati in questa maniera complessa. Gli introni vengono rimossi al livello dell'RNA attraverso un meccanismo detto splicing, che in inglese vuole dire rilegare le estremità recise di una corda, per formare l'RNA messaggero maturo che corrisponde alla sequenza proteica. Gli studi sul meccanismo di splicing dell'RNA hanno portato a un'altra scoperta fondamentale della biologia molecolare, l'isolamento di molecole di RNA capaci di autotagliarsi. La molecola di RNA può, in condizioni particolari e in relazione alla sua sequenza, comportarsi come un vero e proprio enzima (ribozima); inoltre alcuni enzimi proteici coinvolti nel meccanismo di splicing contengono una componente di RNA. Questo concetto nuovo introdotto dai lavori di S. Altman e Th. Cech ha permesso di formulare nuove ipotesi sulle molecole responsabili dell'origine della vita sulla Terra, postulando l'esistenza di un mondo fatto di RNA.
Risultati recenti e sviluppi futuri
I concetti e le metodologie messi a punto dalla biologia molecolare hanno permesso di formulare nuove ipotesi sui meccanismi dell'espressione dei geni sia durante lo sviluppo embrionale sia nelle malattie genetiche e nei tumori, e la grande rivoluzione degli ultimi anni del sec. XX è rappresentata dalla rapidità con la quale è possibile passare da un risultato ottenuto dalla ricerca di base alle sue applicazioni biomediche e industriali. Lo schema di lavoro che la biologia molecolare ha imposto a quasi tutte le discipline biomediche è basato sull'isolamento di un gene, sull'individuazione del suo prodotto, sulla caratterizzazione della sua regolazione, sulla soluzione della struttura tridimensionale e sulla determinazione del suo meccanismo di azione in rapporto alla sua funzione cellulare. Gli esempi che seguono sono una sintesi di alcuni argomenti che la biologia moderna ha affrontato e a cui la biologia molecolare ha dato un contributo essenziale. § Rapporto struttura-funzione. Sono stati isolati e caratterizzati centinaia di geni e in molti casi si conosce la struttura tridimensionale del loro prodotto. Le tecniche di cristallografia dei materiali biologici hanno avuto un impulso enorme grazie a metodologie che permettono di purificare grandi quantità della proteina che interessa e ottenerne cristalli. Questi cristalli vengono analizzati con metodi di diffrazione a raggi X e la struttura tridimensionale viene risolta assegnando a ciascun atomo una precisa posizione nello spazio. Viene quindi definita la forma di una molecola e sono individuate le regioni responsabili della sua attività biologica. Questi studi sono affiancati da analisi biochimiche e genetiche che, introducendo mutazioni in siti specifici, aiutano a comprendere il meccanismo di azione della proteina. Un'analisi strutturale così dettagliata ha permesso di definire famiglie di strutture che hanno funzioni specializzate all'interno della cellula. Per esempio, le proteine che si legano al DNA per regolarne l'espressione o per mantenerne in ordine la struttura si dividono in gruppi precisi caratterizzati da differenti strutture, la cui diversità si basa sul tipo di interazione che esse hanno con la regione di contatto: forte, debole, o mediata da altre componenti proteiche. I fattori che regolano la trascrizione dell'RNA riconoscono, attraverso la loro struttura, regioni specifiche di DNA e sono in grado di legarsi esclusivamente alla regione desiderata. Nella regolazione dei processi biologici fondamentali, il ruolo delle interazioni tra proteine è essenziale e inoltre rappresenta una delle frontiere della biologia molecolare moderna. Negli ultimi anni del sec. XX sono stati messi a punto dei saggi biologici che rendono possibile l'isolamento specifico e la caratterizzazione di proteine che interagiscono con altre proteine note. Queste metodologie, per esempio, hanno permesso l'isolamento di molte proteine che regolano il ciclo cellulare. § La diversità degli anticorpi. La biologia molecolare ha dato anche un enorme contributo alla comprensione dei meccanismi molecolari alla base della diversità degli anticorpi. Ciascun anticorpo è composto da due identiche catene pesanti (H) e due identiche catene leggere (L), che contengono in un'estremità la specificità per l'interazione con l'antigene. La grande diversità degli anticorpi è generata da un riarrangiamento del DNA che codifica per le regioni variabili delle catene pesante e leggera, e questa ricombinazione tra porzioni di geni diversi avviene per ogni cellula che è stata destinata alla formazione di un particolare tipo di anticorpo. Questa cellula e le sue figlie produrranno stabilmente quel determinato anticorpo. Nella risposta immunitaria sono essenziali i rapporti tra linfociti T e B ed esiste, sulla superficie dei linfociti T, un tipo di complesso proteico chiamato T cell receptor che ha la capacità di discriminare tra vari antigeni con una specificità analoga a quella degli anticorpi. Questa molecola, inoltre, è in grado di riconoscere e di non danneggiare le cellule del proprio organismo mediante un'interazione con una proteina fondamentale, detta complesso maggiore di istocompatibilità (MHC), che fa riconoscere come proprie le cellule dell'organismo. Studi recenti di biologia molecolare hanno permesso di individuare la struttura tridimensionale del maggiore complesso di istocompatibilità sviluppando un intero filone di ricerca di immunologia molecolare. § Il sequenziamento del genoma umano. Tra i progetti più ambiziosi della biologia molecolare, per il grande sforzo economico e di risorse umane necessarie alla sua realizzazione, a un decennio dal suo inizio, il progetto genoma ha fornito una massa di informazioni utili sia alla ricerca di base sia alla comprensione delle malattie genetiche. È ormai possibile isolare e sequenziare un nuovo gene di cui non si conosce la funzione e cercare immediatamente nelle banche dati un possibile omologo la cui la funzione è nota: lo sviluppo di software molto efficienti permette di utilizzare in tempo reale le banche dati e di confrontare le sequenze di organismi diversi fornendo così un grande contributo al loro studio evolutivo. È stato invece completato, nel 1996, il sequenziamento dell'intero genoma del lievito Saccharomyces cerevisiae, un microorganismo che rappresenta, per la genetica e la biologia molecolare, un sistema modello tra i più usati a causa delle sue somiglianze con le cellule di organismi più evoluti come l'uomo. § Oncogeni e cancro. Il cancro costituisce una delle aberrazioni del comportamento cellulare, e il suo studio a livello di biologia molecolare è stato essenziale per la comprensione di alcuni suoi meccanismi e per lo sviluppo di farmaci sempre più efficaci. L'espressione di geni tumorali (oncogeni) può trasformare una cellula normale in una cancerosa. Questi oncogeni derivano da geni che controllano la crescita cellulare e sono rappresentati da cinque diversi tipi di proteine: fattori di crescita, recettori, trasduttori dei segnali all'interno della cellula, fattori che regolano la trascrizione dell'RNA messaggero e proteine che controllano il ciclo cellulare. Gli oncogeni possono essere sia di origine cellulare ed essere prodotti da alterazioni della struttura del DNA che provocano una attivazione del loro messaggio, sia di origine virale, quando sono trasportati all'interno della cellula da retrovirus (per esempio l'HIV) il cui studio molecolare ha dimostrato che essi si integrano nel genoma delle cellule trasformate e ne alterano la regolazione. Il virus dell'HIV ha meccanismi molecolari di azione simili a quelli dei retrovirus oncogeni e tuttavia non provoca tumori nell'uomo. Però, il danno che esso provoca al nostro organismo causa indirettamente alcuni tipi di tumori poiché ne fa diminuire le difese contro le cellule tumorali che vengono naturalmente eliminate in un individuo sano. Diversamente dai virus oncogeni, l'HIV uccide le cellule che infetta e, poiché il suo bersaglio specifico sono le cellule che costituiscono il sistema immunitario, provoca una grave forma di immunodeficienza (AIDS). Il genoma del virus HIV comprende vari geni che gli permettono di propagarsi a grande velocità. La conoscenza a livello molecolare del virus, del suo ciclo vitale e dei meccanismi della sua propagazione è un esempio che ben dimostra l'importanza dell'applicazione di metodiche e concetti sviluppati dalla biologia molecolare Questi risultati hanno consentito di disegnare delle strategie terapeutiche rivolte a inibire varie componenti del suo ciclo, tra questi i recentissimi inibitori delle proteasi, i quali agiscono su un enzima che, tagliando specificamente alcune proteine virali, le rende pronte per la loro azione nella propagazione virale e si propone anche la realizzazione di un possibile vaccino. Per concludere, nella gerarchia dell'organizzazione biologica i geni e la loro regolazione rappresentano il gradino più alto, poiché non solo specificano la struttura delle proteine, ma regolano l'organizzazione della cellula e, tramite questa, regolano l'intero organismo.