Replicazione e ricombinazione del DNA

“Anche se i fatti sono intrinsecamente meno soddisfacenti delle conclusioni intellettuali tratte da essi, la loro importanza non dovrebbe mai essere messa in discussione.” James D. Watson, 2002.

Il DNA porta tutta l’informazione genetica della vita. Una molecola di DNA enormemente lunga forma ciascuno dei cromosomi di un organismo, 23 in un uomo. L’unità vivente fondamentale è la singola cellula. Una cellula dà origine a molte altre cellule attraverso ripetizioni seriali di un processo noto come divisione cellulare. Prima di ogni divisione, devono essere fatte nuove copie di ciascuna delle molte molecole che formano la cellula, compresa la duplicazione di tutte le molecole di DNA. La replicazione del DNA è il nome dato a questo processo di duplicazione, che permette alle informazioni genetiche di un organismo – i suoi geni – di passare alle due cellule figlie create quando una cellula si divide. Solo un po’ meno centrale per la vita è un processo che richiede acrobazie dinamiche sul DNA, chiamato ricombinazione omologa del DNA, che rimescola i geni sui cromosomi. In reazioni strettamente legate alla replicazione del DNA, il macchinario di ricombinazione ripara anche i danni che inevitabilmente si verificano alle lunghe e fragili molecole di DNA all’interno delle cellule (vedi l’articolo di Friedberg in questo numero, pagina 436).

Il modello della doppia elica del DNA1 proposto da James Watson e Francis Crick si basa su due filamenti di DNA accoppiati che sono complementari nella loro sequenza nucleotidica. Il modello ha avuto implicazioni sorprendenti per i processi di replicazione e ricombinazione del DNA. Prima del 1953, non c’era alcun modo significativo di speculare sui meccanismi molecolari di questi due processi genetici centrali. Ma la proposta che ogni nucleotide in un filamento di DNA fosse strettamente accoppiato in base al suo nucleotide complementare sul filamento opposto – adenina (A) con timina (T), o guanina (G) con citosina (C) – significava che qualsiasi parte della sequenza nucleotidica poteva agire come modello diretto per la porzione corrispondente dell’altro filamento. Di conseguenza, qualsiasi parte della sequenza può essere usata sia per creare che per riconoscere la sequenza nucleotidica partner – le due funzioni che sono centrali per la replicazione del DNA e la ricombinazione del DNA, rispettivamente.

In questa rassegna, discuterò come la scoperta della struttura del DNA mezzo secolo fa abbia aperto nuove strade per la comprensione dei processi di replicazione e ricombinazione del DNA. Sottolineerò anche come, man mano che la nostra comprensione delle molecole biologiche complesse e delle loro interazioni è aumentata nel corso degli anni, ci sono stati profondi cambiamenti nel modo in cui i biologi vedono la chimica della vita.

Caratteristiche strutturali del DNA

La ricerca che seguì immediatamente la scoperta della doppia elica si concentrò principalmente sulla comprensione delle proprietà strutturali della molecola. Il DNA specifica l’RNA attraverso il processo di trascrizione genica, e le molecole di RNA a loro volta specificano tutte le proteine di una cellula. Questo è il “dogma centrale” del trasferimento delle informazioni genetiche2. Qualsiasi lettura dell’informazione genetica – che sia durante la replicazione del DNA o la trascrizione genica – richiede l’accesso alla sequenza delle basi sepolte all’interno della doppia elica. La separazione dei filamenti di DNA è quindi fondamentale per la funzione del DNA. Così, il modello Watson-Crick ha spinto gli scienziati a cercare condizioni che interrompessero i legami idrogeno che uniscono le coppie di basi complementari, in modo da separare i due filamenti della doppia elica del DNA.

I chimici fisici hanno scoperto che riscaldando una soluzione di DNA a temperature vicine all’ebollizione (100 °C), o sottoponendola a pH estremi, i filamenti si separano – un cambiamento definito “denaturazione del DNA”. La cosiddetta “temperatura di fusione” (o Tm) di un tratto di sequenza di DNA dipende dalla sua composizione nucleotidica: i DNA con una maggiore proporzione di coppie di basi G-C mostrano una Tm più alta a causa dei tre legami idrogeno che Watson e Crick avevano previsto per tenere insieme una coppia di basi G-C, rispetto ai soli due della coppia di basi A-T. A concentrazioni fisiologiche di sale, la Tm del DNA dei mammiferi è quasi 90 °C, a causa del particolare mix delle sue coppie di basi (47% G-C e 53% A-T)3.

Inizialmente sembrava inconcepibile che, una volta separato dal suo partner complementare, un filamento di DNA potesse riformare di nuovo una doppia elica. In un complesso miscuglio di molecole di DNA, una tale impresa richiederebbe di trovare l’unica sequenza corrispondente tra milioni di collisioni casuali con altre sequenze, e poi riavvolgere rapidamente con un nuovo filamento partner. La drammatica scoperta di questo fenomeno inaspettato4, chiamato “rinaturazione del DNA”, ha fatto luce su come le sequenze possano essere riorganizzate dalla ricombinazione del DNA. E ha anche fornito un mezzo fondamentale per manipolare il DNA in laboratorio. L’annealing di sequenze nucleotidiche complementari, un processo chiamato ibridazione, costituisce la base di diverse tecnologie del DNA che hanno contribuito a lanciare l’industria biotecnologica e la genomica moderna. Queste includono la clonazione dei geni, il sequenziamento genomico e la copiatura del DNA tramite la reazione a catena della polimerasi (vedi articolo di Hood e Galas a pagina 444).

La disposizione delle molecole di DNA nei cromosomi ha presentato un altro mistero per gli scienziati: una molecola lunga e sottile sarebbe altamente sensibile alla rottura indotta dal taglio, ed era difficile immaginare che un cromosoma di mammifero potesse contenere solo una singola molecola di DNA. Ciò richiederebbe che un tipico cromosoma sia formato da un’elica continua di DNA lunga più di 100 milioni di coppie di nucleotidi – una molecola enorme che pesa più di 100 miliardi di dalton, con una distanza da un’estremità all’altra di più di 3 cm. Come poteva una molecola così gigante essere protetta dalla frammentazione accidentale in una cellula di pochi micron di diametro, pur mantenendola organizzata per un’efficiente lettura dei geni e altre funzioni genetiche?

Non c’erano precedenti per molecole così giganti al di fuori del mondo della biologia. Ma all’inizio degli anni ’60, studi autoradiografici rivelarono che il cromosoma del batterio Escherichia coli era in realtà una singola molecola di DNA, lunga più di 3 milioni di coppie di nucleotidi5. E quando – più di un decennio dopo – tecniche fisiche innovative dimostrarono che un’unica enorme molecola di DNA formava la base di ogni cromosoma dei mammiferi6, il risultato fu accolto dagli scienziati con poca sorpresa.

I bivi della replicazione del DNA

Come fa la molecola di DNA a doppio filamento, enormemente lunga, a formare un cromosoma, ad essere copiata accuratamente per produrre un secondo cromosoma identico ogni volta che una cellula si divide? Il modello di template per la replicazione del DNA, proposto da Watson e Crick nel 1953 (rif. 7), ha ottenuto l’accettazione universale dopo due scoperte alla fine degli anni ’50. Una era un elegante esperimento che utilizzava DNA batterico marcato con densità e che confermava lo schema previsto template-anti-template8. L’altra fu la scoperta di un enzima chiamato DNA polimerasi, che utilizza un filamento di DNA come modello per sintetizzare un nuovo filamento complementare9. Quattro nucleotidi trifosfati deossiribonucleosidici – dATP, dTTP, dGTP e dCTP – sono i precursori di un nuovo filamento di DNA figlio, ogni nucleotide selezionato per accoppiamento con il suo nucleotide complementare (T, A, C o G, rispettivamente) sul filamento modello dei genitori. La DNA polimerasi ha dimostrato di utilizzare questi trifosfati per aggiungere nucleotidi uno alla volta all’estremità 3′ della molecola di DNA appena sintetizzata, catalizzando così la crescita della catena di DNA nella direzione chimica da 5′ a 3′.

Anche se la sintesi di brevi tratti di sequenza di DNA su un modello a singolo filamento poteva essere dimostrata in una provetta, come si replica un’enorme molecola di DNA a doppio filamento ritorto era un rompicapo. All’interno della cellula, si è osservato che la replicazione del DNA avviene in una struttura a forma di Y, chiamata “forcella di replicazione”, che si muove costantemente lungo un’elica di DNA parentale, filando due eliche di DNA figlie dietro di essa (i due bracci della “Y”)5. Come previsto da Watson e Crick, i due filamenti della doppia elica corrono in direzioni chimiche opposte. Pertanto, quando una forcella di replicazione si muove, la DNA polimerasi può muoversi continuamente lungo un solo braccio della Y – il braccio su cui il nuovo filamento figlio viene allungato nella direzione chimica da 5′ a 3′. Sull’altro braccio, il nuovo filamento figlio dovrebbe essere prodotto nella direzione chimica opposta, da 3′ a 5′ (Fig. 1a). Così, mentre le previsioni centrali di Watson e Crick furono confermate alla fine del primo decennio di ricerca che seguì la loro scoperta storica, i dettagli del processo di replicazione del DNA rimasero un mistero.

Figura 1: La forcella di replicazione del DNA.

a, I trifosfati nucleosidici servono come substrato per la DNA polimerasi, secondo il meccanismo mostrato sul filamento superiore. Ogni nucleoside trifosfato è composto da tre fosfati (qui rappresentati da sfere gialle), uno zucchero desossiribosio (rettangolo beige) e una delle quattro basi (cilindri di colore diverso). I tre fosfati sono uniti tra loro da legami ad alta energia, e la scissione di questi legami durante la reazione di polimerizzazione libera l’energia libera necessaria per guidare l’incorporazione di ogni nucleotide nella catena crescente del DNA. La reazione mostrata sul filamento inferiore, che causerebbe la crescita della catena di DNA nella direzione chimica da 3′ a 5′, non si verifica in natura. b, le DNA polimerasi catalizzano la crescita della catena solo nella direzione chimica da 5′ a 3′, ma entrambi i nuovi filamenti figli crescono alla forcella, quindi un dilemma degli anni ’60 era come veniva sintetizzato il filamento inferiore in questo diagramma. La natura asimmetrica della forcella di replicazione è stata riconosciuta all’inizio degli anni ’70: il ‘leading strand’ cresce continuamente, mentre il ‘lagging strand’ viene sintetizzato da una DNA polimerasi attraverso il meccanismo di backstitching illustrato. Così, entrambi i filamenti sono prodotti dalla sintesi del DNA nella direzione da 5′ a 3′. (Ridisegnato da rif. 27, con permesso.)

Ricostruire la replicazione

Il mistero è stato risolto nel corso dei due decenni successivi, un periodo in cui sono state identificate le proteine che costituiscono gli attori centrali nel processo di replicazione del DNA. Gli scienziati hanno usato una varietà di approcci sperimentali per identificare una serie sempre crescente di prodotti genici ritenuti critici per la replicazione del DNA. Per esempio, sono stati identificati organismi mutanti in cui la replicazione del DNA era difettosa, e le tecniche genetiche hanno potuto essere usate per identificare gruppi specifici di geni richiesti per il processo di replicazione10,11,12. Con l’aiuto delle proteine specificate da questi geni, sono stati stabiliti sistemi “cell-free”, dove il processo è stato ricreato in vitro usando componenti purificati. Inizialmente, le proteine sono state testate in una “reazione di replicazione parziale”, in cui era presente solo un sottoinsieme del macchinario proteico richiesto per il processo di replicazione completo, e il modello di DNA era fornito in una forma a singolo filamento13. Le nuove proteine identificate venivano aggiunte una alla volta o in combinazione per testare i loro effetti sull’attività catalitica della DNA polimerasi. Ulteriori progressi nella comprensione della replicazione dipendevano poi dalla creazione di sistemi in vitro più complessi, in cui, attraverso l’aggiunta di un più ampio insieme di proteine purificate, il DNA a doppio filamento poteva essere replicato14,15.

Oggi, quasi ogni processo all’interno delle cellule – dalla replicazione e ricombinazione del DNA al trasporto delle vescicole di membrana – viene studiato in un sistema in vitro ricostruito da componenti purificati. Anche se laboriosi da stabilire, tali sistemi permettono il controllo preciso sia della concentrazione che della struttura dettagliata di ogni componente. Inoltre, il “rumore” nel sistema naturale causato dalle reazioni collaterali – perché la maggior parte delle molecole in una cellula sono impegnate in più di un tipo di reazione – è evitato eliminando le proteine che catalizzano queste altre reazioni. In sostanza, una piccola frazione della cellula può essere ricreata come un insieme delimitato di reazioni chimiche, rendendola completamente suscettibile di uno studio preciso usando tutti gli strumenti della fisica e della chimica.

Entro il 1980, i sistemi multiproteici in vitro avevano permesso una caratterizzazione dettagliata del macchinario di replicazione e risolto il problema di come il DNA viene sintetizzato su entrambi i lati della forcella di replicazione (Fig. 1b). Un filamento figlio di DNA viene sintetizzato continuamente da una molecola di DNA polimerasi che si muove lungo il “filamento principale”, mentre una seconda molecola di DNA polimerasi sul “filamento ritardatario” produce una lunga serie di frammenti (chiamati frammenti Okazaki)16 che vengono uniti dall’enzima DNA ligasi per produrre un filamento continuo di DNA. Come ci si potrebbe aspettare, c’è una differenza nelle proteine richieste per la sintesi del DNA del filamento principale e di quello in ritardo (vedi Box 1). Sorprendentemente, le forchette di replicazione formate in questi sistemi artificiali potevano muoversi agli stessi rapidi ritmi delle forchette all’interno delle cellule (da 500 a 1.000 nucleotidi al secondo), e il modello di DNA veniva copiato con una fedeltà incredibilmente alta.15

Man mano che si scopriva che sempre più proteine funzionavano alla forchetta di replicazione, si potevano fare confronti tra i macchinari di replicazione di diversi organismi. Gli studi del macchinario di replicazione in virus, batteri ed eucarioti hanno rivelato che un insieme comune di attività proteiche guida le forchette di replicazione in ogni organismo (Box 1). Ogni sistema consiste di: una molecola di DNA polimerasi che conduce e una che ritarda; una DNA primasi per produrre i primer RNA che iniziano ogni frammento Okazaki; proteine leganti il DNA a singolo filamento che rivestono il DNA modello e lo tengono in posizione; una DNA elicasi che svolge la doppia elica; e ulteriori proteine accessorie della polimerasi che legano le polimerasi tra loro e al DNA modello. Man mano che si procede da un semplice virus a organismi più complessi, come i lieviti o i mammiferi, il numero di subunità che compongono ogni tipo di attività proteica tende ad aumentare. Per esempio, il numero totale di subunità polipeptidiche che formano il nucleo dell’apparato di replicazione aumenta da quattro e sette nei batteriofagi T7 e T4, rispettivamente, a 13 nel batterio E. coli. E si espande ad almeno 27 nel lievito Saccharomyces cerevisiae e nei mammiferi. Così, con l’evoluzione di organismi con genomi più grandi, il macchinario di replicazione ha aggiunto nuove subunità proteiche, senza alcun cambiamento nei meccanismi di base15,18,19,20.

Mentre il lavoro che ho descritto sulla replicazione del DNA avanzava, altri gruppi di ricercatori stavano creando sistemi in vitro in cui la ricombinazione omologa del DNA poteva essere ricostruita. L’attore centrale in queste reazioni era il tipo di proteina RecA17, che prende il nome dal mutante batterico difettoso nella ricombinazione che ha portato alla sua scoperta (Box 2).

Macchine proteiche

Come per tutti gli altri aspetti della biochimica cellulare, l’apparato di replicazione del DNA si è evoluto nel corso di miliardi di anni per “tentativi ed errori”, cioè per variazione casuale seguita da selezione naturale. Con il tempo, una proteina dopo l’altra poteva essere aggiunta al mix di proteine attive alla forcella di replicazione, presumibilmente perché la nuova proteina aumentava la velocità, il controllo o la precisione del processo globale di replicazione. Inoltre, la struttura di ogni proteina era messa a punto da mutazioni che alteravano la sua sequenza di aminoacidi in modo da aumentare la sua efficacia. I risultati finali di questo insolito processo di ingegneria sono i sistemi di replicazione che osserviamo oggi in diversi organismi. Ci si potrebbe quindi aspettare che il meccanismo di replicazione del DNA sia altamente dipendente da eventi casuali del passato. Ma l’evoluzione ha selezionato per qualsiasi cosa funzioni, senza bisogno di eleganza?

Per i primi 30 anni dopo la scoperta di Watson e Crick, la maggior parte dei ricercatori sembrava ritenere che i processi cellulari potessero essere sciatti. Questa opinione era incoraggiata dalla conoscenza dell’enorme velocità dei movimenti a livello molecolare (per esempio, si sapeva che una tipica proteina si scontra con una seconda molecola presente ad una concentrazione di 1 mM circa 106 volte al secondo). Inizialmente si pensava che la rapidità dei movimenti molecolari permettesse ad un processo come la replicazione del DNA di avvenire senza alcuna organizzazione delle proteine coinvolte nello spazio tridimensionale.

Al contrario, i biologi molecolari ora riconoscono che l’evoluzione ha selezionato per sistemi altamente ordinati. Così, per esempio, non solo le parti del macchinario di replicazione sono tenute insieme in allineamenti precisi per ottimizzare le loro interazioni reciproche, ma i cambiamenti guidati dall’energia nelle conformazioni delle proteine sono usati per generare movimenti coordinati. Questo assicura che ciascuno dei passi successivi in un processo complesso come la replicazione del DNA sia strettamente coordinato con quello successivo. Il risultato è un assemblaggio che può essere visto come una “macchina proteica”. Per esempio, la molecola di DNA polimerasi sul lato ritardatario della forcella di replicazione rimane legata alla molecola di DNA polimerasi del filamento principale per assicurare che la stessa polimerasi del filamento ritardatario sia usata più e più volte per una sintesi efficiente dei frammenti di Okazaki18,20,21 (Box 1). E la replicazione del DNA non è affatto unica. Ora crediamo che quasi tutti i processi biologici siano catalizzati da un insieme di dieci o più proteine interagenti e posizionate spazialmente che si muovono in modo altamente ordinato in un assemblaggio simile a una macchina22. La replicazione, la riparazione e la ricombinazione della doppia elica del DNA sono spesso considerate come processi separati e isolati. Ma all’interno della cellula, la stessa molecola di DNA è in grado di subire una qualsiasi di queste reazioni. Inoltre, si verificano combinazioni specifiche dei tre tipi di reazioni. Per esempio, la ricombinazione del DNA è spesso collegata direttamente alla replicazione del DNA o alla riparazione del DNA23. Affinché l’integrità di un cromosoma sia adeguatamente mantenuta, ogni specifica reazione deve essere attentamente diretta e controllata. Ciò richiede che i gruppi di proteine siano assemblati sul DNA e attivati solo dove e quando sono necessari. Anche se resta ancora molto da imparare su come vengono fatte queste scelte, sembra che diversi tipi di strutture di DNA siano riconosciuti esplicitamente da proteine specializzate che servono come “fattori di assemblaggio”. Ogni fattore di assemblaggio serve poi a nucleare un assemblaggio cooperativo dell’insieme di proteine che forma una particolare macchina proteica, come necessario per catalizzare una reazione appropriata a quel momento e luogo nella cellula.

Una visione del futuro

È diventata una consuetudine, sia nei libri di testo che nella normale letteratura scientifica, spiegare i meccanismi molecolari attraverso semplici disegni bidimensionali o ‘vignette’. Tali disegni sono utili per consolidare grandi quantità di dati in uno schema semplice, come illustrato in questa recensione. Ma un’intera generazione di biologi potrebbe essersi cullata nella convinzione che l’essenza di un meccanismo biologico sia stata catturata, e che l’intero problema sia quindi risolto, una volta che un ricercatore ha decifrato abbastanza del puzzle da essere in grado di disegnare una vignetta significativa di questo tipo.

Negli ultimi anni, è diventato abbondantemente chiaro che molto di più sarà richiesto agli scienziati prima che possiamo affermare di comprendere appieno un processo come la replicazione del DNA o la ricombinazione del DNA. I recenti progetti di sequenziamento del genoma, gli sforzi di mappatura delle interazioni proteiche e gli studi sulla segnalazione cellulare hanno rivelato molti più componenti e interazioni molecolari di quanto si fosse capito in precedenza. Per esempio, secondo una recente analisi, S. cerevisiae, un organismo eucariotico unicellulare “semplice” (che ha circa 6.000 geni rispetto ai 30.000 dell’uomo), usa 88 geni per la replicazione del DNA e 49 geni per la ricombinazione del DNA24. Saranno necessarie strutture atomiche dettagliate di tutte le proteine e gli acidi nucleici rilevanti, e i biologi strutturali stanno facendo progressi spettacolari, grazie a tecniche sempre più potenti di cristallografia a raggi X e risonanza magnetica nucleare. Ma la capacità di ricostruire i processi biologici in una provetta con molecole di cui si conosce la struttura precisa non è sufficiente. Il processo di replicazione è sia molto rapido che incredibilmente accurato, raggiungendo un tasso di errore finale di circa un nucleotide su un miliardo. Capire come le reazioni tra le molte diverse proteine e altre molecole sono coordinate per creare questo risultato richiederà che gli sperimentatori determinino tutte le costanti di tasso per le interazioni tra i vari componenti, qualcosa che è raramente fatto dai biologi molecolari oggi. Possono poi usare tecniche di ingegneria genetica per alterare gruppi selezionati di questi parametri, monitorando attentamente l’effetto di questi cambiamenti sul processo di replicazione.

Gli scienziati potranno affermare di comprendere veramente un processo complesso come la replicazione del DNA solo quando potranno prevedere con precisione l’effetto dei cambiamenti in ciascuna delle varie costanti di velocità sulla reazione complessiva. Poiché la gamma di manipolazioni sperimentali è enorme, avremo bisogno di modi più potenti per decidere quali alterazioni sono le più probabili per aumentare la nostra comprensione. Nuovi approcci dal campo in rapido sviluppo della biologia computazionale devono quindi essere sviluppati – sia per guidare la sperimentazione che per interpretare i risultati.

Il modello Watson-Crick del DNA ha catalizzato progressi drammatici nella nostra comprensione molecolare della biologia. Allo stesso tempo, il suo enorme successo ha dato origine all’opinione fuorviante che molti altri aspetti complessi della biologia potessero essere ridotti in modo simile ad un’elegante semplicità attraverso un’acuta analisi teorica e la costruzione di modelli. Questo punto di vista è stato soppiantato nei decenni successivi, perché la maggior parte dei sottosistemi biologici si sono rivelati troppo complessi per poterne prevedere i dettagli. Ora sappiamo che nulla può sostituire le rigorose analisi sperimentali. Ma la biologia molecolare e cellulare tradizionale da sola non può portare a termine un problema come la replicazione del DNA. Saranno necessari nuovi tipi di approcci, che coinvolgeranno non solo nuovi strumenti computazionali, ma anche una maggiore integrazione di chimica e fisica20,25. Per questo motivo, dobbiamo urgentemente ripensare l’educazione che stiamo fornendo alla prossima generazione di scienziati biologici22,26.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.