„Deși faptele sunt în mod inerent mai puțin satisfăcătoare decât concluziile intelectuale trase din ele, importanța lor nu ar trebui să fie niciodată pusă la îndoială.” James D. Watson, 2002.
ADN-ul poartă toată informația genetică pentru viață. O moleculă de ADN enorm de lungă formează fiecare dintre cromozomii unui organism, 23 dintre ei la un om. Unitatea vie fundamentală este celula unică. O celulă dă naștere la multe alte celule prin repetarea în serie a unui proces cunoscut sub numele de diviziune celulară. Înainte de fiecare diviziune, trebuie să se facă noi copii ale fiecăreia dintre numeroasele molecule care formează celula, inclusiv duplicarea tuturor moleculelor de ADN. Replicarea ADN este numele dat acestui proces de duplicare, care permite ca informația genetică a unui organism – genele sale – să fie transmisă celor două celule fiice create atunci când o celulă se divide. Doar puțin mai puțin central pentru viață este un proces care necesită acrobații dinamice ale ADN-ului, numit recombinare omologă a ADN-ului, care rearanjează genele de pe cromozomi. În reacții strâns legate de replicarea ADN-ului, mașinăria de recombinare repară, de asemenea, daunele care apar în mod inevitabil la moleculele lungi și fragile de ADN din interiorul celulelor (a se vedea articolul lui Friedberg din acest număr, pagina 436).
Modelul pentru dubla elice a ADN-ului1 propus de James Watson și Francis Crick se bazează pe două șiruri de ADN împerecheate care sunt complementare în secvența lor nucleotidică. Modelul a avut implicații izbitoare pentru procesele de replicare și recombinare a ADN-ului. Înainte de 1953, nu existase nicio modalitate semnificativă de a specula măcar cu privire la mecanismele moleculare ale acestor două procese genetice centrale. Dar propunerea conform căreia fiecare nucleotid dintr-un lanț de ADN era strâns împerecheat în baze cu nucleotidul său complementar din lanțul opus – fie adenină (A) cu timină (T), fie guanină (G) cu citozină (C) – însemna că orice parte a secvenței de nucleotide putea acționa ca un șablon direct pentru porțiunea corespunzătoare din celălalt lanț. Ca urmare, orice parte a secvenței poate fi folosită fie pentru a crea, fie pentru a recunoaște secvența nucleotidică parteneră – cele două funcții care sunt centrale pentru replicarea ADN și, respectiv, recombinarea ADN.
În această recenzie, analizez modul în care descoperirea structurii ADN în urmă cu jumătate de secol a deschis noi căi de înțelegere a proceselor de replicare și recombinare a ADN. De asemenea, voi sublinia modul în care, pe măsură ce înțelegerea noastră a moleculelor biologice complexe și a interacțiunilor lor a crescut de-a lungul anilor, au avut loc schimbări profunde în modul în care biologii privesc chimia vieții.
Caracteristicile structurale ale ADN-ului
Cercetarea care a urmat imediat după descoperirea dublei elice s-a concentrat în primul rând pe înțelegerea proprietăților structurale ale moleculei. ADN-ul specifică ARN-ul prin procesul de transcripție a genelor, iar moleculele de ARN, la rândul lor, specifică toate proteinele unei celule. Aceasta este „dogma centrală” a transferului de informație genetică2. Orice citire a informației genetice – fie în timpul replicării ADN-ului, fie în timpul transcrierii genelor – necesită accesul la secvența bazelor îngropate în interiorul dublei helixuri. Prin urmare, separarea șirurilor de ADN este esențială pentru funcția ADN. Astfel, modelul Watson-Crick i-a determinat pe oamenii de știință să caute condiții care să întrerupă legăturile de hidrogen care unesc perechile de baze complementare, astfel încât să separe cele două șiruri ale dublei helixuri de ADN.
Chimiștii fizici au descoperit că încălzirea unei soluții de ADN la temperaturi apropiate de punctul de fierbere (100 °C) sau supunerea acesteia la pH-uri extreme determină separarea șirurilor – o schimbare numită „denaturare a ADN-ului”. Așa-numita „temperatură de topire” (sau Tm) a unei secvențe de ADN depinde de compoziția nucleotidelor sale: acele ADN-uri cu o proporție mai mare de perechi de baze G-C prezintă o Tm mai mare din cauza celor trei legături de hidrogen care, conform previziunilor lui Watson și Crick, țin împreună o pereche de baze G-C, în comparație cu doar două pentru perechea de baze A-T. La concentrații fiziologice de sare, Tm a ADN-ului de mamifere este de aproape 90 °C, datorită amestecului special al perechilor sale de baze (47% G-C și 53% A-T)3.
Început părea de neconceput că, odată separat de partenerul său complementar, un fir de ADN ar putea forma din nou o dublă elice. Într-un amestec complex de molecule de ADN, o astfel de reușită ar fi necesitat găsirea unei singure secvențe care să se potrivească printre milioanele de secvențe în timpul coliziunilor aleatorii cu alte secvențe, iar apoi să se deruleze rapid cu un nou șir partener. Descoperirea dramatică a acestui fenomen neașteptat4, numit „renaturare a ADN-ului”, a aruncat lumină asupra modului în care secvențele ar putea fi rearanjate prin recombinare a ADN-ului. Și a oferit, de asemenea, un mijloc esențial prin care ADN-ul putea fi manipulat în laborator. Recoacerea secvențelor de nucleotide complementare, un proces numit hibridizare, stă la baza mai multor tehnologii ADN care au contribuit la lansarea industriei biotehnologiei și a genomicii moderne. Acestea includ clonarea genelor, secvențierea genomică și copierea ADN-ului prin reacția în lanț a polimerazei (vezi articolul lui Hood și Galas de la pagina 444).
Dispoziția moleculelor de ADN în cromozomi a prezentat un alt mister pentru oamenii de știință: o moleculă lungă și subțire ar fi foarte sensibilă la ruperea indusă de forfecare și era greu de imaginat că un cromozom de mamifer ar putea conține doar o singură moleculă de ADN. Acest lucru ar necesita ca un cromozom tipic să fie format dintr-un helix continuu de ADN cu o lungime de peste 100 de milioane de perechi de nucleotide – o moleculă masivă care cântărește peste 100 de miliarde de daltoni, cu o distanță de la un capăt la altul de peste 3 cm. Cum ar putea o astfel de moleculă gigantică să fie protejată împotriva fragmentării accidentale într-o celulă cu un diametru de numai câteva microni, păstrând-o în același timp organizată pentru o citire eficientă a genelor și pentru alte funcții genetice?
Nu a existat niciun precedent pentru astfel de molecule gigantice în afara lumii biologiei. Dar, la începutul anilor 1960, studiile autoradiografice au dezvăluit că cromozomul bacteriei Escherichia coli era, de fapt, o singură moleculă de ADN, cu o lungime de peste 3 milioane de perechi de nucleotide5. Iar când – mai mult de un deceniu mai târziu – tehnici fizice inovatoare au demonstrat că o singură moleculă uriașă de ADN a stat la baza fiecărui cromozom de mamifer6, rezultatul a fost întâmpinat de oamenii de știință cu puțină surpriză.
Furcile de replicare a ADN-ului
Cum este copiată cu precizie molecula enorm de lungă de ADN bicatenar care formează un cromozom pentru a produce un al doilea cromozom identic de fiecare dată când o celulă se divide? Modelul șablon pentru replicarea ADN-ului, propus de Watson și Crick în 1953 (ref. 7), a câștigat acceptarea universală după două descoperiri de la sfârșitul anilor 1950. Una dintre ele a fost un experiment elegant cu ADN bacterian marcat în funcție de densitate, care a confirmat schema șablon-anti-șablon prevăzută8. Cealaltă a fost descoperirea unei enzime numite ADN-polimerază, care utilizează un șir de ADN ca șablon pentru a sintetiza un nou șir complementar9. Patru nucleotide deoxiribonucleoside trifosfat – dATP, dTTP, dGTP și dCTP – sunt precursorii unei noi catene de ADN fiică, fiecare nucleotidă fiind selectată prin împerechere cu nucleotida sa complementară (T, A, C sau, respectiv, G) de pe catena șablon parentală. S-a demonstrat că ADN polimeraza utilizează acești trifosfați pentru a adăuga nucleotide, unul câte unul, la capătul 3′ al moleculei de ADN nou sintetizate, catalizând astfel creșterea lanțului de ADN în direcția chimică 5′ spre 3′.
Deși sinteza unor secvențe scurte de secvență de ADN pe un șablon monocatenar a putut fi demonstrată într-o eprubetă, modul în care este replicată o moleculă enormă și răsucită de ADN bicatenar era o enigmă. În interiorul celulei, s-a observat că replicarea ADN-ului are loc la o structură în formă de Y, numită „furcă de replicare”, care se deplasează în mod constant de-a lungul unei elice de ADN parentală, învârtind în spatele ei două elice de ADN fiice (cele două brațe ale „Y „5). Așa cum au prezis Watson și Crick, cele două șiruri ale dublei elice se deplasează în direcții chimice opuse. Prin urmare, în timp ce o furcă de replicare se deplasează, ADN polimeraza se poate deplasa continuu de-a lungul unui singur braț al Y – brațul pe care noua filieră fiică este alungită în direcția chimică 5′ spre 3′. Pe celălalt braț, noul lanț fiică ar trebui să fie produs în direcția chimică opusă, de la 3′ la 5′ (Fig. 1a). Astfel, în timp ce predicțiile centrale ale lui Watson și Crick au fost confirmate la sfârșitul primului deceniu de cercetare care a urmat descoperirii lor de referință, detaliile procesului de replicare a ADN-ului au rămas un mister.
Reconstituirea replicării
Misterul a fost rezolvat pe parcursul următoarelor două decenii, perioadă în care au fost identificate proteinele care constituie actorii centrali în procesul de replicare a ADN-ului. Oamenii de știință au folosit o varietate de abordări experimentale pentru a identifica un set din ce în ce mai mare de produse genetice considerate a fi esențiale pentru replicarea ADN-ului. De exemplu, au fost identificate organisme mutante la care replicarea ADN-ului era defectuoasă, iar tehnicile genetice au putut fi apoi utilizate pentru a identifica seturi specifice de gene necesare pentru procesul de replicare10,11,12. Cu ajutorul proteinelor specificate de aceste gene, au fost create sisteme „fără celule”, în care procesul a fost recreat in vitro cu ajutorul unor componente purificate. Inițial, proteinele au fost testate într-o „reacție de replicare parțială”, în care a fost prezent doar un subset al mașinăriei proteice necesare pentru procesul complet de replicare, iar șablonul de ADN a fost furnizat într-o formă monocatenară13. Noile proteine care au fost identificate au fost adăugate pe rând sau în combinație pentru a testa efectele acestora asupra activității catalitice a ADN polimerazei. Progresele ulterioare în înțelegerea replicării au depins apoi de crearea unor sisteme in vitro mai complexe, în care, prin adăugarea unui set mai mare de proteine purificate, a putut fi replicat în cele din urmă ADN bicatenar14,15.
Astăzi, aproape fiecare proces din interiorul celulelor – de la replicarea și recombinarea ADN-ului la transportul veziculelor membranare – este studiat într-un sistem in vitro reconstruit din componente purificate. Deși laborios de stabilit, astfel de sisteme permit controlul precis atât al concentrației, cât și al structurii detaliate a fiecărei componente. În plus, „zgomotul” din sistemul natural cauzat de reacțiile secundare – deoarece majoritatea moleculelor dintr-o celulă sunt implicate în mai multe tipuri de reacții – este evitat prin eliminarea proteinelor care catalizează aceste alte reacții. În esență, o mică fracțiune a celulei poate fi recreată ca un set delimitat de reacții chimice, ceea ce o face pe deplin susceptibilă de a fi studiată cu precizie folosind toate instrumentele fizicii și chimiei.
Până în 1980, sistemele multiproteice in vitro au permis o caracterizare detaliată a mașinăriei de replicare și au rezolvat problema modului în care ADN-ul este sintetizat de ambele părți ale furcii de replicare (Fig. 1b). Un lanț de ADN fiică este sintetizat continuu de către o moleculă de ADN polimerază care se deplasează de-a lungul „lanțului conducător”, în timp ce o a doua moleculă de ADN polimerază de pe „lanțul întârziat” produce o serie lungă de fragmente (numite fragmente Okazaki)16 care sunt unite între ele de către enzima ADN ligază pentru a produce un lanț de ADN continuu. După cum era de așteptat, există o diferență în ceea ce privește proteinele necesare pentru sinteza ADN-ului pe catenă conducătoare și pe catenă întârziată (a se vedea caseta 1). În mod remarcabil, s-a putut demonstra că furcile de replicare formate în aceste sisteme artificiale se mișcă la aceleași viteze rapide ca și furcile din interiorul celulelor (500 până la 1.000 de nucleotide pe secundă), iar șablonul de ADN a fost copiat cu o fidelitate incredibil de mare15.
Pe măsură ce s-a constatat că tot mai multe proteine funcționează la furcile de replicare, au putut fi făcute comparații între mașinăria de replicare a diferitelor organisme. Studiile privind mașinăria de replicare la viruși, bacterii și eucariote au arătat că un set comun de activități proteice conduce furcile de replicare în fiecare organism (caseta 1). Fiecare sistem este alcătuit din: o moleculă de ADN-polimerază cu catenă conducătoare și o moleculă de ADN-polimerază cu catenă întârziată; o ADN-primază pentru a produce amorsele de ARN care inițiază fiecare fragment Okazaki; proteine de legare a ADN-ului monocatenar care îmbracă ADN-ul șablon și îl mențin în poziție; o ADN-elicază care derulează dubla helixă; și proteine accesorii suplimentare ale polimerazei care leagă polimerazele între ele și de șablonul de ADN. Pe măsură ce se trece de la un virus simplu la organisme mai complexe, cum ar fi drojdiile sau mamiferele, numărul de subunități care alcătuiesc fiecare tip de activitate proteică tinde să crească. De exemplu, numărul total de subunități polipeptidice care formează nucleul aparatului de replicare crește de la patru și șapte în cazul bacteriofagilor T7 și, respectiv, T4, la 13 în cazul bacteriei E. coli. Și se extinde la cel puțin 27 la drojdia Saccharomyces cerevisiae și la mamifere. Astfel, pe măsură ce organismele cu genomuri mai mari au evoluat, mașinăria de replicare a adăugat noi subunități proteice, fără nicio modificare a mecanismelor de bază15,18,19,20.
În timp ce lucrările pe care le-am descris privind replicarea ADN-ului avansau, alte grupuri de cercetători stabileau sisteme in vitro în care putea fi reconstituită recombinarea omologă a ADN-ului. Jucătorul central în aceste reacții a fost proteina de tip RecA17, numită după mutantul bacterian defect în recombinare care a dus la descoperirea sa (Caseta 2).
Mașini proteice
Ca și în cazul tuturor celorlalte aspecte ale biochimiei celulare, aparatul de replicare a ADN-ului a evoluat de-a lungul a miliarde de ani prin „încercare și eroare” – adică prin variație aleatorie urmată de selecție naturală. Cu timpul, o proteină după alta a putut fi adăugată la amestecul de proteine active la furca de replicare, probabil pentru că noua proteină creștea viteza, controlul sau precizia procesului general de replicare. În plus, structura fiecărei proteine a fost ajustată prin mutații care i-au modificat secvența de aminoacizi, astfel încât să îi sporească eficiența. Rezultatele finale ale acestui proces neobișnuit de inginerie sunt sistemele de replicare pe care le observăm astăzi în diferite organisme. Prin urmare, ar putea fi de așteptat ca mecanismul de replicare a ADN-ului să depindă în mare măsură de evenimente aleatorii din trecut. Dar oare evoluția a selectat pentru orice funcționează, fără a avea nevoie de eleganță?
Pentru primii 30 de ani după descoperirea lui Watson și Crick, majoritatea cercetătorilor păreau să susțină opinia că procesele celulare puteau fi neglijente. Acest punct de vedere a fost încurajat de cunoașterea vitezei extraordinare a mișcărilor la nivel molecular (de exemplu, se știa că o proteină tipică se ciocnește cu o a doua moleculă prezentă la o concentrație de 1 mM de aproximativ 106 ori pe secundă). Vitezele rapide ale mișcărilor moleculare au fost considerate inițial ca permițând ca un proces precum replicarea ADN-ului să aibă loc fără nicio organizare a proteinelor implicate în spațiul tridimensional.
Chiar dimpotrivă, biologii moleculari recunosc acum că evoluția a selectat sisteme foarte ordonate. Astfel, de exemplu, nu numai că părțile mașinăriei de replicare sunt ținute împreună în alinieri precise pentru a optimiza interacțiunile lor reciproce, dar schimbările determinate de energie în conformațiile proteinelor sunt folosite pentru a genera mișcări coordonate. Acest lucru asigură faptul că fiecare dintre etapele succesive ale unui proces complex precum replicarea ADN-ului este strâns coordonată cu următoarea. Rezultatul este un ansamblu care poate fi privit ca o „mașină proteică”. De exemplu, molecula de ADN-polimerază de pe partea întârziată a furcii de replicare rămâne legată de molecula de ADN-polimerază de pe filamentul conducător pentru a se asigura că aceeași moleculă de ADN-polimerază de pe filamentul întârziat este utilizată din nou și din nou pentru sinteza eficientă a fragmentelor Okazaki18,20,21 (caseta 1). Iar replicarea ADN-ului nu este în niciun caz unică. În prezent, credem că aproape fiecare proces biologic este catalizat de un set de zece sau mai multe proteine poziționate spațial, care interacționează și care suferă mișcări extrem de ordonate într-un ansamblu asemănător unei mașini22.
Mașinile proteice se formează în general în locuri specifice ca răspuns la anumite semnale, iar acest lucru este valabil în special pentru mașinile proteice care acționează asupra ADN-ului. Replicarea, repararea și recombinarea dublei elice a ADN-ului sunt adesea considerate ca fiind procese separate, izolate. Dar, în interiorul celulei, aceeași moleculă de ADN este capabilă să fie supusă oricăreia dintre aceste reacții. Mai mult, apar combinații specifice ale celor trei tipuri de reacții. De exemplu, recombinarea ADN este adesea legată direct fie de replicarea ADN, fie de repararea ADN23. Pentru ca integritatea unui cromozom să fie menținută în mod corespunzător, fiecare reacție specifică trebuie să fie dirijată și controlată cu atenție. Acest lucru necesită ca seturile de proteine să fie asamblate pe ADN și activate numai unde și când sunt necesare. Deși mai sunt multe de învățat despre modul în care se fac aceste alegeri, se pare că diferite tipuri de structuri de ADN sunt recunoscute în mod explicit de proteine specializate care servesc drept „factori de asamblare”. Fiecare factor de asamblare servește apoi pentru a nuclea o asamblare cooperantă a setului de proteine care formează o anumită mașinărie proteică, după cum este necesar pentru catalizarea unei reacții adecvate acelui moment și acelui loc din celulă.
O viziune asupra viitorului
A devenit un obicei, atât în manualele școlare, cât și în literatura științifică obișnuită, de a explica mecanismele moleculare prin simple desene bidimensionale sau „desene animate”. Astfel de desene sunt utile pentru consolidarea unor cantități mari de date într-o schemă simplă, așa cum este ilustrat în această recenzie. Dar este posibil ca o întreagă generație de biologi să se fi amăgit crezând că esența unui mecanism biologic a fost captată și, prin urmare, întreaga problemă a fost rezolvată, odată ce un cercetător a descifrat suficient de mult din puzzle pentru a putea desena o caricatură semnificativă de acest tip.
În ultimii ani, a devenit foarte clar că se va cere mult mai mult de la oamenii de știință înainte de a putea pretinde că înțelegem pe deplin un proces cum ar fi replicarea ADN sau recombinarea ADN. Proiectele recente de secvențiere a genomului, eforturile de cartografiere a proteinelor-interacțiuni și studiile în domeniul semnalizării celulare au dezvăluit mult mai multe componente și interacțiuni moleculare decât se credea până acum. De exemplu, conform unei analize recente, S. cerevisiae, un organism eucariot unicelular „simplu” (care are aproximativ 6.000 de gene, comparativ cu 30.000 la om), utilizează 88 de gene pentru replicarea ADN-ului și 49 de gene pentru recombinarea ADN-ului24.
Pentru a ne concentra asupra replicării ADN-ului, înțelegerea deplină a mecanismului va necesita întoarcerea la locul unde au început studiile asupra ADN-ului – în domeniul chimiei și fizicii. Vor fi necesare structuri atomice detaliate ale tuturor proteinelor și acizilor nucleici relevanți, iar biologii structurali fac progrese spectaculoase, datorită tehnicilor tot mai performante de cristalografie cu raze X și de rezonanță magnetică nucleară. Dar capacitatea de a reconstrui procesele biologice într-o eprubetă cu molecule ale căror structuri precise sunt cunoscute nu este suficientă. Procesul de replicare este atât foarte rapid, cât și incredibil de precis, atingând o rată de eroare finală de aproximativ o nucleotidă la un miliard. Înțelegerea modului în care reacțiile dintre numeroasele proteine și alte molecule diferite sunt coordonate pentru a crea acest rezultat va necesita ca experimentatorii să determine toate constantele de viteză pentru interacțiunile dintre diferitele componente, lucru pe care biologii moleculari îl fac rareori în prezent. Aceștia pot folosi apoi tehnici de inginerie genetică pentru a modifica seturi selectate ale acestor parametri, monitorizând cu atenție efectul acestor modificări asupra procesului de replicare.
Științii vor putea afirma că înțeleg cu adevărat un proces complex precum replicarea ADN-ului doar atunci când vor putea prezice cu precizie efectul modificărilor fiecăreia dintre diferitele constante de viteză asupra reacției globale. Deoarece gama de manipulări experimentale este enormă, vom avea nevoie de modalități mai puternice de a decide care dintre aceste modificări sunt cele mai susceptibile de a ne spori înțelegerea. Prin urmare, trebuie dezvoltate noi abordări din domeniul în dezvoltare rapidă al biologiei computaționale – atât pentru a ghida experimentarea, cât și pentru a interpreta rezultatele.
Modelul Watson-Crick al ADN-ului a catalizat progrese dramatice în înțelegerea noastră moleculară a biologiei. În același timp, succesul său enorm a dat naștere opiniei înșelătoare că multe alte aspecte complexe ale biologiei ar putea fi reduse în mod similar la o simplitate elegantă prin analize teoretice perspicace și construirea de modele. Acest punct de vedere a fost înlăturat în deceniile următoare, deoarece majoritatea subsistemelor biologice s-au dovedit a fi mult prea complexe pentru ca detaliile lor să poată fi prezise. Acum știm că nimic nu poate înlocui analizele experimentale riguroase. Dar biologia moleculară și celulară tradițională nu poate, de una singură, să rezolve o problemă precum replicarea ADN-ului. Vor fi necesare noi tipuri de abordări, care să implice nu numai noi instrumente computaționale, ci și o mai mare integrare a chimiei și fizicii20,25. Din acest motiv, trebuie să regândim de urgență educația pe care o oferim următoarei generații de oameni de știință biologică22,26.
.