“Hoewel feiten inherent minder bevredigend zijn dan de intellectuele conclusies die eruit getrokken worden, mag hun belang nooit in twijfel getrokken worden.” James D. Watson, 2002.
DNA draagt alle genetische informatie voor het leven. Eén enorm lange DNA-molecule vormt elk van de chromosomen van een organisme, 23 daarvan in een mens. De fundamentele levende eenheid is de enkele cel. Uit een cel ontstaan veel meer cellen door opeenvolgende herhalingen van een proces dat celdeling wordt genoemd. Voor elke deling moeten nieuwe kopieën worden gemaakt van elk van de vele moleculen die de cel vormen, waaronder de verdubbeling van alle DNA-moleculen. DNA-replicatie is de naam die wordt gegeven aan dit duplicatieproces, dat het mogelijk maakt de genetische informatie van een organisme – zijn genen – door te geven aan de twee dochtercellen die ontstaan wanneer een cel zich deelt. Iets minder belangrijk voor het leven is een proces dat dynamische DNA-acrobatiek vereist, homologe DNA-recombinatie genaamd, waarbij de genen op chromosomen worden herschikt. In reacties die nauw verbonden zijn met DNA-replicatie, repareert de recombinatiemachine ook schade die onvermijdelijk optreedt aan de lange, fragiele DNA-moleculen in de cellen (zie artikel in dit nummer van Friedberg, blz. 436).
Het model voor de dubbele helix van DNA1 dat werd voorgesteld door James Watson en Francis Crick is gebaseerd op twee gepaarde DNA-strengen die complementair zijn in hun nucleotidenvolgorde. Het model had opvallende implicaties voor de processen van DNA replicatie en DNA recombinatie. Vóór 1953 was er geen zinvolle manier om zelfs maar te speculeren over de moleculaire mechanismen van deze twee centrale genetische processen. Maar het voorstel dat elke nucleotide in de ene streng van het DNA nauw basenpaar was met zijn complementaire nucleotide op de tegenoverliggende streng – hetzij adenine (A) met thymine (T), of guanine (G) met cytosine (C) – betekende dat elk deel van de nucleotidesequentie kon fungeren als een direct sjabloon voor het overeenkomstige deel van de andere streng. Als gevolg hiervan kan elk deel van de sequentie worden gebruikt om zijn partner nucleotide sequentie te maken of te herkennen – de twee functies die centraal staan voor respectievelijk DNA replicatie en DNA recombinatie.
In dit overzicht bespreek ik hoe de ontdekking van de structuur van DNA een halve eeuw geleden nieuwe wegen opende om de processen van DNA replicatie en recombinatie te begrijpen. Ik zal ook benadrukken hoe, naarmate ons begrip van complexe biologische moleculen en hun interacties in de loop der jaren toenam, er diepgaande veranderingen zijn opgetreden in de manier waarop biologen tegen de chemie van het leven aankijken.
Structurele kenmerken van DNA
Het onderzoek dat onmiddellijk volgde op de ontdekking van de dubbele helix richtte zich voornamelijk op het begrijpen van de structurele eigenschappen van het molecuul. DNA specificeert RNA via het proces van gentranscriptie, en de RNA-moleculen specificeren op hun beurt alle eiwitten van een cel. Dit is het “centrale dogma” van de overdracht van genetische informatie2. Om genetische informatie te kunnen aflezen – of dat nu tijdens DNA-replicatie of tijdens gentranscriptie gebeurt – is toegang nodig tot de volgorde van de basen die in het inwendige van de dubbele helix begraven liggen. De scheiding van DNA-strengen is daarom van cruciaal belang voor de werking van het DNA. Het Watson-Crick model dreef wetenschappers ertoe te zoeken naar omstandigheden die de waterstofbruggen die de complementaire basenparen verbinden zouden verbreken, zodat de twee strengen van de DNA-dubbele helix zouden scheiden.
Fysisch scheikundigen ontdekten dat verhitting van een oplossing van DNA tot temperaturen dichtbij het kookpunt (100 °C), of het blootstellen aan extreme pH-waarden, de strengen zou doen scheiden – een verandering die ‘DNA-denaturatie’ wordt genoemd. De zogenaamde ‘smelttemperatuur’ (of Tm) van een stuk DNA-sequentie hangt af van de nucleotidensamenstelling ervan: DNA’s met een groter aandeel G-C-basenparen vertonen een hogere Tm vanwege de drie waterstofbruggen die volgens Watson en Crick een G-C-basenpaar bijeenhouden, vergeleken met slechts twee voor het A-T-basenpaar. Bij fysiologische zoutconcentraties is de Tm van zoogdier-DNA bijna 90 °C, als gevolg van de bijzondere mix van zijn basenparen (47% G-C en 53% A-T)3.
In eerste instantie leek het ondenkbaar dat een DNA-streng, eenmaal gescheiden van zijn complementaire partner, opnieuw een dubbele helix zou kunnen vormen. In een complexe mengeling van DNA-moleculen zou daarvoor van miljoenen sequenties die ene match moeten worden gevonden tijdens willekeurige botsingen met andere sequenties, en dan snel opnieuw moeten worden gevormd met een nieuwe partnerstreng. De dramatische ontdekking van dit onverwachte fenomeen4, dat ‘DNA renaturatie’ wordt genoemd, werpt licht op de manier waarop sequenties door DNA-recombinatie opnieuw kunnen worden gerangschikt. Het verschafte ook een cruciaal middel waarmee DNA in het laboratorium kon worden gemanipuleerd. Het annealiseren van complementaire nucleotidesequenties, een proces dat hybridisatie wordt genoemd, vormt de basis van verschillende DNA-technologieën die de biotechnologische industrie en de moderne genomica hebben helpen ontstaan. Deze omvatten het klonen van genen, het sequencen van genen en het kopiëren van DNA door middel van de polymerasekettingreactie (zie het artikel van Hood en Galas op blz. 444).
De rangschikking van DNA-moleculen in chromosomen vormde een ander mysterie voor wetenschappers: een lange, dunne molecule zou zeer gevoelig zijn voor door afschuiving veroorzaakte breuk, en het was moeilijk voor te stellen dat een chromosoom van een zoogdier slechts één DNA-molecule zou kunnen bevatten. Dit zou betekenen dat een typisch chromosoom gevormd zou moeten zijn uit een ononderbroken DNA-helix van meer dan 100 miljoen nucleotideparen lang – een massieve molecule met een gewicht van meer dan 100 miljard dalton, met een end-to-end afstand van meer dan 3 cm. Hoe kon zo’n reusachtig molecuul worden beschermd tegen toevallige fragmentatie in een cel met een diameter van slechts microns, terwijl het toch georganiseerd bleef voor een efficiënte genuitlezing en andere genetische functies?
Er was geen precedent voor zulke reusachtige moleculen buiten de wereld van de biologie. Maar in het begin van de jaren zestig bleek uit autoradiografisch onderzoek dat het chromosoom van de bacterie Escherichia coli in feite één enkele DNA-molecule was, met een lengte van meer dan 3 miljoen nucleotidenparen5. En toen – meer dan een decennium later – met innovatieve fysische technieken werd aangetoond dat één enkele reusachtige DNA-molecule de basis vormde voor elk zoogdierchromosoom6, werd het resultaat door wetenschappers met weinig verbazing begroet.
DNA-replicatievorken
Hoe wordt de enorm lange dubbelstrengs DNA-molecule die een chromosoom vormt, nauwkeurig gekopieerd om een tweede identiek chromosoom te produceren telkens wanneer een cel zich deelt? Het sjabloommodel voor DNA replicatie, voorgesteld door Watson en Crick in 1953 (ref. 7), kreeg universele aanvaarding na twee ontdekkingen aan het eind van de jaren 1950. De eerste was een elegant experiment met bacterieel DNA met densiteitslabels dat het voorspelde schema van sjabloon-anti-sjabloon bevestigde8. De andere was de ontdekking van een enzym, DNA-polymerase genaamd, dat een streng DNA als sjabloon gebruikt om een nieuwe complementaire streng te synthetiseren9. Vier desoxyribonucleosidetrifosfaatnucleotiden – dATP, dTTP, dGTP en dCTP – zijn de precursors van een nieuwe DNA-dochterstreng, waarbij elke nucleotide wordt geselecteerd door koppeling aan zijn complementaire nucleotide (respectievelijk T, A, C of G) op de ouderlijke sjabloonstreng. Het is aangetoond dat het DNA-polymerase deze trifosfaten gebruikt om één voor één nucleotiden toe te voegen aan het 3′-uiteinde van het nieuw gesynthetiseerde DNA-molecuul, waardoor de groei van de DNA-keten in de chemische 5′ tot 3′-richting wordt gekatalyseerd.
Hoewel de synthese van korte stukken DNA sequentie op een enkelstrengs sjabloon in een reageerbuis kon worden gedemonstreerd, was het een raadsel hoe een enorme, gedraaide dubbelstrengs DNA molecule wordt gerepliceerd. In de cel werd vastgesteld dat de DNA-replicatie plaatsvindt in een Y-vormige structuur, een ‘replicatievork’ genoemd, die gestaag langs een ouder-DNA-helix beweegt en daarachter twee dochter-DNA-helixen spint (de twee armen van de ‘Y’)5. Zoals voorspeld door Watson en Crick, lopen de twee strengen van de dubbele helix in tegengestelde chemische richtingen. Als een replicatievork beweegt, kan het DNA-polymerase dus voortdurend langs slechts één arm van de Y bewegen – de arm waarop de nieuwe dochterstreng in de chemische richting van 5′ naar 3′ wordt uitgerekt. Op de andere arm zou de nieuwe dochterstreng in de tegenovergestelde, chemische richting van 3′ naar 5′ geproduceerd moeten worden (Fig. 1a). Dus terwijl de centrale voorspellingen van Watson en Crick werden bevestigd aan het einde van het eerste decennium van onderzoek dat volgde op hun baanbrekende ontdekking, bleven de details van het DNA-replicatieproces een mysterie.
Replicatie reconstrueren
Het mysterie werd opgelost in de loop van de volgende twee decennia, een periode waarin de eiwitten werden geïdentificeerd die de centrale spelers vormen in het DNA-replicatieproces. Wetenschappers gebruikten een verscheidenheid van experimentele benaderingen om een steeds groter wordende reeks genproducten te identificeren waarvan werd gedacht dat zij van cruciaal belang waren voor DNA-replicatie. Zo werden bijvoorbeeld gemuteerde organismen geïdentificeerd waarin de DNA-replicatie defect was, en genetische technieken konden dan worden gebruikt om specifieke reeksen genen te identificeren die voor het replicatieproces vereist zijn10,11,12. Met behulp van de door deze genen gespecificeerde eiwitten werden “celvrije” systemen opgezet, waarbij het proces in vitro werd nagebootst met gezuiverde componenten. Aanvankelijk werden eiwitten getest in een “partiële replicatiereactie”, waarbij slechts een subset van de voor het volledige replicatieproces vereiste eiwitmachine aanwezig was en het DNA-sjabloon in een enkelstrengs vorm werd aangeboden13. Nieuwe eiwitten die werden geïdentificeerd, werden één voor één of in combinatie toegevoegd om hun effect op de katalytische activiteit van DNA-polymerase te testen. Verdere vooruitgang in het begrijpen van replicatie hing toen af van het creëren van complexere in vitro systemen, waarin door toevoeging van een grotere set gezuiverde eiwitten uiteindelijk dubbelstrengs DNA kon worden gerepliceerd14,15.
Heden ten dage wordt bijna elk proces binnen cellen – van DNA replicatie en recombinatie tot membraan vesicle transport – bestudeerd in een in vitro systeem dat is gereconstrueerd uit gezuiverde componenten. Hoewel het omslachtig is om dergelijke systemen op te zetten, kunnen zowel de concentratie als de gedetailleerde structuur van elke component nauwkeurig worden gecontroleerd. Bovendien wordt de “ruis” die in het natuurlijke systeem door nevenreacties wordt veroorzaakt – omdat de meeste moleculen in een cel bij meer dan één soort reactie betrokken zijn – vermeden door de eiwitten die deze andere reacties katalyseren, te elimineren. In wezen kan een klein deel van de cel worden gerecreëerd als een begrensd geheel van chemische reacties, waardoor het volledig geschikt wordt voor nauwkeurige studie met behulp van alle instrumenten van de fysica en de chemie.
In 1980 hadden multiproteïne in vitro systemen een gedetailleerde karakterisering van de replicatiemachine mogelijk gemaakt en het probleem opgelost van de wijze waarop DNA aan beide zijden van de replicatievork wordt gesynthetiseerd (Fig. 1b). Eén dochter-DNA-streng wordt continu gesynthetiseerd door een DNA-polymerasemolecule die langs de “voorste streng” beweegt, terwijl een tweede DNA-polymerasemolecule op de “achterblijvende streng” een lange reeks fragmenten produceert (Okazaki-fragmenten genoemd)16 die door het enzym DNA-ligase worden samengevoegd tot een continue DNA-streng. Zoals te verwachten is, is er een verschil in de eiwitten die nodig zijn voor de synthese van leidende en achterblijvende DNA-streng (zie kader 1). Opmerkelijk genoeg kon worden aangetoond dat de in deze kunstmatige systemen gevormde replicatievorken met dezelfde snelheid bewegen als de vorken in de cellen (500 tot 1.000 nucleotiden per seconde), en dat het DNA-sjabloon met een ongelooflijk hoge getrouwheid werd gekopieerd15.
Naarmate meer en meer eiwitten werden gevonden die bij de replicatievork functioneren, konden vergelijkingen worden gemaakt tussen de replicatiemachinerie van verschillende organismen. Studies van de replicatiemachinerie in virussen, bacteriën en eukaryoten hebben aangetoond dat een gemeenschappelijke reeks eiwitactiviteiten de replicatievorken in elk organisme aanstuurt (kader 1). Elk systeem bestaat uit: een leidende en een achterblijvende DNA-polymerasemolecuul; een DNA-primase om de RNA-primers te produceren die elk Okazaki-fragment starten; enkelstrengs DNA-bindingseiwitten die het sjabloon-DNA omhullen en op zijn plaats houden; een DNA-helicase die de dubbele helix afwikkelt; en extra polymerase-accessoire-eiwitten die de polymerasen met elkaar en met het DNA-sjabloon verbinden. Naarmate men vordert van een eenvoudig virus naar complexere organismen, zoals gisten of zoogdieren, neemt het aantal subeenheden waaruit elk type eiwitactiviteit bestaat, toe. Zo stijgt het totale aantal polypeptidesubeenheden die de kern van het replicatie-apparaat vormen van vier en zeven in respectievelijk de bacteriofagen T7 en T4 tot 13 in de bacterie E. coli. En het breidt zich uit tot ten minste 27 in de gist Saccharomyces cerevisiae en in zoogdieren. Naarmate organismen met grotere genomen evolueerden, voegde de replicatiemachine dus nieuwe eiwitsubeenheden toe, zonder enige verandering in de basismechanismen15,18,19,20.
Terwijl het werk dat ik over DNA replicatie heb beschreven vorderde, waren andere groepen onderzoekers bezig met het opzetten van in vitro systemen waarin homologe DNA recombinatie kon worden gereconstrueerd. De centrale speler in deze reacties was het RecA type eiwit17, genoemd naar de bacteriële mutant met een defect in recombinatie die tot de ontdekking ervan leidde (kader 2).
Eiwitmachines
Zoals alle andere aspecten van de celbiochemie is het DNA-replicatie-apparaat in de loop van miljarden jaren geëvolueerd door “trial and error” – dat wil zeggen, door willekeurige variatie gevolgd door natuurlijke selectie. Mettertijd kon het ene eiwit na het andere worden toegevoegd aan de mix van eiwitten die actief zijn op de replicatievork, vermoedelijk omdat het nieuwe eiwit de snelheid, de controle of de nauwkeurigheid van het totale replicatieproces verhoogde. Bovendien werd de structuur van elk eiwit verfijnd door mutaties die de aminozuursequentie ervan veranderden om de doeltreffendheid ervan te vergroten. Het eindresultaat van dit ongewone engineeringproces zijn de replicatiesystemen die wij vandaag in verschillende organismen waarnemen. Men zou dus kunnen verwachten dat het mechanisme van DNA-replicatie in hoge mate afhankelijk is van toevallige gebeurtenissen in het verleden. Maar heeft de evolutie gekozen voor wat werkt, zonder behoefte aan elegantie?
In de eerste 30 jaar na de ontdekking van Watson en Crick leken de meeste onderzoekers van mening te zijn dat celprocessen slordig konden zijn. Deze opvatting werd aangemoedigd door de kennis van de enorme snelheid van bewegingen op moleculair niveau (men wist bijvoorbeeld dat een typisch eiwit ongeveer 106 keer per seconde botst met een tweede molecuul dat aanwezig is in een concentratie van 1 mM). Aanvankelijk dacht men dat de snelle snelheid van moleculaire bewegingen een proces als DNA replicatie mogelijk maakte zonder dat de betrokken proteïnen in de driedimensionale ruimte waren georganiseerd.
Integendeel, moleculair biologen erkennen nu dat de evolutie heeft gekozen voor sterk geordende systemen. Zo worden bijvoorbeeld niet alleen de onderdelen van de replicatie-machinerie in precieze opstellingen bijeengehouden om hun onderlinge interacties te optimaliseren, maar worden energie-gestuurde veranderingen in eiwitconformatie gebruikt om gecoördineerde bewegingen te genereren. Dit zorgt ervoor dat elk van de opeenvolgende stappen in een complex proces als DNA-replicatie nauw gecoördineerd is met de volgende. Het resultaat is een assemblage die kan worden gezien als een “eiwitmachine”. Zo blijft de DNA-polymerasemolecule aan de achterblijvende kant van de replicatievork gebonden aan de leidende DNA-polymerasemolecule om ervoor te zorgen dat dezelfde achterblijvende polymerasemolecule steeds opnieuw wordt gebruikt voor een efficiënte synthese van Okazaki-fragmenten18,20,21 (kader 1). En DNA-replicatie is zeker niet uniek. We geloven nu dat bijna elk biologisch proces wordt gekatalyseerd door een set van tien of meer ruimtelijk gepositioneerde, op elkaar inwerkende eiwitten die zeer geordende bewegingen ondergaan in een machine-achtige assemblage22.
Eiwitmachines vormen zich over het algemeen op specifieke plaatsen in reactie op bepaalde signalen, en dit geldt met name voor eiwitmachines die op DNA werken. De replicatie, reparatie en recombinatie van de dubbele helix van DNA worden vaak beschouwd als afzonderlijke, geïsoleerde processen. Maar in de cel kan eenzelfde DNA-molecule elk van deze reacties ondergaan. Bovendien komen specifieke combinaties van de drie soorten reacties voor. Zo wordt DNA-recombinatie vaak rechtstreeks gekoppeld aan ofwel DNA-replicatie ofwel DNA-reparatie23. Om de integriteit van een chromosoom naar behoren te handhaven, moet elke specifieke reactie zorgvuldig worden gestuurd en gecontroleerd. Daartoe moeten reeksen eiwitten op het DNA worden geassembleerd en alleen worden geactiveerd waar en wanneer zij nodig zijn. Hoewel nog veel moet worden geleerd over hoe deze keuzes worden gemaakt, lijkt het erop dat verschillende soorten DNA-structuren expliciet worden herkend door gespecialiseerde eiwitten die als “assemblagefactoren” fungeren. Elke assemblagefactor dient dan als kern voor een coöperatieve assemblage van de reeks eiwitten die een bepaalde eiwitmachine vormt, zoals nodig voor het katalyseren van een reactie die geschikt is voor dat moment en die plaats in de cel.
Een blik op de toekomst
Het is gebruikelijk geworden, zowel in leerboeken als in de gewone wetenschappelijke literatuur, om moleculaire mechanismen uit te leggen aan de hand van eenvoudige tweedimensionale tekeningen of ‘cartoons’. Dergelijke tekeningen zijn nuttig om grote hoeveelheden gegevens in een eenvoudig schema samen te vatten, zoals in dit overzicht wordt geïllustreerd. Maar een hele generatie biologen is wellicht in de waan geraakt dat de essentie van een biologisch mechanisme is vastgelegd, en het hele probleem dus is opgelost, zodra een onderzoeker genoeg van de puzzel heeft ontcijferd om een zinvolle cartoon van dit type te kunnen tekenen.
De afgelopen jaren is overduidelijk geworden dat er veel meer van wetenschappers zal worden gevraagd voordat we kunnen beweren een proces als DNA replicatie of DNA recombinatie volledig te begrijpen. Recente projecten voor de sequentiebepaling van het genoom, het in kaart brengen van proteïne-interacties en studies naar celsignalering hebben veel meer componenten en moleculaire interacties aan het licht gebracht dan voorheen werd gedacht. Volgens een recente analyse bijvoorbeeld gebruikt S. cerevisiae, een eencellig “eenvoudig” eukaryotisch organisme (dat ongeveer 6.000 genen heeft, tegen 30.000 bij de mens), 88 genen voor zijn DNA-replicatie en 49 genen voor zijn DNA-recombinatie24.
Om ons op DNA-replicatie te concentreren, zal een volledig begrip van het mechanisme vereisen dat we terugkeren naar waar de studies van DNA voor het eerst begonnen – in de scheikunde en de fysica. Gedetailleerde atomaire structuren van alle relevante proteïnen en nucleïnezuren zullen nodig zijn, en er wordt spectaculaire vooruitgang geboekt door structuurbiologen, dankzij steeds krachtigere röntgenkristallografie- en kernspinresonantietechnieken. Maar het vermogen om biologische processen in een reageerbuis te reconstrueren met moleculen waarvan de precieze structuur bekend is, is niet voldoende. Het replicatieproces verloopt zowel zeer snel als ongelooflijk nauwkeurig, met een uiteindelijke foutmarge van ongeveer één nucleotide op een miljard. Om te begrijpen hoe de reacties tussen de vele verschillende eiwitten en andere moleculen worden gecoördineerd om tot dit resultaat te komen, moeten de experimentalisten alle snelheidsconstanten voor de interacties tussen de verschillende componenten bepalen, iets wat tegenwoordig zelden wordt gedaan door moleculaire biologen. Zij kunnen dan genetische manipulatietechnieken gebruiken om geselecteerde reeksen van deze parameters te wijzigen, waarbij zij zorgvuldig het effect van deze veranderingen op het replicatieproces volgen.
Wetenschappers zullen pas kunnen beweren dat zij een complex proces zoals DNA-replicatie werkelijk begrijpen, wanneer zij het effect van veranderingen in elk van de verschillende snelheidsconstanten op de totale reactie nauwkeurig kunnen voorspellen. Omdat het scala van experimentele manipulaties enorm is, zullen we krachtigere manieren nodig hebben om te bepalen welke veranderingen het meest waarschijnlijk ons begrip zullen vergroten. Daarom moeten nieuwe benaderingen uit de zich snel ontwikkelende computationele biologie worden ontwikkeld – zowel om de experimenten te sturen als om de resultaten te interpreteren.
Het Watson-Crick-model van DNA heeft dramatische vooruitgang gekatalyseerd in ons moleculaire begrip van de biologie. Tegelijkertijd gaf het enorme succes ervan aanleiding tot de misleidende opvatting dat vele andere complexe aspecten van de biologie op soortgelijke wijze tot elegante eenvoud zouden kunnen worden teruggebracht door middel van inzichtelijke theoretische analyse en modelbouw. Deze opvatting is in de daaropvolgende decennia achterhaald, omdat de meeste biologische subsystemen veel te complex zijn gebleken om in detail te kunnen worden voorspeld. Wij weten nu dat niets de rigoureuze experimentele analyses kan vervangen. Maar de traditionele moleculaire en celbiologie alleen kan een probleem als DNA-replicatie niet tot een goed einde brengen. Er zullen nieuwe benaderingen nodig zijn, waarbij niet alleen gebruik wordt gemaakt van nieuwe computationele hulpmiddelen, maar ook van een grotere integratie van chemie en fysica20,25. Daarom moet het onderwijs aan de volgende generatie biologische wetenschappers dringend worden herzien22,26.