“Selv om fakta i sagens natur er mindre tilfredsstillende end de intellektuelle konklusioner, der drages af dem, bør man aldrig sætte spørgsmålstegn ved deres betydning.” James D. Watson, 2002.
DNA bærer al den genetiske information for livet. Et enormt langt DNA-molekyle danner hvert af en organismes kromosomer, 23 af dem hos et menneske. Den grundlæggende levende enhed er den enkelte celle. En celle giver anledning til mange flere celler gennem serielle gentagelser af en proces, der kaldes celledeling. Før hver deling skal der laves nye kopier af hvert af de mange molekyler, der udgør cellen, herunder kopiering af alle DNA-molekyler. DNA-replikation er navnet på denne duplikationsproces, som gør det muligt at videregive en organismes genetiske information – dens gener – til de to datterceller, der opstår, når en celle deler sig. Kun lidt mindre central for livet er en proces, der kræver dynamisk DNA-akrobatik, den såkaldte homologe DNA-rekombination, som ændrer generne på kromosomerne. I reaktioner, der er tæt forbundet med DNA-replikation, reparerer rekombinationsmaskineriet også skader, der uundgåeligt opstår på de lange, skrøbelige DNA-molekyler inde i cellerne (se artikel af Friedberg i dette nummer, side 436).
Den model for DNA-dobbeltspiralen1, som James Watson og Francis Crick har foreslået, er baseret på to parvise DNA-strenge, der er komplementære i deres nukleotidsekvens. Modellen havde slående konsekvenser for processerne DNA-replikation og DNA-rekombination. Før 1953 havde der ikke været nogen meningsfuld måde at spekulere over de molekylære mekanismer i disse to centrale genetiske processer på. Men forslaget om, at hvert nukleotid i den ene DNA-streng var tæt baseparret med sit komplementære nukleotid på den modsatte streng – enten adenin (A) med thymin (T) eller guanin (G) med cytosin (C) – betød, at enhver del af nukleotidsekvensen kunne fungere som en direkte skabelon for den tilsvarende del af den anden streng. Som følge heraf kan enhver del af sekvensen bruges til enten at skabe eller genkende sin partner-nukleotidsekvens – de to funktioner, der er centrale for henholdsvis DNA-replikation og DNA-rekombination.
I denne gennemgang diskuterer jeg, hvordan opdagelsen af DNA’s struktur for et halvt århundrede siden åbnede nye veje til at forstå DNA-replikations- og rekombinationsprocesserne. Jeg vil også fremhæve, hvordan der i takt med at vores forståelse af komplekse biologiske molekyler og deres interaktioner er vokset gennem årene, er der sket dybtgående ændringer i den måde, biologer ser på livets kemi.
Strukturelle egenskaber ved DNA
Den forskning, der fulgte umiddelbart efter opdagelsen af dobbelthelixen, fokuserede primært på at forstå molekylets strukturelle egenskaber. DNA specificerer RNA gennem processen med gentranskription, og RNA-molekylerne specificerer igen alle proteinerne i en celle. Dette er det “centrale dogme” om genetisk informationsoverførsel2. Enhver aflæsning af genetisk information – hvad enten det er under DNA-replikation eller gentranskription – kræver adgang til sekvensen af de baser, der er begravet i dobbeltspiralens indre. DNA-strengadskillelse er derfor afgørende for DNA’s funktion. Watson-Crick-modellen fik derfor forskerne til at søge efter forhold, der kunne afbryde de hydrogenbindinger, der forbinder de komplementære basepar, således at de to strenge i DNA-dobbeltspiralen blev adskilt.
Fysikalkemikere fandt ud af, at opvarmning af en DNA-opløsning til temperaturer tæt på kogepunktet (100 °C) eller udsættelse for ekstreme pH-værdier ville få strengene til at adskille sig – en ændring, der kaldes “DNA-denaturering”. Den såkaldte “smeltetemperatur” (eller Tm) for en DNA-sekvens afhænger af dens nukleotid-sammensætning: DNA’er med en større andel af G-C-basepar har en højere Tm på grund af de tre hydrogenbindinger, som Watson og Crick havde forudsagt skulle holde et G-C-basepar sammen, sammenlignet med kun to for et A-T-basepar. Ved fysiologiske saltkoncentrationer er Tm for pattedyrs-DNA næsten 90 °C på grund af den særlige blanding af baseparrene (47 % G-C og 53 % A-T)3.
I første omgang syntes det utænkeligt, at en DNA-streng, når den først er blevet adskilt fra sin komplementære partner, kunne danne en dobbeltspiral igen. I en kompleks blanding af DNA-molekyler ville en sådan bedrift kræve, at man under tilfældige kollisioner med andre sekvenser skulle finde den ene sekvens, der passede til millioner af sekvenser, og derefter hurtigt spole tilbage med en ny partnerstreng. Den dramatiske opdagelse af dette uventede fænomen4, kaldet “DNA-renaturering”, kastede lys over, hvordan sekvenser kan omarrangeres ved DNA-rekombination. Og det gav også et afgørende middel til at manipulere DNA i laboratoriet. Annealing af komplementære nukleotidsekvenser, en proces kaldet hybridisering, danner grundlaget for flere DNA-teknologier, som har været med til at lancere den bioteknologiske industri og den moderne genomforskning. Disse omfatter genkloning, genomisk sekventering og DNA-kopiering ved hjælp af polymerasekædereaktionen (se artikel af Hood og Galas på side 444).
Anordningen af DNA-molekyler i kromosomer udgjorde endnu et mysterium for forskerne: Et langt, tyndt molekyle ville være meget følsomt over for brud forårsaget af forskydning, og det var svært at forestille sig, at et pattedyrskromosom kun kunne indeholde et enkelt DNA-molekyle. Det ville kræve, at et typisk kromosom blev dannet af en kontinuerlig DNA-helix, der er mere end 100 millioner nukleotidpar lang – et massivt molekyle, der vejer mere end 100 milliarder dalton og har en afstand fra ende til ende på mere end 3 cm. Hvordan kunne et så gigantisk molekyle beskyttes mod utilsigtet fragmentering i en celle med en diameter på kun få mikrometer, samtidig med at det blev organiseret med henblik på effektiv genaflæsning og andre genetiske funktioner?
Der var ingen fortilfælde for sådanne kæmpemolekyler uden for biologiens verden. Men i begyndelsen af 1960’erne afslørede autoradiografiske undersøgelser, at kromosomet i bakterien Escherichia coli faktisk var et enkelt DNA-molekyle med en længde på mere end 3 millioner nukleotidpar5. Og da innovative fysiske teknikker mere end et årti senere viste, at et enkelt enormt DNA-molekyle dannede grundlaget for hvert pattedyrs kromosom6, blev resultatet modtaget af forskerne med ringe overraskelse.
DNA-replikationsgafler
Hvordan kopieres det enormt lange dobbeltstrengede DNA-molekyle, der danner et kromosom, nøjagtigt for at fremstille et andet identisk kromosom, hver gang en celle deler sig? Skabelonmodellen for DNA-replikation, der blev foreslået af Watson og Crick i 1953 (ref. 7), vandt almindelig anerkendelse efter to opdagelser i slutningen af 1950’erne. Det ene var et elegant eksperiment, hvor der blev brugt tæthedsmærkede bakterie-DNA’er, som bekræftede den forudsagte template-anti-template-ordning8. Det andet var opdagelsen af et enzym kaldet DNA-polymerase, som bruger en DNA-streng som skabelon til at syntetisere en ny komplementær streng9. Fire desoxyribonukleosidtriphosphatnukleotider – dATP, dTTP, dGTP og dCTP – er forløbere for en ny datter-DNA-streng, hvor hvert nukleotid vælges ved at parre sig med sit komplementære nukleotid (henholdsvis T, A, C eller G) på den oprindelige skabelonstreng. Det blev vist, at DNA-polymerasen bruger disse triphosphater til at tilføje nukleotider et ad gangen til 3′-enden af det nyligt syntetiserede DNA-molekyle, hvorved den katalyserer DNA-kædens vækst i den kemiske retning 5′ til 3′.
Men selv om syntesen af korte strækninger af DNA-sekvenser på en enkeltstrenget skabelon kunne demonstreres i et reagensglas, var det en gåde, hvordan et enormt, snoet dobbeltstrenget DNA-molekyle replikeres. Inde i cellen blev det observeret, at DNA-replikationen sker ved en Y-formet struktur, kaldet en “replikationsgaffel”, som bevæger sig støt langs en forældre-DNA-helix og spinder to datter-DNA-helixer ud bag den (de to arme af “Y’et”)5. Som forudsagt af Watson og Crick løber de to strenge i dobbelthelixen i modsatte kemiske retninger. Når en replikationsgaffel bevæger sig, kan DNA-polymerase derfor kun bevæge sig kontinuerligt langs den ene arm af Y’et – den arm, hvor den nye datterstreng forlænges i den kemiske 5′ til 3′-retning. På den anden arm skal den nye datterstreng produceres i den modsatte kemiske retning, 3′ til 5′ (fig. 1a). Så mens Watson og Cricks centrale forudsigelser blev bekræftet i slutningen af det første årti af forskning, der fulgte efter deres skelsættende opdagelse, forblev detaljerne i DNA-replikationsprocessen et mysterium.
Rekonstruktion af replikation
Mysteriet blev løst i løbet af de næste to årtier, en periode, hvor de proteiner, der udgør de centrale aktører i DNA-replikationsprocessen, blev identificeret. Forskerne brugte en række forskellige eksperimentelle metoder til at identificere et stadigt voksende sæt af genprodukter, der menes at være kritiske for DNA-replikation. F.eks. blev der identificeret mutante organismer, hvor DNA-replikationen var defekt, og genetiske teknikker kunne derefter anvendes til at identificere specifikke sæt af gener, der var nødvendige for replikationsprocessen10,11,12. Ved hjælp af de proteiner, der er specificeret af disse gener, blev der etableret “cellefrie” systemer, hvor processen blev genskabt in vitro ved hjælp af oprensede komponenter. I første omgang blev proteinerne testet i en “delvis replikationsreaktion”, hvor kun en delmængde af det proteinmaskineri, der er nødvendigt for den fulde replikationsproces, var til stede, og DNA-skabelonen blev leveret i enkeltstrenget form13. Nye proteiner, der blev identificeret, blev tilføjet et ad gangen eller i kombination for at teste deres virkninger på den katalytiske aktivitet af DNA-polymerase. Yderligere fremskridt i forståelsen af replikation var derefter afhængig af at skabe mere komplekse in vitro-systemer, hvor dobbeltstrenget DNA til sidst kunne replikeres ved at tilføje et større sæt oprensede proteiner14,15.
I dag undersøges næsten alle processer inde i celler – fra DNA-replikation og rekombination til membranblæretransport – i et in vitro-system, der er rekonstrueret ud fra oprensede komponenter. Selv om det er besværligt at etablere sådanne systemer, giver de mulighed for en præcis kontrol af både koncentrationen og den detaljerede struktur af hver enkelt komponent. Desuden kan man undgå den “støj” i det naturlige system, der skyldes bivirkninger – fordi de fleste molekyler i en celle er involveret i mere end én type reaktion – ved at fjerne de proteiner, der katalyserer disse andre reaktioner. I det væsentlige kan en lille del af cellen genskabes som et afgrænset sæt af kemiske reaktioner, hvilket gør den fuldt ud egnet til præcise undersøgelser ved hjælp af alle fysikkens og kemiens værktøjer.
I 1980 havde multiprotein in vitro-systemer muliggjort en detaljeret karakterisering af replikationsmaskineriet og løst problemet med, hvordan DNA syntetiseres på begge sider af replikationsgaflen (fig. 1b). En datter-DNA-streng syntetiseres kontinuerligt af et DNA-polymerase-molekyle, der bevæger sig langs den “førende streng”, mens et andet DNA-polymerase-molekyle på den “bagvedliggende streng” producerer en lang række fragmenter (kaldet Okazaki-fragmenter)16 , som forbindes sammen af enzymet DNA-ligase for at producere en kontinuerlig DNA-streng. Som man kunne forvente, er der forskel på de proteiner, der er nødvendige for DNA-syntese af ledende og bagudgående DNA-strenge (se boks 1). Det er bemærkelsesværdigt, at de replikationsgafler, der blev dannet i disse kunstige systemer, kunne påvises at bevæge sig med samme hurtige hastighed som gaflerne inde i cellerne (500 til 1 000 nukleotider pr. sekund), og DNA-skabelonen blev kopieret med utrolig høj nøjagtighed15.
Da flere og flere proteiner blev fundet til at fungere ved replikationsgaflen, kunne der foretages sammenligninger mellem replikationsmaskineriet i forskellige organismer. Undersøgelser af replikationsmaskineriet i vira, bakterier og eukaryoter viste, at et fælles sæt af proteinaktiviteter styrer replikationsgaflerne i hver organisme (boks 1). Hvert system består af: et DNA-polymerase-molekyle med en ledende og et DNA-polymerase-molekyle med en efterslæbende streng; en DNA-primase til fremstilling af de RNA-primere, der starter hvert Okazaki-fragment; enkeltstrengs-DNA-bindingsproteiner, der omslutter skabelon-DNA’et og holder det på plads; en DNA-helicase, der afvikler dobbelthelixen; og yderligere polymerase-accessoriske proteiner, der binder polymeraserne til hinanden og til DNA-skabelonen. Efterhånden som man bevæger sig fra en simpel virus til mere komplekse organismer som f.eks. gær eller pattedyr, er der en tendens til, at antallet af underenheder, der udgør hver type proteinaktivitet, stiger. F.eks. stiger det samlede antal polypeptidunderenheder, der udgør kernen i replikationsapparatet, fra henholdsvis fire og syv i bakteriofagenes T7 og T4 til 13 i bakterien E. coli. Og det udvider sig til mindst 27 i gæren Saccharomyces cerevisiae og i pattedyr. Efterhånden som organismer med større genomer udviklede sig, tilføjede replikationsmaskineriet således nye proteinunderenheder uden nogen ændring af de grundlæggende mekanismer15,18,19,20.
Mens det arbejde, jeg har beskrevet om DNA-replikation, skred frem, etablerede andre forskergrupper in vitro-systemer, hvori homolog DNA-rekombination kunne rekonstrueres. Den centrale aktør i disse reaktioner var proteintypen RecA17 , opkaldt efter den bakteriemutant, der er defekt i rekombination, og som førte til dens opdagelse (boks 2).
Proteinmaskiner
Som alle andre aspekter af cellens biokemi har DNA-replikationsapparatet udviklet sig gennem milliarder af år gennem “trial and error” – dvs. ved tilfældig variation efterfulgt af naturlig udvælgelse. Med tiden kunne det ene protein efter det andet blive tilføjet til den blanding af proteiner, der er aktive ved replikationsgaflen, formentlig fordi det nye protein øgede den samlede replikationsproces’ hastighed, kontrol eller nøjagtighed. Desuden blev strukturen af hvert protein finjusteret ved hjælp af mutationer, der ændrede dets aminosyresekvens for at øge dets effektivitet. Slutresultatet af denne usædvanlige tekniske proces er de replikationssystemer, som vi i dag ser i forskellige organismer. Mekanismen for DNA-replikation kan derfor forventes at være stærkt afhængig af tilfældige hændelser i fortiden. Men har evolutionen udvalgt det, der virker, uden behov for elegance?
I de første 30 år efter Watson og Cricks opdagelse syntes de fleste forskere at have det synspunkt, at celleprocesser kunne være sjuskede. Dette synspunkt blev opmuntret af viden om den enorme hastighed af bevægelser på molekylært niveau (f.eks. vidste man, at et typisk protein kolliderer med et andet molekyle, der er til stede i en koncentration på 1 mM, ca. 106 gange i sekundet). De hurtige molekylære bevægelseshastigheder blev oprindeligt anset for at gøre det muligt for en proces som DNA-replikation at foregå uden nogen organisering af de involverede proteiner i det tredimensionelle rum.
Tværtimod erkender molekylærbiologerne nu, at evolutionen har valgt meget velordnede systemer. Således er det f.eks. ikke kun delene i replikationsmaskineriet, der holdes sammen i præcise tilpasninger for at optimere deres indbyrdes interaktioner, men energidrevne ændringer i proteinkonformationer bruges til at skabe koordinerede bevægelser. Dette sikrer, at hvert af de på hinanden følgende trin i en kompleks proces som DNA-replikation er nøje koordineret med det næste trin. Resultatet er en samling, der kan betragtes som en “proteinmaskine”. F.eks. forbliver DNA-polymerase-molekylet på den bagvedliggende side af replikationsgaflen bundet til DNA-polymerase-molekylet på den ledende streng for at sikre, at den samme bagvedliggende streng-polymerase anvendes igen og igen til effektiv syntese af Okazaki-fragmenter18,20,21 (boks 1). Og DNA-replikation er på ingen måde enestående. Vi mener nu, at næsten alle biologiske processer katalyseres af et sæt af ti eller flere rumligt placerede, interagerende proteiner, der gennemgår meget ordnede bevægelser i en maskinlignende samling22.
Proteinmaskiner dannes generelt på specifikke steder som reaktion på bestemte signaler, og dette gælder især for proteinmaskiner, der virker på DNA. Replikation, reparation og rekombination af DNA-dobbeltspiralen anses ofte for at være separate, isolerede processer. Men inde i cellen er det samme DNA-molekyle i stand til at gennemgå en hvilken som helst af disse reaktioner. Desuden forekommer der specifikke kombinationer af de tre typer reaktioner. F.eks. er DNA-rekombination ofte direkte forbundet med enten DNA-replikation eller DNA-reparation23. For at et kromosoms integritet kan opretholdes korrekt, skal hver enkelt specifik reaktion styres og kontrolleres omhyggeligt. Dette kræver, at sæt af proteiner samles på DNA’et og kun aktiveres, hvor og når de er nødvendige. Selv om der stadig er meget at lære om, hvordan disse valg træffes, ser det ud til, at forskellige typer DNA-strukturer genkendes eksplicit af specialiserede proteiner, der fungerer som “samlefaktorer”. Hver samlefaktor tjener derefter til at sætte gang i en kooperativ samling af det sæt proteiner, der udgør en bestemt proteinmaskine, som er nødvendig for at katalysere en reaktion, der passer til det pågældende tidspunkt og sted i cellen.
Et syn på fremtiden
Det er blevet almindeligt, både i lærebøger og i den almindelige videnskabelige litteratur, at forklare molekylære mekanismer ved hjælp af enkle todimensionale tegninger eller ‘tegninger’. Sådanne tegninger er nyttige til at konsolidere store datamængder i et enkelt skema, som illustreret i denne gennemgang. Men en hel generation af biologer kan være blevet lullet ind i den tro, at essensen af en biologisk mekanisme er blevet fanget, og at hele problemet derfor er løst, når en forsker har tydet nok af puslespillet til at kunne tegne en meningsfuld tegning af denne type.
I de sidste par år er det blevet helt klart, at der vil blive krævet meget mere af forskerne, før vi kan hævde at forstå en proces som DNA-replikation eller DNA-rekombination fuldt ud. De seneste projekter til sekventering af genomet, kortlægning af proteininteraktioner og undersøgelser af cellesignalering har afsløret mange flere komponenter og molekylære interaktioner, end man tidligere var klar over. Ifølge en nylig analyse bruger S. cerevisiae, en encellet “simpel” eukaryot organisme (som har ca. 6 000 gener sammenlignet med 30 000 hos mennesker), 88 gener til DNA-replikation og 49 gener til DNA-rekombination24.
For at fokusere på DNA-replikation er det nødvendigt at vende tilbage til det sted, hvor undersøgelserne af DNA først begyndte – inden for kemi og fysik – for at forstå mekanismen fuldt ud. Der vil være behov for detaljerede atomstrukturer af alle relevante proteiner og nukleinsyrer, og strukturbiologerne gør spektakulære fremskridt takket være de stadig mere effektive røntgenkrystallografi- og kernemagnetiske resonansteknikker. Men det er ikke nok at kunne rekonstruere biologiske processer i et reagensglas med molekyler, hvis præcise strukturer er kendt. Replikationsprocessen er både meget hurtig og utrolig nøjagtig, idet den endelige fejlprocent er på omkring et nukleotid ud af en milliard. For at forstå, hvordan reaktionerne mellem de mange forskellige proteiner og andre molekyler koordineres for at skabe dette resultat, vil det kræve, at eksperimentalisterne bestemmer alle hastighedskonstanterne for interaktionerne mellem de forskellige komponenter, hvilket molekylærbiologer sjældent gør i dag. De kan derefter anvende genteknologiske teknikker til at ændre udvalgte sæt af disse parametre og omhyggeligt overvåge virkningen af disse ændringer på replikationsprocessen.
Forskerne vil først kunne hævde, at de virkelig forstår en kompleks proces som DNA-replikation, når de præcist kan forudsige virkningen af ændringer i hver af de forskellige hastighedskonstanter på den samlede reaktion. Da rækken af eksperimentelle manipulationer er enorm, vil vi få brug for mere effektive metoder til at afgøre, hvilke af disse ændringer der er mest sandsynlige for at øge vores forståelse. Der må derfor udvikles nye metoder fra det hurtigt voksende område for beregningsbiologi – både til at styre eksperimenterne og til at fortolke resultaterne.
Watson-Crick-modellen for DNA katalyserede dramatiske fremskridt i vores molekylære forståelse af biologien. Samtidig gav dens enorme succes anledning til den misvisende opfattelse, at mange andre komplekse aspekter af biologien på samme måde kunne reduceres til elegant enkelhed gennem indsigtsfuld teoretisk analyse og modelbygning. Denne opfattelse er blevet fortrængt i løbet af de efterfølgende årtier, fordi de fleste biologiske delsystemer har vist sig at være alt for komplekse til, at man kan forudsige deres detaljer. Vi ved nu, at intet kan erstatte stringente eksperimentelle analyser. Men traditionel molekylær- og cellebiologi alene kan ikke bringe et problem som DNA-replikation til ophør. Der vil være behov for nye typer tilgange, som ikke blot omfatter nye beregningsværktøjer, men også en større integration af kemi og fysik20,25. Derfor er der et presserende behov for at gentænke den uddannelse, som vi giver den næste generation af biologiske forskere22,26.