”Även om fakta i sig är mindre tillfredsställande än de intellektuella slutsatser som dras av dem, bör deras betydelse aldrig ifrågasättas.” James D. Watson, 2002.
DNA bär all genetisk information för livet. En enormt lång DNA-molekyl bildar var och en av kromosomerna i en organism, 23 stycken hos en människa. Den grundläggande levande enheten är den enskilda cellen. En cell ger upphov till många fler celler genom seriella upprepningar av en process som kallas celldelning. Före varje delning måste nya kopior göras av var och en av de många molekyler som bildar cellen, inklusive dupliceringen av alla DNA-molekyler. DNA-replikation är namnet på denna duplikationsprocess, som gör det möjligt att överföra en organisms genetiska information – dess gener – till de två dotterceller som skapas när en cell delas. En process som kräver dynamisk DNA-akrobatik, kallad homolog DNA-rekombination, och som innebär att generna på kromosomerna blandas om, är något mindre central för livet. I reaktioner som är nära kopplade till DNA-replikation reparerar rekombinationsmaskineriet också skador som oundvikligen uppstår på de långa, bräckliga DNA-molekylerna inne i cellerna (se Friedbergs artikel i detta nummer, sidan 436).
Den modell för DNA:s dubbelspiral1 som föreslogs av James Watson och Francis Crick bygger på två parade DNA-strängar som är komplementära i sin nukleotidsekvens. Modellen fick slående konsekvenser för processerna DNA-replikation och DNA-rekombination. Före 1953 hade det inte funnits något meningsfullt sätt att ens spekulera om de molekylära mekanismerna för dessa två centrala genetiska processer. Men förslaget att varje nukleotid i en DNA-sträng var tätt baskopplad med sin komplementära nukleotid på den motsatta strängen – antingen adenin (A) med tymin (T) eller guanin (G) med cytosin (C) – innebar att varje del av nukleotidsekvensen kunde fungera som en direkt mall för motsvarande del av den andra strängen. Som ett resultat av detta kan varje del av sekvensen användas antingen för att skapa eller känna igen sin partnernukleotidsekvens – de två funktioner som är centrala för DNA-replikation respektive DNA-rekombination.
I denna översikt diskuterar jag hur upptäckten av DNA:s struktur för ett halvt sekel sedan öppnade nya vägar för att förstå processerna för DNA-replikation och rekombination. Jag kommer också att betona hur vår förståelse av komplexa biologiska molekyler och deras interaktioner har ökat genom åren, vilket har lett till djupgående förändringar i biologernas syn på livets kemi.
DNA:s strukturella egenskaper
Den forskning som omedelbart följde på upptäckten av dubbelhelixen inriktade sig i första hand på att förstå molekylens strukturella egenskaper. DNA specificerar RNA genom processen för gentranskription, och RNA-molekylerna specificerar i sin tur alla proteiner i en cell. Detta är den ”centrala dogmen” för överföring av genetisk information2. Varje avläsning av genetisk information – oavsett om det sker under DNA-replikation eller gentranskription – kräver tillgång till sekvensen av de baser som ligger begravda i dubbelhelixens inre. Separationen av DNA-strängen är därför avgörande för DNA:s funktion. Watson-Crick-modellen ledde därför till att forskarna sökte efter förhållanden som skulle störa vätebindningarna mellan de komplementära basparen så att de två strängarna i DNA:s dubbelspiral separerades.
Fysikaliska kemister upptäckte att upphettning av en DNA-lösning till temperaturer nära kokpunkten (100 °C), eller att utsätta den för extrema pH-värden, skulle leda till att strängarna separerades – en förändring som kallades för ”DNA- denaturering”. Den så kallade ”smälttemperaturen” (eller Tm) för en bit av en DNA-sekvens beror på dess nukleotidkomposition: DNA med en större andel G-C-baspar uppvisar en högre Tm på grund av de tre vätebindningar som Watson och Crick förutspådde för att hålla ihop ett G-C-baspar, jämfört med endast två för ett A-T-baspar. Vid fysiologiska saltkoncentrationer är Tm för däggdjurs-DNA nästan 90 °C, på grund av den speciella sammansättningen av dess baspar (47 % G-C och 53 % A-T)3.
Inledningsvis verkade det otänkbart att en DNA-sträng skulle kunna bilda en dubbelspiral igen när den väl hade separerats från sin komplementära partner. I en komplex blandning av DNA-molekyler skulle en sådan bedrift kräva att man hittade en sekvens som stämde överens med miljontals sekvenser under slumpmässiga kollisioner med andra sekvenser, och sedan snabbt spolade tillbaka med en ny partnersträng. Den dramatiska upptäckten av detta oväntade fenomen4, som kallas ”DNA-renaturering”, kastade ljus över hur sekvenser kan omorganiseras genom DNA-rekombination. Den gav också ett viktigt sätt att manipulera DNA i laboratoriet. Annealing av komplementära nukleotidsekvenser, en process som kallas hybridisering, utgör grunden för flera DNA-tekniker som hjälpte till att lansera bioteknikindustrin och den moderna genomiken. Dessa inkluderar genkloning, genomisk sekvensering och DNA-kopiering med hjälp av polymeraskedjereaktionen (se artikel av Hood och Galas på sidan 444).
Den anordning av DNA-molekyler som finns i kromosomerna utgjorde ytterligare ett mysterium för forskarna: en lång, tunn molekyl skulle vara mycket känslig för brott orsakade av skjuvningar, och det var svårt att föreställa sig att en kromosom från ett däggdjur skulle kunna innehålla endast en enda DNA-molekyl. Detta skulle kräva att en typisk kromosom bildas av en kontinuerlig DNA-helix som är mer än 100 miljoner nukleotidpar lång – en massiv molekyl som väger mer än 100 miljarder dalton, med ett avstånd mellan ändarna på mer än 3 cm. Hur skulle en sådan gigantisk molekyl kunna skyddas från oavsiktlig fragmentering i en cell som bara är mikrometer i diameter, samtidigt som den skulle hållas organiserad för effektiv genavläsning och andra genetiska funktioner?
Det fanns inget prejudikat för sådana jättemolekyler utanför biologins värld. Men i början av 1960-talet visade auktoradiografiska studier att kromosomen i bakterien Escherichia coli i själva verket var en enda DNA-molekyl, med en längd på mer än 3 miljoner nukleotidpar5. Och när – mer än ett decennium senare – innovativa fysikaliska tekniker visade att en enda enorm DNA-molekyl låg till grund för varje kromosom hos däggdjur6 , välkomnades resultatet av forskarna med liten förvåning.
DNA-replikeringsgafflar
Hur kopieras den enormt långa dubbelsträngade DNA-molekyl som bildar en kromosom exakt för att producera en andra identisk kromosom varje gång en cell delar sig? Mallmodellen för DNA-replikation, som föreslogs av Watson och Crick 1953 (ref. 7), fick allmän acceptans efter två upptäckter i slutet av 1950-talet. Det ena var ett elegant experiment där man använde densitetsmärkta bakterie-DNA:er som bekräftade den förutspådda schematiken för mall-anti-mall8. Det andra var upptäckten av ett enzym, DNA-polymeras, som använder en DNA-sträng som mall för att syntetisera en ny komplementär sträng9. Fyra desoxyribonukleosidtrifosfatnukleotider – dATP, dTTP, dGTP och dCTP – är föregångare till en ny dotter-DNA-sträng, där varje nukleotid väljs ut genom att paras med sin komplementära nukleotid (T, A, C respektive G) på den föräldrade mallensträngen. Det visades att DNA-polymeraset använder dessa trifosfater för att lägga till nukleotider en i taget till 3′-änden av den nysyntetiserade DNA-molekylen och därigenom katalysera DNA-kedjans tillväxt i den kemiska riktningen 5′ till 3′.
Och även om syntesen av korta sträckor av DNA-sekvenser på en enkelsträngad mall kunde demonstreras i ett provrör, var det en gåta hur en enorm, tvinnad dubbelsträngad DNA-molekyl replikeras. Inne i cellen observerades att DNA-replikationen sker i en Y-formad struktur, kallad ”replikationsgaffel”, som rör sig stadigt längs en föräldra-DNA-helix och spinner ut två dotter-DNA-helixer bakom sig (de två armarna av ”Y:et”)5 . Som Watson och Crick förutspådde går dubbelhelixens två strängar i motsatt kemisk riktning. När replikationsgaffeln rör sig kan därför DNA-polymeraset kontinuerligt röra sig längs endast en arm av Y:et – den arm där den nya dottersträngen förlängs i den kemiska riktningen 5′ till 3′. På den andra armen skulle den nya dottersträngen behöva produceras i den motsatta kemiska riktningen 3′ till 5′ (fig. 1a). Så medan Watson och Cricks centrala förutsägelser bekräftades i slutet av det första decenniet av forskning som följde på deras banbrytande upptäckt, förblev detaljerna i DNA-replikationsprocessen ett mysterium.
Rekonstruktion av replikation
Mysteriet löstes under loppet av de följande två decennierna, en period då de proteiner som utgör de centrala aktörerna i DNA-replikationsprocessen identifierades. Forskarna använde en mängd olika experimentella metoder för att identifiera en ständigt växande uppsättning genprodukter som tros vara kritiska för DNA-replikation. Till exempel identifierades muterade organismer där DNA-replikationen var defekt, och genetiska tekniker kunde sedan användas för att identifiera specifika uppsättningar av gener som krävs för replikationsprocessen10,11,12. Med hjälp av de proteiner som specificeras av dessa gener upprättades ”cellfria” system där processen återskapades in vitro med hjälp av renade komponenter. Till en början testades proteiner i en ”partiell replikationsreaktion”, där endast en delmängd av det proteinmaskineri som krävs för den fullständiga replikationsprocessen var närvarande, och DNA-mallen tillhandahölls i enkelsträngad form13. Nya proteiner som identifierades lades till ett i taget eller i kombination för att testa deras effekter på DNA-polymerasets katalytiska aktivitet. Ytterligare framsteg i förståelsen av replikation berodde sedan på att skapa mer komplexa in vitro-system, där dubbelsträngat DNA så småningom kunde replikeras genom tillsats av en större uppsättning renade proteiner14,15.
I dag studeras nästan varje process inuti celler – från DNA-replikation och rekombination till transport av membranblåsor – i ett in vitro-system som rekonstruerats från renade komponenter. Även om det är mödosamt att upprätta sådana system gör det möjligt att exakt kontrollera både koncentrationen och den detaljerade strukturen hos varje komponent. Dessutom undviks det ”brus” i det naturliga systemet som orsakas av sidoreaktioner – eftersom de flesta molekyler i en cell deltar i mer än en typ av reaktion – genom att man eliminerar de proteiner som katalyserar dessa andra reaktioner. I huvudsak kan en liten del av cellen återskapas som en avgränsad uppsättning kemiska reaktioner, vilket gör den helt tillgänglig för exakta studier med hjälp av alla fysikens och kemins verktyg.
För 1980 hade in vitro-system med flera proteiner gjort det möjligt att i detalj karakterisera replikationsmaskineriet och lösa problemet med hur DNA syntetiseras på båda sidor av replikationsgaffeln (fig. 1b). En dotter-DNA-sträng syntetiseras kontinuerligt av en DNA-polymerasmolekyl som rör sig längs den ”ledande strängen”, medan en andra DNA-polymerasmolekyl på den ”eftersläpande strängen” producerar en lång rad fragment (så kallade Okazaki-fragment)16 som sammanfogas av enzymet DNA-ligas för att producera en kontinuerlig DNA-sträng. Som man kan förvänta sig finns det en skillnad i de proteiner som krävs för DNA-syntesen i ledande och efterföljande strängar (se ruta 1). Det är anmärkningsvärt att de replikationsgafflar som bildades i dessa konstgjorda system kunde visas röra sig i samma snabba takt som gafflarna i cellerna (500 till 1 000 nukleotider per sekund), och DNA-mallen kopierades med otroligt hög tillförlitlighet15.
I takt med att man upptäckte att fler och fler proteiner fungerade vid replikationsgaffeln kunde man göra jämförelser mellan replikationsmaskineriet i olika organismer. Studier av replikationsmaskineriet i virus, bakterier och eukaryoter visade att en gemensam uppsättning proteinaktiviteter driver replikationsgafflarna i varje organism (ruta 1). Varje system består av: en DNA-polymerasmolekyl med ledande och en DNA-polymerasmolekyl med eftersläpande sträng, ett DNA-primas för att producera RNA-primerna som startar varje Okazaki-fragment, bindningsproteiner för enkelsträng-DNA som täcker DNA-mallen och håller den på plats, ett DNA-helixas som avvecklar dubbelhelixen och ytterligare polymerastillbehörsproteiner som binder polymeraserna till varandra och till DNA-mallen. När man går från ett enkelt virus till mer komplexa organismer, t.ex. jäst eller däggdjur, tenderar antalet underenheter som utgör varje typ av proteinaktivitet att öka. Det totala antalet polypeptidunderenheter som utgör kärnan i replikationsapparaten ökar till exempel från fyra och sju i bakteriofagerna T7 och T4 till 13 i bakterien E. coli. Och det ökar till minst 27 i jästen Saccharomyces cerevisiae och hos däggdjur. När organismer med större genomer utvecklades lade replikationsmaskineriet alltså till nya proteinunderenheter, utan att de grundläggande mekanismerna förändrades15,18,19,20.
Medans det arbete som jag har beskrivit om DNA-replikation fortskred, etablerade andra forskargrupper in vitro-system i vilka homolog DNA-rekombination kunde rekonstrueras. Den centrala aktören i dessa reaktioner var proteintypen RecA17 , uppkallad efter den bakteriemutant som är defekt i rekombination och som ledde till att den upptäcktes (ruta 2).
Proteinmaskiner
Som för alla andra aspekter av cellbiokemin har DNA-replikeringsapparaten utvecklats under miljarder år genom ”trial and error” – det vill säga genom slumpmässig variation följt av naturligt urval. Med tiden kunde det ena proteinet efter det andra läggas till blandningen av proteiner som är aktiva vid replikationsgaffeln, förmodligen för att det nya proteinet ökade hastigheten, kontrollen eller noggrannheten i den övergripande replikationsprocessen. Dessutom finjusterades varje proteins struktur genom mutationer som ändrade dess aminosyrasekvens för att öka dess effektivitet. Slutresultatet av denna ovanliga tekniska process är de replikationssystem som vi i dag observerar i olika organismer. Mekanismen för DNA-replikation kan därför förväntas vara starkt beroende av slumpmässiga händelser i det förflutna. Men valde evolutionen ut det som fungerar, utan behov av elegans?
Under de första 30 åren efter Watsons och Cricks upptäckt verkade de flesta forskare hålla fast vid uppfattningen att cellprocesser kunde vara slarviga. Denna åsikt uppmuntrades av kunskapen om den enorma hastigheten på rörelser på molekylär nivå (man visste till exempel att ett typiskt protein kolliderar med en andra molekyl som finns i en koncentration på 1 mM ungefär 106 gånger per sekund). De snabba hastigheterna i molekylära rörelser trodde man till en början att en process som DNA-replikation skulle kunna ske utan att de inblandade proteinerna organiserades i tredimensionella rum.
Tvärtom erkänner molekylärbiologer nu att evolutionen har valt ut starkt ordnade system. Sålunda hålls till exempel inte bara delarna i replikationsmaskineriet samman i exakta anpassningar för att optimera deras ömsesidiga interaktioner, utan energidrivna förändringar i proteinkonformationer används också för att generera samordnade rörelser. Detta garanterar att vart och ett av de på varandra följande stegen i en komplex process som DNA-replikation är nära samordnat med nästa steg. Resultatet är en sammansättning som kan ses som en ”proteinmaskin”. Till exempel förblir DNA-polymerasmolekylen på replikationsgaffelns eftersläpande sida bunden till DNA-polymerasmolekylen på den ledande DNA-strängen för att se till att samma polymeras på den eftersläpande strängen används om och om igen för en effektiv syntes av Okazaki-fragment18,20,21 (ruta 1). Och DNA-replikation är på intet sätt unik. Vi tror nu att nästan alla biologiska processer katalyseras av en uppsättning av tio eller fler rumsligt placerade, interagerande proteiner som genomgår mycket ordnade rörelser i en maskinliknande sammansättning22.
Proteinmaskiner bildas i allmänhet på specifika platser som svar på särskilda signaler, och detta gäller särskilt för proteinmaskiner som verkar på DNA. Replikering, reparation och rekombination av DNA:s dubbelhelix betraktas ofta som separata, isolerade processer. Men inuti cellen kan samma DNA-molekyl genomgå vilken som helst av dessa reaktioner. Dessutom förekommer specifika kombinationer av de tre typerna av reaktioner. DNA-rekombination är till exempel ofta direkt kopplad till antingen DNA-replikation eller DNA-reparation23. För att en kromosoms integritet ska kunna upprätthållas på ett korrekt sätt måste varje specifik reaktion styras och kontrolleras noggrant. Detta kräver att uppsättningar av proteiner monteras på DNA och aktiveras endast där och när de behövs. Även om mycket återstår att lära om hur dessa val görs, verkar det som om olika typer av DNA-strukturer erkänns explicit av specialiserade proteiner som fungerar som ”monteringsfaktorer”. Varje monteringsfaktor tjänar sedan till att sätta igång en kooperativ montering av den uppsättning proteiner som bildar en viss proteinmaskin, enligt vad som behövs för att katalysera en reaktion som är lämplig vid den tidpunkten och på den platsen i cellen.
En syn på framtiden
Det har blivit vanligt, både i läroböcker och i den vanliga vetenskapliga litteraturen, att förklara molekylära mekanismer med hjälp av enkla tvådimensionella teckningar eller ”karikatyrer”. Sådana teckningar är användbara för att konsolidera stora mängder data i ett enkelt schema, vilket illustreras i denna översikt. Men en hel generation biologer kan ha blivit invaggade i tron att kärnan i en biologisk mekanism har fångats, och att hela problemet därför är löst, när en forskare har dechiffrerat tillräckligt mycket av pusslet för att kunna rita en meningsfull teckning av den här typen.
Under de senaste åren har det blivit helt uppenbart att det kommer att krävas mycket mer av forskarna innan vi kan göra anspråk på att helt och hållet förstå en process som DNA-replikation eller DNA-rekombination. Nya projekt för sekvensering av arvsmassan, kartläggning av proteininteraktioner och studier av cellsignalering har avslöjat många fler komponenter och molekylära interaktioner än vad man tidigare insett. Enligt en färsk analys använder till exempel S. cerevisiae, en encellig ”enkel” eukaryotisk organism (som har cirka 6 000 gener jämfört med 30 000 hos människor), 88 gener för sin DNA-replikation och 49 gener för sin DNA-rekombination24.
För att fokusera på DNA-replikation och för att förstå mekanismen till fullo krävs att man återvänder till den plats där DNA-undersökningarna först började, nämligen inom kemi och fysik. Det kommer att krävas detaljerade atomstrukturer av alla relevanta proteiner och nukleinsyror, och strukturbiologer gör spektakulära framsteg tack vare allt kraftfullare röntgenkristallografi och kärnmagnetisk resonansteknik. Men förmågan att rekonstruera biologiska processer i ett provrör med molekyler vars exakta strukturer är kända räcker inte. Replikationsprocessen är både mycket snabb och otroligt noggrann, med en slutlig felprocent på ungefär en nukleotid på en miljard. För att förstå hur reaktionerna mellan de många olika proteinerna och andra molekyler samordnas för att skapa detta resultat krävs att experimentalisterna bestämmer alla hastighetskonstanter för interaktionerna mellan de olika komponenterna, något som molekylärbiologer sällan gör idag. De kan sedan använda gentekniska metoder för att ändra utvalda uppsättningar av dessa parametrar och noggrant övervaka effekten av dessa förändringar på replikationsprocessen.
Vetenskapsmännen kommer att kunna hävda att de verkligen förstår en komplex process som DNA-replikation först när de exakt kan förutsäga effekten av förändringar i var och en av de olika hastighetskonstanterna på den övergripande reaktionen. Eftersom utbudet av experimentella manipulationer är enormt kommer vi att behöva kraftfullare metoder för att avgöra vilka sådana förändringar som är mest sannolika för att öka vår förståelse. Nya metoder från det snabbt växande området för beräkningsbiologi måste därför utvecklas – både för att vägleda experimenten och för att tolka resultaten.
Watson-Crick-modellen för DNA katalyserade dramatiska framsteg i vår molekylära förståelse av biologin. Samtidigt gav dess enorma framgång upphov till den vilseledande uppfattningen att många andra komplexa aspekter av biologin på samma sätt skulle kunna reduceras till elegant enkelhet genom insiktsfull teoretisk analys och modellbygge. Detta synsätt har under de följande decennierna förbytts, eftersom de flesta biologiska delsystem har visat sig vara alldeles för komplexa för att man skall kunna förutsäga deras detaljer. Vi vet nu att ingenting kan ersätta rigorösa experimentella analyser. Men traditionell molekylär- och cellbiologi kan inte ensamt lösa ett problem som DNA-replikation. Det kommer att krävas nya typer av tillvägagångssätt, som inte bara inbegriper nya beräkningsverktyg utan också en större integrering av kemi och fysik20,25. Därför måste vi snarast ompröva den utbildning som vi ger nästa generation biologiska forskare22,26.