„Choć fakty są z natury mniej satysfakcjonujące niż wyciągnięte z nich intelektualne wnioski, ich znaczenie nigdy nie powinno być kwestionowane.” James D. Watson, 2002.
DNA przenosi wszystkie informacje genetyczne potrzebne do życia. Jedna ogromnie długa cząsteczka DNA tworzy każdy z chromosomów organizmu, 23 z nich u człowieka. Podstawową żywą jednostką jest pojedyncza komórka. Komórka daje początek wielu innym komórkom poprzez seryjne powtarzanie procesu zwanego podziałem komórkowym. Przed każdym podziałem muszą być wykonane nowe kopie każdej z wielu cząsteczek tworzących komórkę, w tym duplikacja wszystkich cząsteczek DNA. Replikacja DNA to nazwa nadana temu procesowi powielania, który umożliwia przekazanie informacji genetycznej organizmu – jego genów – dwóm komórkom potomnym powstałym w wyniku podziału komórki. Niewiele mniej kluczowy dla życia jest proces wymagający dynamicznej akrobatyki DNA, zwany homologiczną rekombinacją DNA, który powoduje przemieszczanie genów na chromosomach. W reakcjach ściśle związanych z replikacją DNA, mechanizm rekombinacji naprawia również uszkodzenia, które nieuchronnie pojawiają się w długich, kruchych cząsteczkach DNA wewnątrz komórek (patrz artykuł Friedberga w tym numerze, strona 436).
Model podwójnej helisy DNAx1 zaproponowany przez Jamesa Watsona i Francisa Cricka opiera się na dwóch sparowanych niciach DNA, które są komplementarne w swojej sekwencji nukleotydów. Model ten miał uderzające implikacje dla procesów replikacji DNA i rekombinacji DNA. Przed 1953 r. nie istniał żaden sensowny sposób, by choćby spekulować na temat molekularnych mechanizmów tych dwóch centralnych procesów genetycznych. Jednak propozycja, by każdy nukleotyd w jednej nici DNA był ściśle sparowany zasadowo z komplementarnym nukleotydem na przeciwnej nici – albo adeniną (A) z tyminą (T), albo guaniną (G) z cytozyną (C) – oznaczała, że każda część sekwencji nukleotydów mogła działać jako bezpośredni szablon dla odpowiadającej jej części drugiej nici. W rezultacie każda część sekwencji może być użyta albo do stworzenia, albo do rozpoznania sekwencji nukleotydowej partnera – dwie funkcje, które są centralne odpowiednio dla replikacji DNA i rekombinacji DNA.
W tym przeglądzie omówię, jak odkrycie struktury DNA pół wieku temu otworzyło nowe drogi do zrozumienia procesów replikacji i rekombinacji DNA. Podkreślę również, w jaki sposób, w miarę jak nasze zrozumienie złożonych cząsteczek biologicznych i ich interakcji wzrastało na przestrzeni lat, nastąpiły głębokie zmiany w sposobie, w jaki biolodzy postrzegają chemię życia.
Strukturalne cechy DNA
Badania, które nastąpiły bezpośrednio po odkryciu podwójnej helisy, koncentrowały się przede wszystkim na zrozumieniu strukturalnych właściwości cząsteczki. DNA określa RNA poprzez proces transkrypcji genów, a cząsteczki RNA z kolei określają wszystkie białka komórki. Jest to „centralny dogmat” przekazywania informacji genetycznej2. Każdy odczyt informacji genetycznej – czy to podczas replikacji DNA, czy transkrypcji genów – wymaga dostępu do sekwencji zasad zakopanych we wnętrzu podwójnej helisy. Separacja nici DNA jest zatem krytyczna dla funkcji DNA. Dlatego model Watsona-Cricka skłonił naukowców do poszukiwania warunków, które zakłóciłyby wiązania wodorowe łączące komplementarne pary zasad, tak aby rozdzielić dwie nici podwójnej helisy DNA.
Chemicy fizyczni odkryli, że podgrzanie roztworu DNA do temperatury bliskiej wrzenia (100 °C) lub poddanie go skrajnym wartościom pH spowoduje rozdzielenie nici – zmianę określaną jako „denaturacja DNA”. Tak zwana „temperatura topnienia” (lub Tm) odcinka sekwencji DNA zależy od składu nukleotydów: DNA z większą liczbą par zasad G-C wykazują wyższą Tm ze względu na trzy wiązania wodorowe, które według przewidywań Watsona i Cricka mają utrzymywać parę zasad G-C razem, w porównaniu z dwoma wiązaniami dla pary zasad A-T. Przy fizjologicznym stężeniu soli, Tm DNA ssaków wynosi prawie 90 °C, dzięki szczególnej mieszance par zasad (47% G-C i 53% A-T)3.
Początkowo wydawało się nie do pomyślenia, że po oddzieleniu od swojego komplementarnego partnera, nić DNA może ponownie utworzyć podwójną helisę. W złożonej mieszaninie cząsteczek DNA, taki wyczyn wymagałby znalezienia jedynej pasującej sekwencji wśród milionów podczas przypadkowych zderzeń z innymi sekwencjami, a następnie szybkiego przewinięcia z nową partnerską nicią. Dramatyczne odkrycie tego nieoczekiwanego zjawiska4, zwanego „renaturacją DNA”, rzuciło światło na sposób, w jaki sekwencje mogą być rearanżowane w wyniku rekombinacji DNA. Dostarczyło ono również kluczowego środka, dzięki któremu można manipulować DNA w laboratorium. Łączenie komplementarnych sekwencji nukleotydów, proces zwany hybrydyzacją, stanowi podstawę kilku technologii DNA, które pomogły zapoczątkować przemysł biotechnologiczny i nowoczesną genomikę. Należą do nich klonowanie genów, sekwencjonowanie genomów i kopiowanie DNA za pomocą reakcji łańcuchowej polimerazy (patrz artykuł Hooda i Galasa na stronie 444).
Układ cząsteczek DNA w chromosomach stanowił kolejną zagadkę dla naukowców: długa, cienka cząsteczka byłaby bardzo wrażliwa na złamania spowodowane ścinaniem i trudno było sobie wyobrazić, że chromosom ssaka może zawierać tylko pojedynczą cząsteczkę DNA. Wymagałoby to uformowania typowego chromosomu z ciągłej helisy DNA o długości ponad 100 milionów par nukleotydów – masywnej cząsteczki o masie ponad 100 miliardów daltonów i odległości między końcami wynoszącej ponad 3 cm. W jaki sposób tak gigantyczna cząsteczka mogłaby być chroniona przed przypadkową fragmentacją w komórce o średnicy zaledwie mikrona, przy jednoczesnym zachowaniu jej organizacji umożliwiającej efektywny odczyt genów i innych funkcji genetycznych?
Nie istniał żaden precedens dla tak gigantycznych cząsteczek poza światem biologii. Jednak na początku lat 60. badania autoradiograficzne ujawniły, że chromosom bakterii Escherichia coli był w rzeczywistości pojedynczą cząsteczką DNA o długości ponad 3 milionów par nukleotydów5. A kiedy – ponad dekadę później – nowatorskie techniki fizyczne wykazały, że pojedyncza ogromna cząsteczka DNA stanowi podstawę każdego chromosomu ssaków6, wynik ten został przyjęty przez naukowców z niewielkim zdziwieniem.
Widełki replikacyjne DNA
Jak ogromnie długa dwuniciowa cząsteczka DNA, która tworzy chromosom, jest dokładnie kopiowana w celu wytworzenia drugiego identycznego chromosomu za każdym razem, gdy komórka się dzieli? Model szablonu dla replikacji DNA, zaproponowany przez Watsona i Cricka w 1953 roku (ref. 7), zyskał powszechną akceptację po dwóch odkryciach w późnych latach 50-tych. Jednym z nich był elegancki eksperyment z użyciem bakteryjnego DNA znakowanego gęstością, który potwierdził przewidywany schemat szablon-antyszablon8. Drugim było odkrycie enzymu zwanego polimerazą DNA, który wykorzystuje jedną nić DNA jako szablon do syntezy nowej, komplementarnej nici9. Cztery trójfosforanowe nukleotydy dezoksyrybonukleozydów – dATP, dTTP, dGTP i dCTP – są prekursorami nowej nici pochodnej DNA, przy czym każdy nukleotyd wybierany jest przez sparowanie z komplementarnym nukleotydem (odpowiednio T, A, C lub G) na macierzystej nici szablonowej. Wykazano, że polimeraza DNA wykorzystuje te trifosforany do dodawania nukleotydów jeden po drugim do 3′ końca nowo syntetyzowanej cząsteczki DNA, katalizując w ten sposób wzrost łańcucha DNA w kierunku chemicznym od 5′ do 3′.
Ale chociaż synteza krótkich odcinków sekwencji DNA na jednoniciowym szablonie mogła być zademonstrowana w probówce, jak ogromna, skręcona dwuniciowa cząsteczka DNA jest replikowana, stanowiła zagadkę. Wewnątrz komórki zaobserwowano, że replikacja DNA zachodzi w strukturze w kształcie litery Y, zwanej „widelcem replikacyjnym”, który porusza się ruchem jednostajnym wzdłuż macierzystej helisy DNA, przerzucając za nią dwie pochodne helisy DNA (dwa ramiona „Y”)5. Jak przewidzieli Watson i Crick, dwie nici podwójnej helisy biegną w przeciwnych kierunkach chemicznych. Dlatego też, gdy widełki replikacyjne poruszają się, polimeraza DNA może poruszać się w sposób ciągły tylko wzdłuż jednego ramienia Y – ramienia, na którym nowa nić potomna jest wydłużana w kierunku chemicznym 5′ do 3′. Na drugim ramieniu nowa nić potomna musiałaby być wytwarzana w przeciwnym kierunku chemicznym, od 3′ do 5′ (Rys. 1a). Tak więc, podczas gdy główne przewidywania Watsona i Cricka zostały potwierdzone pod koniec pierwszej dekady badań, które nastąpiły po ich przełomowym odkryciu, szczegóły procesu replikacji DNA pozostały tajemnicą.
Rekonstrukcja replikacji
Zagadka została rozwiązana w ciągu następnych dwóch dekad, okresu, w którym zidentyfikowano białka stanowiące centralnych graczy w procesie replikacji DNA. Naukowcy stosowali różne podejścia eksperymentalne, aby zidentyfikować coraz większy zestaw produktów genowych, które uważano za krytyczne dla replikacji DNA. Na przykład, zidentyfikowano zmutowane organizmy, w których replikacja DNA była wadliwa, a techniki genetyczne mogły być następnie wykorzystane do identyfikacji specyficznych zestawów genów wymaganych dla procesu replikacji10,11,12. Przy pomocy białek określonych przez te geny, stworzono systemy „bezkomórkowe”, w których proces był odtwarzany in vitro przy użyciu oczyszczonych składników. Początkowo białka były testowane w „reakcji częściowej replikacji”, gdzie tylko podzbiór mechanizmów białkowych wymaganych dla pełnego procesu replikacji był obecny, a szablon DNA był dostarczany w formie jednoniciowej13. Nowe białka, które zostały zidentyfikowane, były dodawane pojedynczo lub w kombinacji, aby przetestować ich wpływ na aktywność katalityczną polimerazy DNA. Dalsze postępy w zrozumieniu replikacji zależały następnie od stworzenia bardziej złożonych systemów in vitro, w których, poprzez dodanie większego zestawu oczyszczonych białek, dwuniciowy DNA mógł być ostatecznie replikowany14,15.
Dzisiaj prawie każdy proces wewnątrz komórek – od replikacji DNA i rekombinacji do transportu pęcherzyków błonowych – jest badany w systemie in vitro zrekonstruowanym z oczyszczonych składników. Systemy takie, choć pracochłonne w budowie, umożliwiają precyzyjną kontrolę zarówno stężenia, jak i szczegółowej struktury każdego składnika. Ponadto, „szum” w naturalnym systemie spowodowany reakcjami ubocznymi – ponieważ większość cząsteczek w komórce jest zaangażowana w więcej niż jeden rodzaj reakcji – jest unikany poprzez eliminację białek, które katalizują te inne reakcje. W istocie, niewielka część komórki może być odtworzona jako ograniczony zbiór reakcji chemicznych, co czyni ją w pełni podatną na precyzyjne badania przy użyciu wszystkich narzędzi fizyki i chemii.
Do 1980 roku wielobiałkowe systemy in vitro umożliwiły szczegółową charakterystykę maszynerii replikacyjnej i rozwiązały problem, w jaki sposób DNA jest syntetyzowane po obu stronach widełek replikacyjnych (Rys. 1b). Jedna nić DNA jest syntetyzowana w sposób ciągły przez cząsteczkę polimerazy DNA poruszającą się wzdłuż „nici wiodącej”, podczas gdy druga cząsteczka polimerazy DNA na „nici opóźniającej” wytwarza długą serię fragmentów (zwanych fragmentami Okazaki)16 , które są łączone razem przez enzym ligazę DNA w celu wytworzenia ciągłej nici DNA. Jak można się było spodziewać, istnieje różnica w białkach wymaganych do syntezy wiodącej i opóźnionej nici DNA (patrz ramka 1). Co niezwykłe, można wykazać, że widełki replikacyjne utworzone w tych sztucznych systemach poruszają się z taką samą szybkością jak widełki wewnątrz komórek (500 do 1000 nukleotydów na sekundę), a szablon DNA był kopiowany z niewiarygodnie wysoką wiernością15.
W miarę jak odkrywano coraz więcej białek funkcjonujących w widełkach replikacyjnych, można było dokonywać porównań między mechanizmami replikacyjnymi różnych organizmów. Badania mechanizmów replikacyjnych u wirusów, bakterii i eukariontów ujawniły, że wspólny zestaw aktywności białek napędza widełki replikacyjne w każdym organizmie (Ramka 1). Każdy system składa się z: cząsteczki polimerazy DNA o wiodącej i opóźnionej nici; primazy DNA wytwarzającej primery RNA, które rozpoczynają każdy fragment Okazaki; białek wiążących jednoniciowy DNA, które pokrywają szablon DNA i utrzymują go we właściwym położeniu; helikazy DNA, która odwija podwójną helisę; oraz dodatkowych białek pomocniczych polimerazy, które wiążą polimerazy ze sobą i z szablonem DNA. W miarę przechodzenia od prostego wirusa do bardziej złożonych organizmów, takich jak drożdże czy ssaki, liczba podjednostek tworzących każdy rodzaj aktywności białkowej ma tendencję do zwiększania się. Na przykład, całkowita liczba podjednostek polipeptydowych, które tworzą rdzeń aparatu replikacyjnego, wzrasta z czterech i siedmiu w bakteriofagach T7 i T4, odpowiednio, do 13 w bakterii E. coli. A u drożdży Saccharomyces cerevisiae i u ssaków zwiększa się do co najmniej 27. Tak więc, w miarę jak organizmy o większych genomach ewoluowały, maszyneria replikacyjna dodawała nowe podjednostki białkowe, bez żadnych zmian w podstawowych mechanizmach15,18,19,20.
Podczas gdy opisywane przeze mnie prace nad replikacją DNA posuwały się naprzód, inne grupy badaczy tworzyły systemy in vitro, w których można było odtworzyć rekombinację homologiczną DNA. Głównym graczem w tych reakcjach było białko typu RecA17, nazwane tak od bakteryjnego mutanta defektywnego w rekombinacji, który doprowadził do jego odkrycia (Ramka 2).
Maszyny białkowe
Podobnie jak w przypadku wszystkich innych aspektów biochemii komórki, aparat replikacji DNA ewoluował przez miliardy lat metodą „prób i błędów” – to znaczy przez przypadkowe zmiany, po których następowała selekcja naturalna. Z czasem jedno białko po drugim mogło być dodawane do mieszanki białek aktywnych na widełkach replikacyjnych, przypuszczalnie dlatego, że nowe białko zwiększało szybkość, kontrolę lub dokładność całego procesu replikacji. Ponadto, struktura każdego białka była dostrajana przez mutacje, które zmieniały jego sekwencję aminokwasów, tak aby zwiększyć jego efektywność. Efektem końcowym tego niezwykłego procesu inżynieryjnego są systemy replikacyjne, które obserwujemy dziś u różnych organizmów. Można by się zatem spodziewać, że mechanizm replikacji DNA jest w dużym stopniu zależny od przypadkowych zdarzeń z przeszłości. Ale czy ewolucja wybrała to, co działa, bez potrzeby elegancji?
Przez pierwsze 30 lat po odkryciu Watsona i Cricka większość badaczy zdawała się utrzymywać pogląd, że procesy komórkowe mogą być niechlujne. Pogląd ten był wspierany przez wiedzę o ogromnej szybkości ruchów na poziomie molekularnym (na przykład, wiadomo było, że typowe białko zderza się z drugą cząsteczką obecną w stężeniu 1 mM około 106 razy na sekundę). Szybkie tempo ruchu molekularnego początkowo sądzono, że pozwala na proces taki jak replikacja DNA, aby wystąpić bez żadnej organizacji białek zaangażowanych w przestrzeni trójwymiarowej.
Całkiem przeciwnie, biolodzy molekularni teraz rozpoznać, że ewolucja wybrała dla wysoce uporządkowanych systemów. Tak więc, na przykład, nie tylko części maszynerii replikacyjnej są utrzymywane razem w precyzyjnym ustawieniu, aby zoptymalizować ich wzajemne interakcje, ale napędzane energią zmiany w konformacjach białek są wykorzystywane do generowania skoordynowanych ruchów. Zapewnia to, że każdy z kolejnych etapów złożonego procesu, jakim jest replikacja DNA, jest ściśle skoordynowany z następnym. W rezultacie powstaje zespół, który może być postrzegany jako „maszyna białkowa”. Na przykład, cząsteczka polimerazy DNA po stronie opóźniającej widełek replikacyjnych pozostaje związana z cząsteczką polimerazy DNA pasma wiodącego, aby zapewnić, że ta sama polimeraza pasma opóźniającego jest używana w kółko do wydajnej syntezy fragmentów Okazaki18,20,21 (Ramka 1). A replikacja DNA nie jest bynajmniej wyjątkowa. Obecnie uważamy, że prawie każdy proces biologiczny jest katalizowany przez zestaw dziesięciu lub więcej przestrzennie umieszczonych, współdziałających białek, które przechodzą wysoce uporządkowane ruchy w zespole przypominającym maszynę22.
Maszyny białkowe generalnie tworzą się w określonych miejscach w odpowiedzi na określone sygnały, a to jest szczególnie prawdziwe w przypadku maszyn białkowych, które działają na DNA. Replikacja, naprawa i rekombinacja podwójnej helisy DNA są często uważane za oddzielne, odizolowane procesy. Jednak wewnątrz komórki ta sama cząsteczka DNA jest w stanie poddać się każdej z tych reakcji. Co więcej, występują specyficzne kombinacje tych trzech typów reakcji. Na przykład, rekombinacja DNA jest często bezpośrednio powiązana z replikacją DNA lub naprawą DNA23. Aby integralność chromosomu była właściwie zachowana, każda specyficzna reakcja musi być starannie kierowana i kontrolowana. Wymaga to, aby zestawy białek były montowane na DNA i aktywowane tylko tam, gdzie i kiedy są potrzebne. Chociaż wiele jeszcze trzeba się dowiedzieć o tym, jak dokonuje się tych wyborów, wydaje się, że różne typy struktur DNA są rozpoznawane przez wyspecjalizowane białka, które służą jako „czynniki montażowe”. Każdy czynnik montażowy następnie służy do nukleacji współpracy montaż zestawu białek, które tworzą konkretną maszynę białkową, jak potrzebne do katalizowania reakcji odpowiedniej do tego czasu i miejsca w komórce.
Widok na przyszłość
Stało się zwyczajem, zarówno w podręcznikach i w regularnej literaturze naukowej, aby wyjaśnić mechanizmy molekularne poprzez proste dwuwymiarowe rysunki lub „kreskówki”. Takie rysunki są przydatne do konsolidacji dużych ilości danych w prosty schemat, jak zilustrowano w tym przeglądzie. Ale całe pokolenie biologów może stać się lulled do wierząc, że istota mechanizmu biologicznego został uchwycony, a cały problem dlatego rozwiązany, gdy badacz rozszyfrował wystarczająco dużo z zagadki, aby być w stanie narysować znaczące cartoon.
W ciągu ostatnich kilku lat, stało się zupełnie jasne, że znacznie więcej będzie wymagać od naukowców, zanim będziemy mogli twierdzić, aby w pełni zrozumieć proces, taki jak replikacja DNA lub rekombinacji DNA. Ostatnie projekty sekwencjonowania genomu, mapowanie interakcji białek i badania sygnalizacji komórkowej ujawniły o wiele więcej składników i interakcji molekularnych niż wcześniej zdawano sobie sprawę. Na przykład, zgodnie z jedną z ostatnich analiz, S. cerevisiae, jednokomórkowy „prosty” organizm eukariotyczny (który ma około 6000 genów w porównaniu z 30 000 u ludzi), wykorzystuje 88 genów do replikacji DNA i 49 genów do rekombinacji DNA24.
Aby skupić się na replikacji DNA, pełne zrozumienie mechanizmu będzie wymagało powrotu do miejsca, w którym po raz pierwszy rozpoczęto badania DNA – w sferze chemii i fizyki. Potrzebne będą szczegółowe struktury atomowe wszystkich istotnych białek i kwasów nukleinowych, a spektakularny postęp w tym zakresie czynią biolodzy strukturalni dzięki coraz potężniejszym technikom krystalografii rentgenowskiej i magnetycznego rezonansu jądrowego. Jednak zdolność do rekonstrukcji procesów biologicznych w probówce przy użyciu cząsteczek, których dokładne struktury są znane, nie wystarczy. Proces replikacji jest zarówno bardzo szybki, jak i niewiarygodnie dokładny, osiągając ostateczny poziom błędu na poziomie około jednego nukleotydu na miliard. Zrozumienie, w jaki sposób reakcje pomiędzy wieloma różnymi białkami i innymi cząsteczkami są skoordynowane, aby stworzyć ten wynik, będzie wymagało od eksperymentatorów określenia wszystkich stałych szybkości interakcji pomiędzy różnymi składnikami, co jest obecnie rzadko wykonywane przez biologów molekularnych. Następnie mogą oni wykorzystać techniki inżynierii genetycznej do zmiany wybranych zestawów tych parametrów, starannie monitorując wpływ tych zmian na proces replikacji.
Naukowcy będą mogli twierdzić, że naprawdę rozumieją złożony proces, taki jak replikacja DNA, tylko wtedy, gdy będą mogli dokładnie przewidzieć wpływ zmian w każdej z różnych stałych szybkości na ogólną reakcję. Ponieważ zakres eksperymentalnych manipulacji jest ogromny, będziemy potrzebowali bardziej wydajnych sposobów decydowania o tym, które z tych zmian są najbardziej prawdopodobne, aby zwiększyć nasze zrozumienie. Nowe podejścia z szybko rozwijającej się dziedziny biologii obliczeniowej muszą być zatem rozwijane – zarówno do kierowania eksperymentami, jak i do interpretacji wyników.
Model Watsona-Cricka DNA katalizował dramatyczny postęp w naszym molekularnym zrozumieniu biologii. Jednocześnie, jego ogromny sukces dał początek mylnemu poglądowi, że wiele innych złożonych aspektów biologii może być podobnie zredukowanych do eleganckiej prostoty poprzez wnikliwą analizę teoretyczną i budowanie modeli. Pogląd ten został wyparty w ciągu kolejnych dekad, ponieważ większość podsystemów biologicznych okazała się zbyt złożona, by można było przewidzieć ich szczegóły. Wiemy już, że nic nie zastąpi rygorystycznych analiz eksperymentalnych. Jednak sama tradycyjna biologia molekularna i komórkowa nie jest w stanie zamknąć takiego problemu jak replikacja DNA. Nowe rodzaje podejść będą wymagane, obejmujące nie tylko nowe narzędzia obliczeniowe, ale także większą integrację chemii i fizyki20,25. Z tego powodu musimy pilnie ponownie przemyśleć edukację, którą zapewniamy następnemu pokoleniu naukowców biologicznych22,26.