“Though facts are inherentously less satisfying than intellectual conclusions drawn from them, but their importance should never be questioned.” (事実とは、本質的に、そこから導き出される知的結論よりも満足度の低いものであるが、その重要性は決して疑ってはならない。 James D. Watson, 2002.
DNA は生命の遺伝情報のすべてを担っている。 非常に長い1本のDNA分子が、生物の各染色体を形成し、ヒトでは23本となる。 生命の基本単位は単一細胞である。 1つの細胞は、細胞分裂と呼ばれるプロセスを連続的に繰り返すことによって、さらに多くの細胞を生み出す。 細胞分裂の前には、細胞を形成する多くの分子のそれぞれについて、新しいコピーが作られなければならないが、その中にはすべてのDNA分子の複製も含まれる。 DNAの複製は、この複製プロセスの名称であり、これにより生物の遺伝情報、すなわち遺伝子が、細胞が分裂する際に生じる2つの娘細胞に受け継がれるのである。 生命にとって重要度がやや劣るのは、相同DNA組み換えと呼ばれる、染色体上の遺伝子を入れ替えるダイナミックなDNAアクロバット飛行を必要とするプロセスである。 DNA複製と密接に関連した反応において、組み換え機構はまた、細胞内の長く壊れやすいDNA分子に不可避的に生じる損傷を修復します(本号のフリードバーグの記事、436ページ参照)。
ジェームズ・ワトソンとフランシス・クリックが提案したDNA二重らせん1モデルは、塩基配列において相補的である2対のDNA鎖に基づくものです。 このモデルは、DNA複製やDNA組換えのプロセスにとって重要な意味を持ちました。 1953年以前は、この2つの中心的な遺伝学的プロセスの分子メカニズムについて、推測することさえ無意味でした。 しかし、DNAの一方の鎖の各ヌクレオチドは、反対側の鎖の相補的なヌクレオチド(アデニン(A)とチミン(T)、またはグアニン(G)とシトシン(C))としっかりと塩基対になっているという提案は、塩基配列のどの部分も、もう一方の鎖の対応する部分の直接的テンプレートとして働くことを意味していた。 その結果、配列のどの部分でも、そのパートナーのヌクレオチド配列を作成するため、あるいは認識するために使用することができ、この2つの機能はそれぞれ、DNA 複製と DNA 組換えの中心となっています。 また、複雑な生体分子とその相互作用に対する理解が年々深まるにつれ、生物学者の生命の化学に対する見方にも大きな変化があったことを強調する。
DNAの構造的特徴
二重らせんの発見直後の研究では、主に分子の構造的特性を理解することに焦点が当てられていた。 DNA は遺伝子転写のプロセスを通じて RNA を特定し、RNA 分子は次に細胞のすべてのタンパク質を特定します。 これが、遺伝情報伝達の「セントラルドグマ」である2。 遺伝情報を読み出すには、それがDNA複製であれ遺伝子転写であれ、二重らせんの内部に埋まっている塩基の配列にアクセスすることが必要である。 そのため、DNAの機能発現には、DNA鎖の分離が不可欠である。
物理化学者は、DNA の溶液を沸騰に近い温度 (100 ℃) に加熱したり、極端な pH にすると、鎖が分離することを発見し、これは「DNA 変性」と呼ばれる変化であることがわかりました。 これは、ワトソンとクリックが予測したG-C塩基対は3つの水素結合で結合しているのに対し、A-T塩基対はわずか2つしか結合していないためである。 生理的な塩濃度では、哺乳類DNAのTmはほぼ90℃であり、これはその塩基対の特殊な組み合わせ(47%がG-C、53%がA-T)によるものである3。 DNA分子の複雑な混合物の中で、このような偉業を成し遂げるには、他の配列とランダムに衝突しながら、数百万の配列の中から一致するものを見つけ出し、新しいパートナー鎖で素早く巻き戻す必要があります。 DNAリナチュレーション」と呼ばれるこの予想外の現象4が劇的に発見されたことで、DNA組み換えによる配列の再配列の仕組みが明らかになった。 また、この発見は、実験室でDNAを操作するための重要な手段にもなった。 相補的なヌクレオチド配列のアニーリングは、ハイブリダイゼーションと呼ばれるプロセスで、バイオテクノロジー産業や現代のゲノム科学の発展に貢献したいくつかのDNA技術の基礎を形成している。 細長い分子はせん断による破壊に非常に敏感であり、哺乳類の染色体が単一のDNA分子しか含まないとは考えにくかったのです。 そのため、典型的な染色体は1億以上のヌクレオチド対からなる連続したDNAらせんから形成される必要がある。この分子は1000億ダルトン以上あり、端から端までの距離が3センチ以上ある巨大な分子である。 このような巨大な分子を、直径わずか数ミクロンの細胞の中で不慮の破損から守り、しかも遺伝子の読み出しやその他の遺伝的機能を効率よく発揮できるように組織化するには、どうしたらよいのでしょうか。
生物学の世界以外で、このような巨大分子の前例はありませんでした。 しかし1960年代初頭、オートラジオグラフィーの研究により、大腸菌の染色体が実際には300万塩基対以上の長さを持つ1つのDNA分子であることが明らかになった5。 その10年以上後、革新的な物理学的手法により、1本の巨大なDNA分子が哺乳類の各染色体の基礎となっていることが証明されたとき6、この結果は科学者たちにほとんど驚きをもって迎え入れられたのです。 1953年にワトソンとクリックによって提案されたDNA複製の鋳型モデル(参考文献7)は、1950年代後半に2つの発見があった後、普遍的に受け入れられるようになりました。 ひとつは、密度標識したバクテリアのDNAを用いた巧妙な実験で、予測された鋳型-反鋳型方式が確認されたことです8。 もうひとつは、DNAポリメラーゼという酵素の発見である。この酵素は、DNAの1本の鎖を鋳型として、相補的な新しい鎖を合成する9。 dATP、dTTP、dGTP、dCTPの4つのデオキシリボヌクレオシド三リン酸が、新しい娘DNA鎖の前駆体であり、それぞれのヌクレオチドは、親テンプレート鎖上の相補的ヌクレオチド(それぞれT、A、C、G)と対になって選択されている。 DNAポリメラーゼは、これらの三リン酸を使用して、新しく合成されたDNA分子の3末端に一度に1つずつヌクレオチドを付加し、それによってDNA鎖の成長を5′から3′の化学方向に触媒することが示された。
一本鎖の鋳型に短いDNA配列を合成することは試験管で実証できましたが、巨大でねじれた二本鎖のDNA分子がどのように複製されるかは謎でした。 細胞内では、DNAの複製は「複製フォーク」と呼ばれるY字型の構造で行われることが確認されています。このフォークは、親となるDNAらせんに沿って着実に動き、その後ろに2本の娘DNAらせん(「Y」の両腕部分)を紡ぎ出します5。 ワトソンとクリックが予言したように、二重らせんの2本の鎖は化学的に逆方向を向いている。 したがって、複製分枝が動くと、DNAポリメラーゼはYの片方の腕、つまり新しい娘鎖が5′から3′の化学方向に伸長している腕に沿ってのみ連続的に動くことができるのです。 もう一方の腕では、新しい娘鎖は、逆の3′から5′の化学的方向で生成される必要があります(図1a)。 ワトソンとクリックの中心的な予測は、彼らの画期的な発見後の最初の 10 年間の研究の終わりに確認されましたが、DNA 複製のプロセスの詳細は謎のままでした。
複製の再構築
この謎は次の20年間で、DNA複製プロセスの中心人物を構成するタンパク質が特定された時期に解決されました。 科学者たちはさまざまな実験的アプローチを用いて、DNA 複製に不可欠と思われる遺伝子産物のセットをどんどん特定していったのです。 例えば、DNA複製に欠陥のある突然変異体が同定され、遺伝学的手法により、複製プロセスに必要な特定の遺伝子セットを特定することができた10,11,12。 これらの遺伝子によって特定されるタンパク質の助けを借りて、「無細胞」システムが確立され、精製された成分を用いてin vitroでそのプロセスが再現されるようになった。 当初は、完全な複製プロセスに必要なタンパク質装置の一部のみが存在し、DNAテンプレートが一本鎖で提供される「部分的複製反応」でタンパク質がテストされた13。 同定された新しいタンパク質は、1つずつ、あるいは組み合わせて加えられ、DNAポリメラーゼの触媒活性に及ぼす影響がテストされた。 その後、複製の理解におけるさらなる進歩は、より複雑な試験管内システムの構築にかかっており、より多くの精製タンパク質を加えることによって、最終的には二本鎖 DNA を複製することができるようになりました14,15。 このようなシステムは、構築には手間がかかるが、各成分の濃度と詳細な構造の両方を正確に制御することが可能である。 さらに、細胞内のほとんどの分子は2種類以上の反応に関与しているため、副反応によって自然のシステムに生じる「ノイズ」を、これらの副反応を触媒するタンパク質を排除することで回避することができる。 1980 年までに、多タンパク質の試験管内システムによって、複製装置の詳細な特性評価が可能になり、複製分枝の両側で DNA がどのように合成されるかという問題が解決されました (図 1b)。 娘DNA鎖は、「先行鎖」に沿って動くDNAポリメラーゼ分子によって連続的に合成され、「遅行鎖」にある2番目のDNAポリメラーゼ分子は、長い一連の断片(岡崎フラグメントと呼ばれる)16を生成し、それが酵素DNAリガーゼによって結合されて連続したDNA鎖が作られるのです。 予想されるように、先行鎖と遅行鎖のDNA合成に必要なタンパク質には違いがある(囲み記事1参照)。 驚くべきことに、これらの人工的なシステムで形成された複製フォークは、細胞内のフォークと同じ高速で動き(1秒間に500から1000ヌクレオチド)、DNAテンプレートは信じられないほど高い忠実度でコピーされた15。 ウイルス、細菌、真核生物の複製機構を研究した結果、各生物において共通のタンパク質活性セットが複製フォークを駆動していることが明らかになった(囲み記事1)。 それぞれのシステムは、鎖の先端と後端にあるDNAポリメラーゼ分子、岡崎フラグメントを開始するRNAプライマーを生成するDNAプライマーゼ、鋳型DNAを覆って所定の位置に固定する一本鎖DNA結合タンパク質、二重らせんをほどくDNAヘリカーゼ、ポリメラーゼ同士およびDNA鋳型と結合する追加のポリメラーゼ付属タンパク質から構成されている。 単純なウイルスから酵母や哺乳類のようなより複雑な生物になるにつれて、それぞれのタイプのタンパク質活性を構成するサブユニットの数は増加する傾向にある。 例えば、複製装置の中核をなすポリペプチドサブユニットの総数は、バクテリオファージT7とT4ではそれぞれ4個と7個だったのが、細菌である大腸菌では13個にまで増えている。 そして、酵母のSaccharomyces cerevisiaeや哺乳類では、少なくとも27個に拡大する。 このように、より大きなゲノムをもつ生物が進化するにつれて、複製機構は、基本的なメカニズムに何の変化もなく、新しいタンパク質サブユニットを追加していきました15,18,19,20。
私がDNA複製について述べた研究が進んでいる間、他の研究グループは、相同DNA組換えが再構築できるin vitroシステムを確立しつつありました。 これらの反応の中心的な役割を果たしたのは、RecAという種類のタンパク質で17、その発見のきっかけとなった組み換えに欠陥のあるバクテリアの突然変異体にちなんで名づけられました(囲み記事2)。
タンパク質機械
細胞生化学の他のすべての側面と同様に、DNA複製装置は何十億年にもわたって「試行錯誤」、すなわちランダムな変異に続く自然選択により進化してきました。 おそらく、その新しいタンパク質が複製プロセス全体の速度、制御、精度を向上させるためと思われます。 さらに、各タンパク質の構造は、アミノ酸配列の変異によって微調整され、その効果を高めていった。 このような特殊な工学的プロセスの結果、今日、私たちがさまざまな生物で観察することができる複製システムができあがったのである。 したがって、DNA複製の仕組みは、過去のランダムな出来事に大きく依存することが予想されます。 ワトソンとクリックの発見から30年間は、ほとんどの研究者が、細胞のプロセスは杜撰であってもよいという考えを持っていたようです。 この見解は、分子レベルの動きの驚異的な速さについての知識によって後押しされた(例えば、典型的なタンパク質は、1mMの濃度で存在する第2の分子と1秒間に約106回衝突することが知られていた)。 分子運動の速度が速いため、当初は、DNA複製のようなプロセスが、関与するタンパク質の三次元空間での組織化がなくても起こると考えられていました。
これとはまったく逆に、分子生物学者は現在、進化によって高度に秩序だったシステムが選択されていることを認識しています。 したがって、たとえば、複製装置の各部分は、相互の相互作用を最適化するために正確な配列で一緒に保持されているだけでなく、タンパク質の立体構造のエネルギー駆動型変化を利用して、協調的な動きを生成しているのである。 これにより、DNA複製のような複雑なプロセスにおける連続した各ステップが、次のステップと密接に連携していることが保証される。 その結果、「タンパク質マシン」ともいうべき集合体ができあがるのです。 例えば、複製フォークの遅れ側のDNAポリメラーゼ分子は、リード鎖のDNAポリメラーゼ分子と結合したまま、同じ遅れ側のポリメラーゼが何度も使われて岡崎フラグメントが効率よく合成されるようになっている18、20、21(ボックス1)。 また、DNA複製は決して特殊なものではない。 現在では、ほとんどすべての生物学的プロセスは、空間的に配置され、相互作用する10個以上のタンパク質が、機械のように組み立てられた高度に秩序だった動きをすることによって触媒されると考えられている22。 DNA二重らせんの複製、修復、組換えは、しばしば分離した独立したプロセスとして考えられている。 しかし、細胞内では、同じDNA分子がこれらの反応のいずれかを起こすことができるのです。 さらに、この3種類の反応は特定の組み合わせで起こります。 例えば、DNAの組換えは、しばしばDNAの複製やDNAの修復に直接的に関連しています23。 染色体の完全性を維持するためには、それぞれの反応を注意深く指示し、制御しなければならない。 そのためには、一連のタンパク質がDNA上に集められ、必要なときに必要な場所でだけ活性化されることが必要です。 このような選択がどのようになされるのかについては、まだ多くのことが解明されていませんが、異なるタイプのDNA構造は、「組み立て因子」として機能する特殊なタンパク質によって明示的に認識されるようです。 各組み立て因子は、次に、細胞内のその時、その場所に適した反応を触媒するために必要な、特定のタンパク質機械を形成する一連のタンパク質の協調的な組み立ての核となる役割を果たします。 このような絵は、この総説に示されているように、大量のデータを単純な図式にまとめるのに便利である。 しかし、生物学者の全世代は、研究者がこの種の意味のある漫画を描けるほどパズルを解読すれば、生物学的メカニズムの本質が捉えられ、したがって問題全体が解決されたと信じるようになったのかもしれません。 最近のゲノム解読プロジェクト、タンパク質相互作用のマッピング作業、細胞シグナル伝達の研究により、以前には考えられなかったほど多くの構成要素や分子間相互作用が明らかになってきました。 たとえば、最近のある分析によると、単細胞の「単純な」真核生物である S. cerevisiae(ヒトの 3 万の遺伝子に対し、約6000の遺伝子を持つ)は、DNA 複製に 88 の遺伝子、DNA 組み換えには 49 の遺伝子を使用しています24 。 関連するすべてのタンパク質と核酸の詳細な原子構造が必要であり、X線結晶学と核磁気共鳴の技術がますます強力になったおかげで、構造生物学者による目覚ましい進歩が見られます。 しかし、正確な構造が分かっている分子を用いて、試験管の中で生物学的プロセスを再構築する能力だけでは十分とは言えません。 複製プロセスは非常に速く、かつ非常に正確で、最終的な誤差は10億分の1ヌクレオチド程度である。 このような結果を生み出すために、多種多様なタンパク質やその他の分子間の反応がどのように調整されているのかを理解するには、実験者が様々な構成要素間の相互作用の速度定数をすべて決定することが必要です。
科学者は、さまざまな速度定数の変化が反応全体に及ぼす影響を正確に予測できるようになって初めて、DNA複製のような複雑なプロセスを本当に理解していると主張することができるようになるのです。 実験操作の範囲は膨大であるため、どのような変化が我々の理解を深める可能性が最も高いかを判断する、より強力な方法が必要になるであろう。 したがって、急速に発展している計算生物学の分野から、実験を導き、結果を解釈するための新しいアプローチを開発しなければなりません。 同時に、その大成功は、生物学の他の多くの複雑な側面も、洞察に満ちた理論的解析とモデル構築によって、同じように優雅な単純さに還元できるかもしれないという誤解を生じさせることになった。 というのも、ほとんどの生物学的サブシステムは、その詳細を予測するにはあまりに複雑であることが判明したからです。 現在では、厳密な実験解析に代わるものは何もない、ということが分かっています。 しかし、従来の分子生物学や細胞生物学だけでは、DNA複製のような問題を解決することはできません。 新しい計算ツールだけでなく、化学と物理の融合による新しいタイプのアプローチが必要なのだ20,25。 このため、次世代の生物科学者に提供する教育を見直すことが急務となっている22,26。