Replicação e recombinação de DNA

“Embora os fatos sejam inerentemente menos satisfatórios do que as conclusões intelectuais extraídas deles, sua importância nunca deve ser questionada”. James D. Watson, 2002.

DNA transporta toda a informação genética para a vida. Uma molécula de DNA enormemente longa forma cada um dos cromossomos de um organismo, 23 deles em um humano. A unidade viva fundamental é a única célula. Uma célula dá origem a muito mais células através de repetições em série de um processo conhecido como divisão celular. Antes de cada divisão, novas cópias devem ser feitas de cada uma das muitas moléculas que formam a célula, incluindo a duplicação de todas as moléculas de DNA. Replicação de DNA é o nome dado a este processo de duplicação, que permite que a informação genética de um organismo – seus genes – seja passada para as duas células filhas criadas quando uma célula se divide. Apenas ligeiramente menos central à vida é um processo que requer acrobacias dinâmicas de DNA, chamadas de recombinação de DNA homólogo, que reordenam os genes nos cromossomos. Em reações intimamente ligadas à replicação de DNA, o mecanismo de recombinação também repara danos que inevitavelmente ocorrem às moléculas longas e frágeis de DNA dentro das células (ver artigo nesta edição de Friedberg, página 436).

O modelo para a dupla hélice1 de DNA proposto por James Watson e Francis Crick é baseado em duas cadeias de DNA emparelhadas que são complementares em sua seqüência nucleotídica. O modelo teve implicações marcantes para os processos de replicação e recombinação do DNA. Antes de 1953, não havia sequer uma forma significativa de especular sobre os mecanismos moleculares destes dois processos genéticos centrais. Mas a proposta de que cada nucleotídeo de uma cadeia de DNA era fortemente baseado com seu nucleotídeo complementar na cadeia oposta – adenina (A) com timina (T), ou guanina (G) com citosina (C) – significava que qualquer parte da seqüência nucleotídica poderia atuar como modelo direto para a porção correspondente da outra cadeia. Como resultado, qualquer parte da sequência pode ser usada para criar ou reconhecer sua sequência de nucleotídeos parceiros – as duas funções que são centrais para a replicação e recombinação do DNA, respectivamente.

Nesta revisão, discuto como a descoberta da estrutura do DNA há meio século abriu novos caminhos para a compreensão dos processos de replicação e recombinação do DNA. Também enfatizarei como, à medida que nossa compreensão das moléculas biológicas complexas e suas interações aumentou ao longo dos anos, houve profundas mudanças na forma como os biólogos vêem a química da vida.

Características estruturais do DNA

A pesquisa que se seguiu imediatamente à descoberta da dupla hélice concentrou-se principalmente na compreensão das propriedades estruturais da molécula. O DNA especifica o RNA através do processo de transcrição do gene, e as moléculas de RNA por sua vez especificam todas as proteínas de uma célula. Este é o ‘dogma central’ da transferência de informação genética2. Qualquer leitura de informação genética – seja durante a replicação do DNA ou transcrição do gene – requer acesso à seqüência das bases enterradas no interior da dupla hélice. A separação dos fios de ADN é, portanto, fundamental para a função do ADN. Assim, o modelo Watson-Crick levou os cientistas a uma busca por condições que interrompessem as ligações de hidrogênio que uniriam os pares de bases complementares, de modo a separar as duas vertentes da dupla hélice de DNA.

Quimistas físicos descobriram que aquecer uma solução de DNA a temperaturas próximas à ebulição (100 °C), ou submetê-la a extremos de pH, faria com que as vertentes se separassem – uma mudança chamada “desnaturação de DNA”. A chamada “temperatura de fusão” (ou Tm) de um trecho da seqüência de DNA depende de sua composição de nucleotídeos: aqueles DNAs com maior proporção de pares de bases G-C apresentam um Tm mais alto devido às três ligações de hidrogênio que Watson e Crick previram manter um par de bases G-C juntos, em comparação com apenas dois para o par de bases A-T. Em concentrações fisiológicas de sal, o Tm de DNA de mamíferos é quase 90 °C, devido à mistura particular dos seus pares de bases (47% G-C e 53% A-T)3.

Inicialmente parecia inconcebível que, uma vez separado do seu parceiro complementar, um fio de DNA pudesse reformar uma dupla hélice novamente. Em uma mistura complexa de moléculas de DNA, tal proeza exigiria encontrar a correspondência de uma sequência entre milhões durante colisões aleatórias com outras sequências e, em seguida, rebobinar rapidamente com uma nova cadeia de parceiros. A descoberta dramática deste fenómeno inesperado4 , chamado “renaturalização do ADN”, esclarece como as sequências podem ser reordenadas pela recombinação do ADN. E também forneceu um meio crítico através do qual o DNA poderia ser manipulado no laboratório. O recozimento de sequências nucleotídicas complementares, um processo chamado hibridação, forma a base de várias tecnologias de DNA que ajudaram a lançar a indústria biotecnológica e a genómica moderna. Estas incluem clonagem de genes, sequenciamento genômico e cópia do DNA pela reação em cadeia da polimerase (ver artigo de Hood e Galas na página 444).

A disposição das moléculas de DNA em cromossomos apresentou outro mistério para os cientistas: uma molécula longa e fina seria altamente sensível à quebra induzida pelo cisalhamento, e era difícil imaginar que um cromossomo de mamífero pudesse conter apenas uma única molécula de DNA. Isto exigiria que um cromossoma típico fosse formado a partir de uma hélice contínua de DNA com mais de 100 milhões de pares de nucleotídeos – uma molécula maciça pesando mais de 100 bilhões de daltons, com uma distância de ponta a ponta de mais de 3 cm. Como poderia tal molécula gigante ser protegida da fragmentação acidental em uma célula de apenas microns de diâmetro, mantendo-a organizada para uma leitura eficiente dos genes e outras funções genéticas?

Não havia precedente para tais moléculas gigantes fora do mundo da biologia. Mas no início dos anos 60, estudos autorradiográficos revelaram que o cromossoma da bactéria Escherichia coli era de fato uma única molécula de DNA, com mais de 3 milhões de pares de nucleotídeos em comprimento5. E quando – mais de uma década depois – técnicas físicas inovadoras demonstraram que uma única molécula enorme de DNA formou a base para cada cromossomo de mamífero6, o resultado foi bem recebido pelos cientistas com pouca surpresa.

Garfos de replicação de DNA

Como é que a molécula de DNA de cadeia dupla enormemente longa que forma um cromossomo copiado com precisão para produzir um segundo cromossomo idêntico cada vez que uma célula se divide? O modelo para replicação de DNA, proposto por Watson e Crick em 1953 (ref. 7), ganhou aceitação universal após duas descobertas no final da década de 1950. Uma delas foi um experimento elegante usando DNAs bacterianos marcados com densidade que confirmaram o esquema previsto de modelo-anti-template8. A outra foi a descoberta de uma enzima chamada DNA polimerase, que usa uma fita de DNA como modelo para sintetizar uma nova fita complementar9. Quatro deoxirribonucleósidos trifosfato nucleotídeos – dATP, dTTP, dGTP e dCTP – são os precursores de uma nova fita filha de DNA, cada nucleotídeo selecionado por emparelhar com seu nucleotídeo complementar (T, A, C ou G, respectivamente) na fita de modelo parental. Foi demonstrado que a DNA polimerase utiliza estes trifosfatos para adicionar nucleótidos um de cada vez ao final da molécula de ADN recentemente sintetizada em 3′, catalisando assim o crescimento da cadeia de ADN na direcção química 5′ a 3′.

Embora a síntese de pequenas extensões de sequência de ADN num modelo de cordão simples pudesse ser demonstrada num tubo de ensaio, como uma enorme molécula de ADN de cordão duplo retorcido é replicada era um puzzle. Dentro da célula, observou-se que a replicação de DNA ocorria numa estrutura em forma de Y, chamada de “garfo de replicação”, que se move firmemente ao longo de uma hélice de DNA parental, girando duas hélices de DNA filha atrás dela (os dois braços do “Y”)5. Como previsto por Watson e Crick, os dois fios da dupla hélice correm em direções químicas opostas. Portanto, como um garfo de replicação se move, a DNA polimerase pode se mover continuamente ao longo de apenas um braço do Y – o braço sobre o qual o novo cordão da filha está sendo alongado na direção química 5′ para 3′. No outro braço, o novo fio-filha teria de ser produzido no sentido oposto, 3′ a 5′ direcção química (Fig. 1a). Assim, enquanto as previsões centrais de Watson e Crick foram confirmadas no final da primeira década de pesquisa que se seguiu à sua descoberta histórica, os detalhes do processo de replicação de DNA permaneceram um mistério.

Figure 1: O garfo de replicação de DNA.

a, os trifosfatos de nucleósidos servem como substrato para a DNA polimerase, de acordo com o mecanismo mostrado no cordão superior. Cada trifosfato de nucleósido é composto por três fosfatos (aqui representados por esferas amarelas), um açúcar desoxirribose (rectângulo bege) e uma de quatro bases (cilindros de cor diferente). Os três fosfatos são ligados entre si por ligações de alta energia, e a clivagem destas ligações durante a reacção de polimerização liberta a energia livre necessária para impulsionar a incorporação de cada nucleótido na cadeia de ADN em crescimento. A reacção mostrada no cordão inferior, que causaria o crescimento da cadeia de ADN na direcção química 3′ a 5′, não ocorre na natureza. b, as DNA polimerases catalisam o crescimento da cadeia apenas na direcção química 5′ a 3′, mas ambos os novos cordões filhas crescem na bifurcação, pelo que um dilema dos anos 60 foi a forma como o cordão inferior neste diagrama foi sintetizado. A natureza assimétrica do garfo de replicação foi reconhecida no início dos anos 70: o ‘fio condutor’ cresce continuamente, enquanto que o ‘fio retardatário’ é sintetizado por uma DNA polimerase através do mecanismo de pesponto traseiro ilustrado. Assim, ambas as cordas são produzidas por síntese de DNA na direção 5′ a 3′. (Retirado da ref. 27, com permissão.)

Replicação reconstrutiva

O mistério foi resolvido ao longo das duas décadas seguintes, um período em que as proteínas que constituem os actores centrais no processo de replicação de ADN foram identificadas. Os cientistas usaram uma variedade de abordagens experimentais para identificar um conjunto sempre crescente de produtos genéticos considerados críticos para a replicação de DNA. Por exemplo, foram identificados organismos mutantes nos quais a replicação de DNA era defeituosa, e técnicas genéticas poderiam então ser usadas para identificar conjuntos específicos de genes necessários para o processo de replicação10,11,12. Com a ajuda das proteínas especificadas por esses genes, foram estabelecidos sistemas “livres de células”, onde o processo foi recriado in vitro usando componentes purificados. Inicialmente, as proteínas foram testadas numa “reacção de replicação parcial”, onde apenas um subconjunto da maquinaria proteica necessária para o processo completo de replicação estava presente, e o modelo de ADN era fornecido de uma só forma13. Novas proteínas que foram identificadas foram adicionadas uma de cada vez ou em combinação para testar seus efeitos sobre a atividade catalítica da DNA polimerase. Outros avanços na compreensão da replicação dependiam então da criação de sistemas in vitro mais complexos, nos quais, através da adição de um conjunto maior de proteínas purificadas, o DNA de cadeia dupla poderia eventualmente ser replicado14,15,

Hoje, quase todos os processos dentro das células – desde a replicação e recombinação do DNA até ao transporte da vesícula da membrana – estão a ser estudados num sistema in vitro reconstruído a partir de componentes purificados. Embora trabalhosos de estabelecer, tais sistemas permitem o controle preciso tanto da concentração como da estrutura detalhada de cada componente. Além disso, o “ruído” no sistema natural causado por reacções laterais – porque a maioria das moléculas de uma célula estão envolvidas em mais de um tipo de reacção – é evitado eliminando as proteínas que catalisam essas outras reacções. Em essência, uma pequena fração da célula pode ser recriada como um conjunto limitado de reações químicas, tornando-a totalmente passível de estudo preciso usando todas as ferramentas da física e da química.

Até 1980, os sistemas multiproteínas in vitro tinham permitido uma caracterização detalhada da máquina de replicação e resolvido o problema de como o DNA é sintetizado em ambos os lados do garfo de replicação (Fig. 1b). Uma fita de DNA filha é sintetizada continuamente por uma molécula de DNA polimerase que se move ao longo da ‘fita principal’, enquanto uma segunda molécula de DNA polimerase na ‘fita retardada’ produz uma longa série de fragmentos (chamados fragmentos de Okazaki)16 que são unidos pela enzima DNA ligase para produzir uma fita de DNA contínua. Como seria de esperar, há uma diferença nas proteínas necessárias para a síntese de DNA do fio de chumbo e do fio de retardamento (ver Quadro 1). Notavelmente, os garfos de replicação formados nestes sistemas artificiais puderam ser movimentados nas mesmas taxas rápidas que os garfos dentro das células (500 a 1.000 nucleotídeos por segundo), e o modelo de DNA foi copiado com uma fidelidade incrivelmente alta15,

Como mais e mais proteínas foram encontradas para funcionar no garfo de replicação, comparações poderiam ser feitas entre as máquinas de replicação de diferentes organismos. Estudos das máquinas de replicação em vírus, bactérias e eucariotas revelaram que um conjunto comum de atividades protéicas impulsiona os garfos de replicação em cada organismo (Caixa 1). Cada sistema consiste de: uma molécula de DNA polimerase de chumbo e uma molécula de DNA de cadeia retardada; um DNA primase para produzir os primers de RNA que iniciam cada fragmento de Okazaki; proteínas de cadeia única que ligam o DNA do modelo e o mantêm na posição; uma helicase de DNA que desenrola a dupla hélice; e proteínas acessórias adicionais de polimerase que ligam as polimerases umas às outras e ao modelo de DNA. medida que se passa de um vírus simples para organismos mais complexos, como leveduras ou mamíferos, o número de subunidades que compõem cada tipo de atividade protéica tende a aumentar. Por exemplo, o número total de subunidades de polipéptidos que formam o núcleo do aparelho de replicação aumenta de quatro e sete em bacteriófagos T7 e T4, respectivamente, para 13 na bactéria E. coli. E expande-se para pelo menos 27 na levedura Saccharomyces cerevisiae e em mamíferos. Assim, à medida que os organismos com genomas maiores evoluíram, os mecanismos de replicação acrescentaram novas subunidades protéicas, sem qualquer alteração nos mecanismos básicos15,18,19,20.

Apesar do avanço do trabalho que descrevi sobre a replicação de DNA, outros grupos de pesquisadores estavam estabelecendo sistemas in vitro nos quais a recombinação de DNA homólogo poderia ser reconstruída. O jogador central nestas reacções foi o tipo de proteína RecA17 , cujo nome deriva do mutante bacteriano defeituoso na recombinação que levou à sua descoberta (Caixa 2).

Máquinas de proteína

Como para todos os outros aspectos da bioquímica celular, o aparelho de replicação de DNA tem evoluído ao longo de bilhões de anos através de ‘tentativa e erro’ – ou seja, por variação aleatória seguida de seleção natural. Com o tempo, uma proteína após outra poderia ser adicionada à mistura de proteínas activas no garfo de replicação, presumivelmente porque a nova proteína aumentou a velocidade, controlo ou precisão do processo global de replicação. Além disso, a estrutura de cada proteína foi afinada por mutações que alteraram sua seqüência de aminoácidos de modo a aumentar sua eficácia. Os resultados finais deste processo de engenharia incomum são os sistemas de replicação que observamos hoje em dia em diferentes organismos. O mecanismo de replicação de DNA pode, portanto, ser altamente dependente de eventos passados aleatórios. Mas a evolução selecionou para o que quer que funcione, sem a necessidade de elegância?

Nos primeiros 30 anos após a descoberta de Watson e Crick, a maioria dos pesquisadores parecia ter a visão de que os processos celulares poderiam ser descuidados. Esta visão foi encorajada pelo conhecimento da tremenda velocidade de movimentos a nível molecular (por exemplo, sabia-se que uma proteína típica colide com uma segunda molécula presente a uma concentração de 1 mM cerca de 106 vezes por segundo). As rápidas taxas de movimento molecular foram pensadas inicialmente para permitir que um processo como a replicação de DNA ocorresse sem qualquer organização das proteínas envolvidas no espaço tridimensional.

Pelo contrário, os biólogos moleculares reconhecem agora que a evolução foi selecionada para sistemas altamente ordenados. Assim, por exemplo, não só as partes das máquinas de replicação são mantidas juntas em alinhamentos precisos para otimizar suas interações mútuas, mas também são usadas mudanças de conformação de proteínas impulsionadas pela energia para gerar movimentos coordenados. Isto assegura que cada uma das etapas sucessivas de um processo complexo como a replicação de DNA seja estreitamente coordenada com a próxima. O resultado é uma montagem que pode ser vista como uma ‘máquina de proteínas’. Por exemplo, a molécula de DNA polimerase no lado retardado do garfo de replicação permanece ligada à molécula de DNA polimerase de fio condutor para garantir que a mesma polimerase de fio condutor seja usada repetidamente para síntese eficiente de fragmentos de Okazaki18,20,21 (Caixa 1). E a replicação de DNA não é, de forma alguma, única. Agora acreditamos que quase todo processo biológico é catalisado por um conjunto de dez ou mais proteínas espacialmente posicionadas, interagindo proteínas que passam por movimentos altamente ordenados em um conjunto semelhante a uma máquina22,

Máquinas de proteína geralmente se formam em locais específicos em resposta a sinais particulares, e isto é particularmente verdadeiro para máquinas de proteína que atuam no DNA. A replicação, reparação e recombinação da dupla hélice do ADN são frequentemente consideradas como processos separados e isolados. Mas no interior da célula, a mesma molécula de DNA é capaz de sofrer qualquer uma destas reacções. Além disso, ocorrem combinações específicas dos três tipos de reacções. Por exemplo, a recombinação do ADN está frequentemente ligada directamente à replicação ou reparação do ADN23. Para que a integridade de um cromossoma seja devidamente mantida, cada reacção específica deve ser cuidadosamente dirigida e controlada. Isto requer que conjuntos de proteínas sejam montados no DNA e ativados apenas onde e quando forem necessários. Embora ainda haja muito a aprender sobre como essas escolhas são feitas, parece que diferentes tipos de estruturas de DNA são reconhecidas explicitamente por proteínas especializadas que servem como ‘fatores de montagem’. Cada fator de montagem serve então para nuclear uma montagem cooperativa do conjunto de proteínas que forma uma determinada máquina de proteínas, conforme necessário para catalisar uma reação apropriada àquele tempo e lugar na célula.

Uma visão do futuro

Tornou-se costume, tanto em livros didáticos como na literatura científica regular, explicar mecanismos moleculares através de desenhos bidimensionais simples ou ‘desenhos animados’. Tais desenhos são úteis para consolidar grandes quantidades de dados em um esquema simples, como ilustrado nesta revisão. Mas toda uma geração de biólogos pode ter se deixado levar a acreditar que a essência de um mecanismo biológico foi capturada e, portanto, todo o problema resolvido, uma vez que um pesquisador tenha decifrado o suficiente do quebra-cabeça para poder desenhar um desenho animado significativo desse tipo.

Nos últimos anos, ficou muito claro que muito mais será exigido dos cientistas antes que possamos afirmar que compreendemos plenamente um processo como a replicação de DNA ou a recombinação de DNA. Projetos recentes de seqüenciamento genômico, esforços de mapeamento de interação proteica e estudos de sinalização celular revelaram muito mais componentes e interações moleculares do que se realizava anteriormente. Por exemplo, de acordo com uma análise recente, S. cerevisiae, um organismo eucariótico ‘simples’ unicelular (que tem cerca de 6.000 genes contra 30.000 em humanos), usa 88 genes para sua replicação de DNA e 49 genes para sua recombinação de DNA24,

Para focar na replicação de DNA, o entendimento completo do mecanismo exigirá o retorno ao local onde os estudos de DNA começaram – nos domínios da química e da física. Serão necessárias estruturas atômicas detalhadas de todas as proteínas e ácidos nucléicos relevantes, e um progresso espetacular está sendo feito por biólogos estruturais, devido à cristalografia de raios X cada vez mais poderosa e às técnicas de ressonância magnética nuclear. Mas a capacidade de reconstruir processos biológicos em um tubo de ensaio com moléculas cujas estruturas precisas são conhecidas não é suficiente. O processo de replicação é muito rápido e incrivelmente preciso, alcançando uma taxa de erro final de cerca de um nucleotídeo em um bilhão. Entender como as reações entre as muitas proteínas diferentes e outras moléculas são coordenadas para criar este resultado vai exigir que os experimentalistas determinem todas as constantes de taxa para as interações entre os vários componentes, algo que raramente é feito por biólogos moleculares hoje em dia. Eles podem então usar técnicas de engenharia genética para alterar conjuntos selecionados desses parâmetros, monitorando cuidadosamente o efeito dessas mudanças no processo de replicação.

Os cientistas poderão afirmar que eles realmente entendem um processo complexo como a replicação de DNA somente quando eles podem prever com precisão o efeito das mudanças em cada uma das várias constantes de taxa sobre a reação geral. Porque a gama de manipulações experimentais é enorme, vamos precisar de formas mais poderosas de decidir quais são as alterações com maior probabilidade de aumentar a nossa compreensão. Novas abordagens do campo da biologia computacional em rápido desenvolvimento devem, portanto, ser desenvolvidas – tanto para orientar a experimentação quanto para interpretar os resultados.

O modelo de DNA Watson-Crick catalisou avanços dramáticos em nossa compreensão molecular da biologia. Ao mesmo tempo, seu enorme sucesso deu origem à visão enganosa de que muitos outros aspectos complexos da biologia poderiam ser reduzidos de forma similar à simplicidade elegante através de uma análise teórica perspicaz e da construção de modelos. Esta visão foi suplantada nas décadas seguintes, porque a maioria dos subsistemas biológicos revelaram-se demasiado complexos para que os seus detalhes pudessem ser previstos. Sabemos agora que nada pode substituir as análises experimentais rigorosas. Mas a biologia molecular e celular tradicional por si só não pode trazer um problema como a replicação de DNA para o fechamento. Novos tipos de abordagens serão necessários, envolvendo não apenas novas ferramentas computacionais, mas também uma maior integração da química e da física20,25. Por esta razão, precisamos repensar urgentemente a educação que estamos proporcionando à próxima geração de cientistas biológicos22,26,

.

Deixe uma resposta

O seu endereço de email não será publicado.