Genes - Inheritance

1. Genes e Cromossomos
O gene é a unidade fundamental de informação no ser vivo. O gene é composto de um segmento de DNA (ou RNA) que contem a informação necessária para produzir um produto com função biológica, geralmente um polipeptídeo ou RNA com função estrutural ou catalítica. Esta definição foi sugerida por Beadle e Tatum em 1940, ao observar que agentes que danificam DNA levavam a alterações de atividade enzimática, e depois refinada à medida que se expandiu o conhecimento sobre a estrutura de ácidos nucléicos e proteínas.

A descrição da estrutura do DNA feita por Watson e Crick em 1953 permitiu uma revolução na compreensão da sua função. Foram caracterizados a replicação, ou cópia do DNA para produzir duas moléculas com a mesma seqüência de nucelotídeos, a transcrição, ou o processo pelo qual partes do DNA são copiados em RNA e a tradução, em que a informação contida em um RNA mensageiro é utilizada para sintetizar polipeptídeos e proteínas com função biológica específica, de modo mediado por ribossomos.

Para compreender os mecanismos pelos quais é realizado o fluxo de informação genética de modo tão preciso como é necessário para a manutenção da vida, é preciso ter um bom entendimento da estrutura do DNA e do cromossomo, a estrutura formada pelo empacotamento do DNA. Este empacotamento do DNA é necessário pois o comprimento desenovelado do DNA é extremamente grande, e não caberia nas células que o contém. O cromossomo pode conter milhares de genes, além de DNA intergênico, completando centenas de milhares a milhões de pares de bases. DNA intergênico inclui seqüências com função regulatória, que identificam o começo e fim dos genes, influenciam a transcrição e servem de pontos de início de replicação e recombinação. O conjunto do DNA dos genes e intergênico de uma célula é denominado genoma.

Em bactérias, o DNA é circular (não possui terminações), os genes e porções regulatórias ocupam praticamente todo o DNA e há poucas duplicações. Uma exceção notável é a de genes que codificam pra rRNAs, que possuem várias repetições. Para codificar um polipetídeo de tamanho médio de 350 aminoácidos, o gene deve ter 3 x 350 = 1050 pares de bases transcritos e traduzidos, relação que em bactérias geralmente se mantém.

A estrutura do DNA de eucariotos é muito mais complexa. A maioria dos genes eucarióticos contém segmentos não codificantes, sendo assim não-colineares com o polipeptídeo que codificam. Há também em eucariotos freqüentes duplicações gênicas.

Aproximadamente 10% do DNA de camundongos é composto de seqüências altamente repetitivas (ou DNA satélite) compostas por poucos (<10) pares de bases repetidos milhões de vezes por célula. Há também seqüências moderadamente repetitivas, que possuem milhares de cópias e compreendem outros 20% do DNA murino. Parte destas seqüências repetitivas pode ter diversas funções, e não ser simplesmente junk DNA, como originalmente se imaginou.

Uma grande proporção das seqüências altamente repetitivas está associada ao centrômero e telômeros. O centrômero é uma seqüência de DNA que funciona como ponto de ancoragem para a divisão mitótica, permitindo uma distribuição ordenada dos cromossomos para as células filhas. Em S. cerevisiae, o centrômero possui 130 pares de bases e é rico em A=T. Em eucariotos, o centrômero é mais longo e rico em seqüências altamente repetitivas, repetidas milhares de vezes com a mesma orientação. Telômeros são seqüências localizadas nas pontas de cromossomos de eucariotos que ajudam a estabilizar sua estrutura. Em S. cerevisiae, possuem 100 pares de bases de seqüências repetidas da forma geral (5´)(TxGy)n (3´)(AxCy)n, onde x e y geralmente variam entre 1 e 4 e n varia entre 20 e 100. Em mamíferos, o número de repetições freqüentemente passa de 1500. As pontas do cromossomo não podem ser replicadas pela maquinaria comum de replicação do DNA, e contam com a participação da telomerase neste processo. A extensão dos telômeros está associada ao envelhecimento. Este é um dos motivos pelos quais bactérias, que possuem DNA circular sem telômeros, não apresentam sinais clássicos de envelhecimento.

A função de seqüências moderadamente repetitivas é menos conhecida. Estas seqüências podem estar associadas a elementos de transposição, ou ser pontos de reconhecimento de endonucleases.

Os 70% restantes do DNA têm poucas repetições e é onde se encontra a maioria dos genes. Como dito anteriormente, os genes de eucariotos contêm segmentos de DNA não-codificante, os íntrons, e segmentos codificantes, colineares com a seqüência polipeptídica que geram, os éxons. O tamanho, posição e fração que os íntrons ocupam no gene é muito variável, e eles chegam a preencher mais de metade do gene em alguns casos. As funções dos íntrons ainda permanecem a ser esclarecidas.

A estrutura do DNA varia bastante conforme o organismo. Vírus geralmente contém pouco material genético, que pode ser tanto DNA quanto RNA, porque utilizam vários recursos da célula hospedeira para se reproduzir. Em casos de vírus contendo RNA, seu genoma geralmente compreende alguns milhares de bases de RNA simples fita. Vírus DNA contém de alguns milhares a algumas centenas de milhares de bases, que podem se apresentar pareados ou não. O DNA viral pode ser circular durante partes do seu ciclo e desenvolver formas replicativas distintas dentro da célula hospedeira.

As bactérias possuem genomas muito mais complexos que os vírus, com milhões de pares de bases de DNA que, desenovelado, tem centenas de vezes o comprimento da célula. O nucleiode abriga o DNA cromossômico circular, e cada célula pode também conter moléculas menores de DNA circular no citosol, os plasmídeos, encontrados também em leveduras e outros fungos. Em muitos casos, os plasmídeos não tem função muito clara fora a auto-replicação, mas alguns plasmídeos carregam genes importantes como aqueles que conferem resistência a antibióticos. Plasmídeos podem ser transmitidos para células filhas da mesma espécie ou até para bactérias de outras espécies, contribuindo para o desenvolvimento de cepas resistentes a antibióticos. Porque podem ser facilmente isolados e re-incorporados em células, além de se reproduzir rapidamente, os plasmídeos se tornaram uma ferramenta extremamente útil para estudos envolvendo DNA recombinante.

Os eucariotos têm quantidades ainda maiores de DNA. Como exemplo, humanos e outros mamíferos têm 600 vezes mais DNA que E. coli, e muitas plantas e anfíbios tem quantidades ainda maiores que os mamíferos. Apesar da quantidade de DNA ser maior, por causa das seqüências não-codificantes, o DNA de eucariotos geralmente possui menos genes por milímetro de DNA.

O DNA de eucariotos é altamente compactado. Como exemplo, a extensão do DNA descompactado de cada célula humana é de cerca de 2 m, muito maior que a dimensão destas. No ser humano, este DNA está organizado em 46 cromossomos contendo DNA altamente enovelado. Cada cromossomo contém uma molécula de DNA dupla, e há variabilidade considerável entre os seus tamanhos. Cada cromossomo carrega um conjunto característico de genes.

Além do DNA nuclear, os eucariotos possuem uma pequena porção de seu DNA (< 0.1% em células somáticas) em mitocôndrias e cloroplastos. Em células humanas há em média 10 moléculas de DNA circular em cada mitocôndria com cerca de 20000 pares de bases cada. Esse DNA mitocondrial não é protegido por histonas, e é responsável pela codificação de 13 polipeptídeos componentes da cadeia respiratória, além de rRNAs e tRNAs. São conhecidos mais de 100 mutações no DNA mitocondrial de pacientes com diversos sintomas clínicos como na síndrome de Leber e encefalopatia mitocondrial associada à acidose lática (MELAS), entre outras. O DNA mitocondrial em plantas pode ser significativamente maior que o de animais, chegando a mais de 2 milhões de pares de bases. O DNA de cloroplastos, também circular, geralmente apresenta algumas centenas de pares de bases. Estudos evolutivos sugerem que o DNA mitocondrial e de cloroplastos é um vestígio de cromossomos de antigas bactérias que invadiram precursores dos atuais eucariotos, se tornando os precursores destas organelas. Como o DNA mitocondrial é transmitido diretamente da mãe para todos os filhos, é freqüentemente utilizado para estudos de linhagem evolutiva. A maior tendência do DNA mitocondrial sofrer lesões e mutações com o tempo, devido à ausência de histonas, mecanismos de reparo menos eficientes e proximidade com uma fonte contínua de geração de oxidantes, também tem utilidade para estudos de envelhecimento e datas de acontecimentos biológicos.

Para poder caber dentro das células, o DNA tem que assumir uma configuração espacial altamente compacta que, ao mesmo tempo, permita acesso a suas informações. Isso é possível devido em parte à propriedade do DNA de superenovelamento – a capacidade da dupla hélice do DNA se enovelar sobre si mesma, formando uma estrutura terceária. O superenovelamento afeta não só a estrutura do DNA, mas também suas propriedades de replicação e transcrição, processos que dependem da separação das fitas de DNA. É interessante notar que o superenovelamento ocorre mesmo em DNA isolado fora da célula, uma condição em que não há restrições espaciais para sua conformação em dupla hélice sem superenovelamento. Isso indica que o superenovelamento ocorre por causa de propriedades intrínsecas do DNA. Uma outra evidência que apóia esta hipótese é o achado que todo DNA celular apresenta superenovelamento, independentemente de sua origem.

Quando não há quebras em suas fitas, o plasmídeo assume uma conformação relaxada, sem superenovelamento, que se assemelha ao modelo Watson-Crick. Porém, como plasmídeos purificados raramente se encontram em configuração relaxada, se conclui que eles são sujeitos a algum tipo de modificação estrutural que leva ao superenovelamento.

Uma modificação estrutural que leva a superenovelamento é a diminuição do número de voltas da hélice em relação à forma B, ou desenovelamento. A forma B contem 10.5 pares de bases por volta, mas o DNA celular isolado freqüentemente apresenta cerca de 12 pares de bases por volta. Este desvio da forma mais estável do DNA é compensado por superenovelamento, e permite a separação das fitas com maior facilidade. O desenovelamento é ativamente promovido no DNA intracelular através de enzimas específicas, para facilitar sua compactação e separação das fitas para replicação e transcrição. O desenovelamento só pode ser mantido em DNA circular, ou se as pontas do DNA forem ancoradas para que este não possa rodar em torno de seu eixo. Para reverter o desenovelamento em DNA circular, é necessária a quebra de pelo menos uma de suas fitas. Na maioria dos plasmídeos intracelulares, há cerca de 5-7% de desenovelamento, o que estimula um superenovelamento negativo, em mão direita.

A quebra de uma fita de DNA seguida de rotação de 360° e restabelecimento da fita aumenta ou diminui o desenovelamento, gerando um topoisômero da molécula original de DNA. Não há diferença no número ou ordem de bases entre topoisômeros, que apresentam apenas alterações conformacionais. Plasmídeos topoisômeros podem ser separados por eletroforese em agarose. A quebra e restabelecimento de fitas de DNA visando formar topoisômeros são catalisados por topoisomerases, que possuem funções importantes para a replicação e empacotamento do DNA. Topoisomerases do tipo I quebram uma fita de DNA, realizam uma rotação e a restabelecem, enquanto topoisomerases do tipo II quebram ambas as fitas de DNA, realizando uma alteração estrutural maior. As topoisomerases de eucariotos não são capazes de realizar desenovelamento, as realizam o relaxamento de superenovelamentos positivos.

Em eucariotos, os cromossomos são facilmente visualizáveis durante a mitose. Em células não mitóticas, o material cromossomal é amorfo e disperso no núcleo, recebendo a designação de cromatina. A cromatina contém DNA e proteínas em massas aproximadamente iguais, além de pequenas quantidades de RNA. Grande parte das proteínas são histonas, que empacotam e ordenam o DNA em estruturas conhecidas como nucleossomos, que se assemelham a um colar de contos. Outras proteínas encontradas na cromatina são reguladoras de expressão gênica.

As histonas são proteínas de baixo peso molecular ricas em resíduos básicos, que compõe cerca de 25% de seus aminoácidos. Dois tipos de histonas (H3 e H4) estão entre as proteínas mais altamente conservadas em eucariotos. Oito moléculas de histona se agrupam para permitir o enovelamento de DNA ao seu redor, em um superenovelamento em mão esquerda. A restrição espacial imposta pelo enovelamento em torno de histonas é compensada pela ação de topoisomerases no superenovelamento resultante na porção da fita que não está em contato com a histona. As histonas tendem a se fixar em porções do DNA ricas em A=T na face do minor groove que interage com a histona, porque estas porções permitem maior compressibilidade. O enovelamento do DNA em torno de histonas diminui seu comprimento em cerca de sete vezes.

Para aumentar a compactação do DNA eucariótico em até mais 100 vezes, nucleossomos de organizam em fibras de 30 nm, que não estendem por todo DNA, abrangendo principalmente regiões que não estão sendo transcritas. Essas fibras são formadas pelo contato próximo entre nucleossomos, que se empacotam em seqüência, formando uma fibra. Este contato depende da presença de histona H1. É provável que as fibras de 30 nm se enovelem sobre si mesmas, gerando rosetas e mais enovelamento presentes no cromossomo.

Em bactérias, a compactação do DNA gera o nucleóide, que ocupa uma fração significativa da célula e se adere a um ou mais pontos da membrana plasmática. Há proteínas semelhantes a histonas, mas estas não formam uma estrutura regular, e aparentemente se liga e desligam do DNA com facilidade, impedindo a formação de nucleossomos. É possível que esta estrutura menos compacta permita transcrição mais rápida, refletida no rápido metabolismo e reprodução bacteriana.

Nucleotídeos e ácidos nucléicos
Nucleotídeos têm várias funções intracelulares: carregam ligações ricas em energia, compõe hormônios, co-fatores e neurotransmissores e são componentes dos ácidos nucléicos DNA (ácido desoxirribonucléico) e RNA (ácido ribonucléico), que carregam a informação genética.

O DNA tem como funções estocar e transmitir informações, incluindo a seqüência de aminoácidos das proteínas e de nucleotídeos do RNA intracelular. O segmento de DNA que contém, na forma de seqüências específicas de nucleotídeos, informações necessárias para produzir um produto biológico funcional é conhecido como o gene. Uma célula típica tem milhares de genes.

O RNA tem múltiplas funções. RNA ribossomal (rRNA) é componente dos ribossomos, que realizam a síntese de proteínas. RNA mensageiro (mRNA) carrega informações genéticas do gene para o ribossomo, permitindo a síntese de proteínas correspondentes. RNA de transferência (tRNA) traduz a informação do mRNA em uma seqüência característica de aminoácidos. Existem também outros tipos de RNA com funções específicas e até atividade catalítica.

Nucleotídeos têm como componentes característicos uma base nitrogenada, uma pentose e um fosfato. Na ausência de fosfato, a molécula é denominada nucleosídeo. As bases nitrogenadas podem ser purinas (adenina e guanina) ou pirimidinas (citosina, timina e uracila). As bases são ligadas em N-1 (pirimidinas) ou N-9 (purinas) numa ligação N-β-glicosil ao carbono 1´ da pentose. Por convenção, os carbonos das pentoses de nucleotídeos são marcadas por “´”, para distinguí-las dos carbonos das bases nitrogenadas. O fosfato se liga ao carbono 5´ na maioria dos nucleotídeos.

A adenina, guanina e citosina estão presentes tanto no DNA quanto no RNA. A timina está presente no DNA, enquanto a uracila é quase exclusiva ao RNA. Além destas bases, o DNA e RNA também apresentam proporções menores de outras bases, incluindo formas metiladas, hidroximetiladas e glicosiladas das bases mais comuns. Estas bases alteradas podem ter funções de regulação ou proteção do material genético.

As pentoses dos ácidos nucléicos são a 2-deoxi-D-ribose (DNA) e a D-ribose (RNA). Essas pentoses se apresentam em forma β-furanosídica, composta por um anel fechado de cinco membros que não ocupam o mesmo plano.

Os nucleotídeos podem ser ligados covalentemente entre si utilizando os grupos fosfato como “ponte”, unindo a hidroxila 5´ de um nucleotídeo ao 3´ de outro, formando a ligação fosfodiester. Ligações sucessivas formam uma macromolécula com pentoses e fosfatos alternados de um lado, de caráter hidrofílico, e bases nitrogenadas, de caráter mais hidrofóbico, do outro. As cargas negativas dos grupos fosfato em DNA eucariótico interagem com aminoácidos básicos das histonas para formar os nucleossomos, que contribuem para o empacotamento do DNA.

A regularidade das ligações fosfodiester confere aos ácidos nucléicos uma polaridade específica e terminações com grupos 3´ e 5´ sem ligações com outro nucleotídeo. A seqüência de nucleotídeos de um ácido nucléico pode ser representada esquematicamente, por convenção, da ponta 5´ para a 3´. O início da seqüência é freqüentemente marcado por “p” de fosfato. Seqüências curtas (~ < 50) são chamadas de oligonucleotídeos, enquanto as mais longas são conhecidas como polinucleotídeos.

As purinas e pirimidinas livres têm caráter levemente básico, o que lhes concede o nome de bases nitrogenadas. Tanto purinas como pirimidinas têm estrutura razoavelmente plana, e várias ligações em ressonância nos anéis. As bases livres podem existir em duas ou mais formas tautoméricas, dependendo do pH. Esta ressonância faz com que as bases absorvam luz UV próximo a 260 nm.

As bases nitrogenadas, por apresentar caráter mais apolar, tendem a interagir melhor entre si, se posicionando com seus anéis paralelos, como uma pilha de moedas. A interação entre as bases de uma mesma fita envolve uma combinação de interações de van der Waals e dipolo-dipolo. Em pHs alcalinos ou ácidos, a hidrofobicidade das bases nitrogenadas diminui por causa da ionização destas, e propicia à perda da estrutura normal do DNA.

A interação entre bases de fitas distintas ocorre por pontes de hidrogênio entre grupos carbonila, nitrogênio dos anéis e aminas extracíclicas. A adenina interage especificamente com a timina através de duas pontes de hidrogênio, enquanto a guanina interage especificamente com a citosina através de três pontes de hidrogênio. Esta complementaridade entre pares de bases permite a formação de DNA e RNA dupla fita. É também esta complementaridade que permite a duplicação precisa do DNA.

A estrutura primária do DNA compreende sua estrutura covalente e a seqüência de aminoácidos. A estrutura secundária do DNA compreende a interação estável entre duas fitas assumindo a forma de dupla hélice, descrita a seguir. Já a estrutura terceária do DNA compreende seu dobramento e formação de cromossomos e nucleóides.

A compreensão da estrutura e função do DNA se iniciou pelos estudos de Miescher, em 1868, que isolou uma porção ácida no material nucléico, hoje identificada como DNA. Miescher fez a hipótese que este material estava associado à herança celular, uma teoria confirmada somente em 1944 por Avery, MacLeod e McCarthy. Estes investigadores demonstraram que o DNA de uma cepa bacteriana virulenta transformava cepas não encapsuladas, que não causavam doença, em cepas virulentas encapsuladas. Em 1952, Hershey e Chase demonstraram, com fosfato e enxofre marcados, que era o DNA viral, e não a cápsula protéica, que causavam a infecção de E. coli por bacteriófagos, trazendo maior suporte à teoria de que o DNA era carregador da informação genética.

Na década de 1940, Chargaff e colaboradores estudaram a composição do DNA em maiores detalhes. Eles descobriram que as bases nitrogenadas ocorriam em quantidades diferentes em organismos distintos, mas iguais em células de diferentes tecidos de uma mesma espécie. Também demonstraram que a composição do DNA de um organismo não variava com alterações metabólicas, ambientais ou envelhecimento. Por fim, identificaram que a quantidade de adenosina e timina sempre era igual (A = T), e que a quantidade de citidina e guanosina também se igualava (C = G). Deste modo, a soma de resíduos purínicos se iguala à de pirimidinas (A + G = T + C). Estes achados seriam cruciais para a elucidação da estrutura secundária do DNA.

Para compreender melhor a estrutura tridimensional do DNA, Franklin e Wilkins fizeram análises de difração de raios X utilizando fibras de DNA isolado. No início da década de 1950, eles demonstraram que o DNA apresentava um padrão de difração característico, sugestivo de uma estrutura em hélice com duas periodicidades ao longo do eixo principal, medindo ~3,4 e 34 Å.

Watson e Crick, em 1953, utilizaram os dados de Franklin, Wilkins e Chargaff e modelos moleculares para propor uma estrutura secundária do DNA, consistindo de duas fitas antiparalelas formando uma hélice em mão direita. Neste modelo, a porção hidrofílica compreendendo os fosfatos e deoxiriboses se posicionava no exterior da molécula, enquanto as bases se direcionam pro interior da hélice, com suas estruturas hidrofóbicas e planares em contato próximo. Há a formação de dois grooves, um maior e outro menor, pelas fitas de DNA, que seriam as fontes das periodicidades visualizadas por difração de raios X. A estrutura de Watson-Crick ainda demonstrava a maior compatibilidade das interações entre A e T (com duas pontes de hidrogênio, A = T) e C e G, com três pontes de hidrogênio (C ≡ G). Assim, no modelo Watson-Crick as fitas antiparalelas de DNA apresentam complementaridade, sendo possível prever a estrutura de uma fita a partir da fita complementar. Esta propriedade é a base da capacidade de replicação do DNA. O modelo Watson-Crick foi amplamente confirmado por estudos posteriores e proporcionou um desenvolvimento notável em torno da compreensão dos mecanismos pelos quais a informação genética contida nele é processada.

Apear do modelo Watson-Crick, que identificou a forma B do DNA, ser o mais estável em condições fisiológicas, a estrutura do DNA permite bastante flexibilidade, e se encontram vários variantes no ambiente intracelular. Porém, nenhum destes variantes muda as propriedades de complementaridade, a presença de fitas antiparalelas ou os pareamentos A = T e C ≡ G. As mudanças estruturais podem ocorrer por alterações da conformação da desoxirribose, da ligação do fosfato com a desoxirribose ou da ligação da base nitrogenada com a ribose. Variantes estruturais mais comuns caracterizados são a forma A e a forma Z. A forma A do DNA é comum em ambientes pobres em água, e apresenta uma hélice mais larga e com mais bases por volta que a forma B. A forma Z do DNA apresenta uma hélice em mão esquerda, com 12 pares de bases por volta, e uma estrutura mais fina e alongada. Esta forma é propiciada por determinadas seqüências de nucleotídeos, como a alternância C/G. Já foi comprovada a existência de forma Z em DNA intracelular.

Além de variações no formato da hélice, existem variações estruturais do DNA que são dependentes da seqüência, e podem afetar a função e metabolismo do DNA próximo. Como exemplo, dobras ocorrem no DNA sempre que há quatro ou mais adenosinas, que podem ser importantes para a interação do DNA com certas proteínas. Regiões do DNA que têm repetições invertidas de seqüências de bases, conhecidas como palíndromos, são complementares a si mesmas, e tendem a formar hairpins ou crucifixos. Quando as repetições não apresentam complementaridade, como imagens em espelho, não pode haver formação destas estruturas. Há também a possibilidade de formação de posições de Hoogsteen, com mais pontes de hidrogênio entre bases que o modelo Watson-Crick, permitindo regiões de DNA com três ou quatro fitas. Estas regiões de formato diferente freqüentemente estão envolvidas com a regulação da expressão.

Como o DNA se encontra quase que exclusivamente no núcleo, enquanto a síntese de proteínas ocorre principalmente no citoplasma, algum tipo de mecanismo de transmissão da informação do DNA nuclear para o citoplasma deve existir. O RNA parece um bom candidato a esta função, pois se encontra tanto no núcleo como no citoplasma e sua quantidade aumenta quando há aumento de síntese protéica. Em 1961, Jacob e Monod propuseram que um tipo específico de RNA, o mRNA, carrega a informação genética aos ribossomos, onde funciona como templete que especifica a ordem de aminoácidos para a síntese de proteínas.

Em procariotos, um mRNA pode codificar mais que uma proteína, sendo chamada de policistrônico, enquanto mRNA que codifica para uma cadeia polipeptídica é monocistrônico. Em eucariotos, a grande maioria do mRNA é monocistrônico. Em geral, os mRNAs são um pouco maiores que três vezes o número de aminoácidos do polipeptídio que codificam, pois incluem seqüências regulatórias.

O tRNA se liga a aminoácidos covalentemente e interage com o mRNA para mediar a união de aminoácidos na síntese protéica. rRNAs são componentes do ribossomo, onde ocorre a síntese protéica. As ribozimas são RNAs com atividade catalítica. A grande riqueza de funções do RNA reflete uma variabilidade maior de sua estrutura em relação ao DNA. Esta variabilidade de estrutura ocorre porque o produto de transcrição é sempre RNA simples fita, e este se dobra de múltiplas maneiras, dependentes de sua seqüência de bases. Seqüências curtas tendem a formar uma hélice em mão direita, mantida por interações de empilhamento de bases. Estas interações são mais fortes entre purinas, que tendem a interagir mais entre si que com pirimidinas. Há também dobramento do RNA para que bases complementares (C ≡ G, A = U) formem pontes de hidrogênio com bases em outro ponto da fita, formando hairpins e outros motivos. No RNA, há também pareamento G = U e A = T, que existe ocasionalmente em RNA. A estrutura do RNA também pode ser estabilizada por pontes de hidrogênio do grupo hidroxila do carbono 2´ da ribose. Deste modo, cada RNA pode formar uma estrutura tridimensional diferente e única, como as proteínas.

Além de diferir do ponto de vista estrutural, DNA e RNA tem diferentes características químicas. Como exemplo, o DNA apresenta alta estabilidade, uma propriedade essencial para seu papel como depositório de informações genéticas. Alterações lentas de sua estrutura podem estar relacionadas a alterações fisiológicas do envelhecimento e patologias como as neoplasias.

O aquecimento de DNA a altas temperaturas leva à perda das pontes de hidrogênio entre as fitas, além de quebrar as interações das pilhas de bases, resultando na desnaturação do DNA, sem perda das ligações covalentes. Ao retornar a temperaturas mais baixas, o DNA pode facilmente se renaturar, desde que apresente alguns segmentos que mantém a interação entre as fitas. Se houver separação completa das fitas, a renaturação pode depender de colisões randômicas entre as seções pareadas ou não ocorrer. A desnaturação e renaturação do DNA podem ser acompanhadas por sua absorção UV, pois a naturação e pareamento de bases diminui sua absorção de luz (efeito hipocrômico), enquanto a desnaturação aumenta a absorção de luz UV (efeito hipercrômico).

O DNA de cada espécie possui uma tendência diferente de se denaturar quando aquecido lentamente. A temperatura característica de denaturação, ou ponto de fusão, aumenta em DNA rico em C ≡ G, que possui uma interação mais rica em energia que A = T. Utilizando técnicas cuidadosas, é possível promover a denaturação apenas de regiões do DNA que são ricas em A = T, levando à formação de “bolhas” visíveis por microscopia eletrônica. Estas regiões ricas em A = T são também pontos iniciais para a separação das fitas que ocorre com replicação e transcrição. Por motivos ainda obscuros, o ponto de fusão de RNA dupla fita ou híbridos RNA-DNA é comumente ≥ 20°C maior que o DNA.

As propriedades de desnaturação e renaturação do DNA podem ser utilizadas para encontrar regiões de DNA com características semelhantes entre espécies diferentes ou mesmo na mesma espécie. Ao misturar DNA total de uma espécie com um segmento de seqüência e função conhecidas, seguido de desnaturação e renaturação, parte do DNA total com seqüência complementar ao DNA conhecido pode gerar híbridos. Se o DNA conhecido estiver marcado de alguma maneira, é possível usar esta técnica para detectar seqüências semelhantes, com provável função parecida, no DNA total. A técnica de hibridização pode também ser usada para detectar seqüências específicas de RNA.

As bases de purinas e pirimidinas sofrem transformações químicas lentas, mas de importância fisiológica considerável, pois podem alterar a informação genética armazenada. As alterações da estrutura do DNA que produzem mudanças permanentes na informação genética codificada são conhecidas como mutações, e possuem um papel decisivo na evolução, envelhecimento e carcinogênese. A deaminação, ou perda dos grupos amino exocíclicos, é um tipo de alteração química comum. Ocorre em cerca de um a cada 107 resíduos de citidina a cada 24 h, ou cerca de 100 vezes ao dia por célula de mamífero. A deaminação da adenina e guanina é cerca de 100 vezes mais lenta.

A deaminação da citidina gera uracila, e este é o provável motivo pelo qual o DNA não contém uracila, para evitar o reconhecimento errado desta base. A uracila é rapidamente reconhecida no DNA como um produto indesejado, e eliminada por sistemas de reparo. Deste modo, a presença de timina no genoma pode ter sido um ponto evolutivo crucial para a manutenção de informação genética a longo prazo.

Outra alteração química importante do DNA é a hidrólise da ligação N-β-glicosídica entre a base e a pentose. Esta reação ocorre mais rapidamente com purinas em relação a pirimidinas. Cerca de 10.000 purinas por célula de mamífero sofrem hidrólise diariamente. No RNA, esta reação é muito mais lenta e não tem importância fisiológica.

A luz UV pode promover modificações químicas do DNA, condensando duas pirimidinas para formar um anel ciclobutano. Esta reação é mais freqüente entre dois resíduos de timidina adjacentes. Um segundo tipo de produto de condensação de pirimidinas, o fotoproduto 6-4, também pode ser formado entre pirimidinas por ação da luz UV. Como luz próxima à UV compõe boa parte da luz solar, a células da superfície corpórea estão constantemente sujeitas a mudanças químicas potencialmente carcinogênicas. A radiação gama e raios X podem levar a abertura de anéis, fragmentação das bases, e quebra das ligações fosfodiéster. Junto com a luz UV, esses tipos de radiações ionizantes promovem cerca de 10% das alterações químicas do DNA de causa ambiental.

Outras causas de alteração da estrutura do DNA podem ser agentes químicos, que se dividem em duas classes principais: Agentes que deaminam, como o ácido nitroso, e agentes alquilantes. Agentes alquilantes podem alterar certas bases do DNA, gerando produtos incapazes de se parear. Um exemplo é o dimetilsulfato, que metila a guanina a metilguanina, incapaz de interagir com a citosina.

Lesões oxidativas são provavelmente as mais importantes causas de alterações da estrutura do DNA. Espécies reativas de oxigênio podem ser geradas por irradiação ou como produtos do metabolismo aeróbico. Apesar das células possuírem um elaborado sistema de remoção destas espécies, uma fração delas pode “escapar” e lesar o DNA. Estas lesões compreendem oxidação da deoxiribose ou bases e até quebras de fitas.

Alterações na estrutura das bases também são geradas propositadamente através da ação de enzimas. Um exemplo é a metilação de resíduos de adenina e citosina, por ação de DNA metilases que utilizam S-adenosilmetionina como substrato. As metilações geralmente se encontram concentradas em certas áreas do DNA. Em bactérias, podem servir como marcadores de DNA próprio, para ajudar a identificar DNA invasor. Podem também participar de sistemas de detecção de bases erroneamente pareadas durante a replicação. Em mamíferos, a metilação chega a atingir 5% das citidinas, e inibe a migração de transposons. A metilação de citidinas pode também ter função estrutural, pois diminui a tendência de formação da forma Z do DNA.

Em 1977, Maxam-Gilbert e Sanger desenvolveram independentemente técnicas que permitem o seqüenciamento de grandes trechos de DNA. O desenvolvimento destas técnicas foi possível graças a avanços no conhecimento da estrutura do DNA e à possibilidade de se separar pedaços de DNA com apenas um nucleotídeo de diferença de tamanho. O princípio geral de ambas as técnicas consiste em criar fragmentos marcados de acordo com a posição dos quatro tipo de bases. O método de Sanger apresenta menor dificuldade técnica e hoje tem uso mais difundido. Utiliza-se dideoxinucleotídeos marcados radioativamente para interromper a replicação na posição do nucleotídeo sendo analisado, permitindo conhecer sua posição pela localização em gel, onde só aparecem as amostras marcadas radioativamente em seu lado 5’. Repetindo o experimento para cada um dos quatro tipos de bases, pode-se obter a seqüência da porção do DNA estudada. Esta técnica foi posteriormente automatizada através do uso de marcadores fluorescentes com cores distintas para cada nucleotídeo.

Outra técnica automatizada que permitiu um grande avanço em estudos moleculares foi a síntese de oligonucleotídeos, para uso como primers, por exemplo. Hoje existe metodologia que permite a síntese química de seqüências de até 100 nucleotídeos. Esta síntese se baseia nos métodos criados pelo grupo de Khorana na década de 1970, utilizando um suporte sólido sobre o qual é feita a síntese, de modo similar ao método de Merrifield para síntese de peptideos.

Além de compor os ácidos nucléicos, os nucleotídeos possuem outras funções importantes. Podem servir como carreadores de energia química intracelular, pois o grupo fosfato ligado ao hidroxil 5´ do ribonucleotídeo pode ter um ou dois fosfatos a mais ligados. A hidrólise destas ligações do tipo anidrido fosfórico fornece energia química para uma variedade grande de processos bioquímicos de cerca de 30 kJ/mol. A adenosina 5´-trifosfato (ATP) é o carreador de energia química intracelular mais comum, mas UTP, CTP e GTP também exercem estas funções.

Os nucleotídeos de adenina também compõem co-fatores de várias enzimas. A adenosina geralmente não participa diretamente da função primária, mas sua remoção costuma levar a uma redução na atividade do co-fator. Acredita-se que a adenosina possa participar modulando a energia de ligação entre a enzima e o substrato ou co-fator. Este papel da adenosina provavelmente evoluiu após a adoção do ATP como fonte predominante de energia química intracelular, aproveitando uma molécula que se tornava abundante para uma segunda função.

Nucleotídeos podem também ter função regulatória, agindo como segundos mensageiros. O nucleotídeo que mais comumente age como segundo mensageiro é a adenosina 3´,5´-monofosfato cíclica (cAMP), formada pela adenilato ciclase a partir do ATP. O cGMP também tem função de segundo mensageiro.

Regulação da expressão gênica
Somente uma fração pequena dos genes de uma célula é expressa em cada momento determinado. Da mesma maneira, alguns genes têm seus produtos produzidos em grandes quantidades, enquanto outros são pouco expressos ou não expressos. A expressão varia com o tempo de vida, estado metabólico, condições ambientais da célula, entre outros fatores. Deste modo, a regulação da expressão gênica é fundamental para a manutenção da vida.

Há sete pontos onde a expressão gênica pode ser regulada: (1) a síntese do transcrito primário de RNA, (2) processamento pós-transcrição do mRNA, (3) degradação do mRNA, (4) síntese protéica (tradução), (5) modificação pós-tradução de proteínas, (6) degradação protéica e (7) transporte e targeting protéico. Iremos abordar aqui principalmente a regulação da formação do transcrito primário, os mais conhecidos e bem documentados.

Genes que são expressos de modo constante, ou constitutivo, e em todas as células de organismos multicelulares são conhecidos como housekeeping genes. Genes que têm sua expressão aumentada por determinados estímulos são indutíveis, enquanto genes que têm sua expressão diminuída são represíveis.

A transcrição é regulada principalmente pela interação entre proteínas e o DNA. A maioria destas interações envolve a ação das RNA polimerases. Estas enzimas se ligam ao DNA e iniciam a transcrição em regiões promotoras. A regulação da transcrição muitas vezes envolve alterações da relação entre a RNA polimerase e a região promotora.

A seqüência de promotores varia muito, e influencia a transcrição. A região promotora se assemelha a regiões consenso, e mutações que a tornam mais semelhantes ao consenso aumentam a função promotora. As diferenças entre as seqüências promotoras regulam a iniciação da transcrição e mantém níveis adequados de seus produtos. Em eucariotos, a interação com a região promotora geralmente é mediada por fatores de transcrição que agem juntos com a RNA polimerase, tornando o processo mais complexo.

Os tipos de fatores de transcrição são: fatores de especificidade, que alteram a seletividade de uma RNA polimerase por uma região promotora determinada (como a TATA binding protein, por exemplo), repressores, que impedem a RNA polimerase de interagir com o promotor, e ativadores, que aumentam esta interação. Em procariotos, repressores se ligam a regiões operadoras, geralmente localizadas próximas ao promotor, bloqueando a ação da RNA polimerase e promovendo regulação negativa. A ligação dos repressores no DNA é regulada por sinais moleculares que incluem mudanças conformacionais e interações proteína-proteína. Em eucariotos a região de ligação do repressor pode estar mais distante do promotor, mas também promove inibição da transcrição. Ativadores promovem regulação positiva, ao ligar com o DNA e ativar a transcrição. Os sítios de ativadores são freqüentemente próximos a promotores que se ligam fracamente à RNA polimerase. Alguns ativadores de eucariotos se ligam a sítios distantes dos promotores, os enhancers, influenciando a transcrição num promotor distante por mecanismos pouco entendidos. Alguns ativadores estão interagindo com o DNA a maior parte do tempo, se dissociando apenas com um sinal molecular específico. Outros ativadores necessitam de um sinal metabólico para se ligar.

As proteínas regulatórias geralmente se ligam a seqüências de DNA específicas com alta afinidade (milhares de vezes maior que a outros trechos de DNA). As proteínas regulatórias reconhecem características da superfície do DNA, como os grupos que participam das pontes de hidrogênio A = T e C ≡ G no sulco maior e grupos metila ligantes do C5 da timina, diferenciando-o da citosina. Os aminoácidos das proteínas regulatórias que mais comumente participam de interações com as pontes de hidrogênio do DNA são resíduos de Asn, Gln, Glu, Lys, e Arg. Glu e Asn interagem com adenina, e Arg interage principalmente com guanina, mas não há um pareamento constante entre resíduos de aminoácidos e bases. Os domínios de interação das proteínas regulatórias com o DNA tendem a ser pequenos, com 60-90 resíduos, com motivos menores ainda em contato com o DNA em si. Os sítios de ligação são freqüentemente repetições invertidas de seqüências curtas (palíndromos) em que duas subunidades de proteínas se ligam.

Um motivo comum nos sítios de reconhecimento de DNA de proteínas regulatórias é a hélice-volta-hélice, presente em quase todas as proteínas regulatórias procarióticas. Contém ~20 aminoácidos em duas α-hélices separadas por uma volta β. Em uma das α-hélices, que se posiciona pra fora da superfície do resto da proteína, estão os aminoácidos que realizam o reconhecimento do DNA. O reconhecimento coloca esta α-hélice no interior do sulco maior.

Outro tipo de sítio de reconhecimento é o zinc finger, uma seqüência de ~30 aminoácidos com quatro Cys ou 2 Cys e 2 His coordenando um íon Zn2+. O Zn2+ não participa na interação com DNA, mas auxilia na estabilidade do motivo. O zinc finger é um motivo comum em proteínas regulatórias de eucariotos, e têm uma ligação pouco estável com o DNA quando isolado, normalmente ocorrendo em várias repetições na mesma proteína. Zinc fingers também são encontradas em proteínas que ligam RNA, como repressores de tradução, por exemplo.

Outro motivo que reconhece DNA é o homeodomínio, muito atuante no desenvolvimento eucariótico, composto por ~60 aminoácidos formando α-hélices e voltas.

Proteínas regulatórias também podem agir por interação com proteínas como a RNA polimerase. Motivos comuns a esse tipo de interação são: (1) “zíperes” de leucina, formado por dímeros de α-hélices em coiled-coil com características anfipáticas interagindo em suas superfícies hidrofóbicas. Há resíduos de leucina a cada sete resíduos, formando uma linha reta e (2) hélice-volta-hélice básicos, que também agem como dímeros de ~ de 50 aminoácidos.

É comum identificar famílias de fatores de transcrição eucariótica a partir da presença dos motivos descritos acima, que podem se associar como homodímeors ou heterodímeros. Há também outros grupos regulatórios comuns, ricos em glutamina, prolina ou domínios ácidos.

A seguir, descreveremos algumas características da regulação gênica em procariotos. Nestes organismos, genes que têm produto final relacionado ao mesmo processo estão freqüentemente juntos no cromossomo e são transcritos juntos, gerando um mRNA policistrônico (que gera vários produtos). O cluster de genes mais o promotor e outras seqüências reguladoras são conhecidas como o operon, descrito inicialmente por Jacob e Monod em 1960. Operons podem também existir em eucariotos menos complexos, mas são raros em eucariotos superiores.

Um operon bem caracterizado é o da lactose (lac), que inclui os genes da β-galactosidase, galactosídeo permease e tiogalactosídeo transacetilase. Cada gene é precedido por um sítio de ligação de ribossomo, que permite a tradução independente. Na ausência de lactose, o operon lac é reprimido. Esta repressão é perdida por mutações no operador ou mutações no gene I (inibidor). A perda de repressão por mutações do gene I pode ser revertida pela introdução de uma cópia funcional desta em outro segmento de DNA, indicando que ele codifica uma molécula móvel repressora, o repressor Lac. O repressor Lac, que possui estrutura hélice-volta-hélice, se liga ao operon lac em dois sítios, formando uma volta (loop) de DNA e diminuindo a velocidade da transcrição em ~ mil vezes. É um repressor pouco usual pois não interage como dímero, mas sim, tetrâmero. Na presença de lactose, uma molécula sinal, a alolactose (um isômero da lactose produzido por ação de β-galactosidases) se liga ao repressor Lac e muda sua conformação, desligando-o do operador. O isopropiltiogalactosídeo (IPTG) é um análogo da alolactose que ativa fortemente o operon lac e é freqüentemente utilizado experimentalmente.

Na presença de glicose, é pouco interessante à E. coli realizar também a fermentação de lactose, mesmo que esta esteja presente, pois aumenta as necessidades enzimáticas e metabólicas. Nessa situação, ocorre repressão catabólica, um processo em que o metabolismo de outros açúcares é reprimido em glicose abundante, mediado pela interação de cAMP com a cAMP receptor protein (CRP). Na ausência de glicose, a CRP se liga próximo ao promotor lac e estimula a transcrição, coordenando a transcrição junto com a ação do repressor Lac. A CRP se liga mais ativamente ao DNA na presença de cAMP, que têm sua formação diminuída e efluxo celular aumentado na presença de glicose.

A regulação por CRP e cAMP não é encontrada apenas no operon lac, mas também em vários operons envolvidos no metabolismo de açúcares secundários. O conjunto de operons regulados pelos mesmos estímulos é conhecido como regulon, e permite alterações coordenadas no metabolismo da célula. Outros regulons importantes são compostos pela resposta a choque térmico (heat shock) e a resposta SOS a dano extenso em DNA, discutidos posteriormente.

Outro operon bem caracterizado em E. coli é o da arabinose (ara), que inclui genes que codificam para ribulose quinase, arabinose isomerase e ribulose 5-fosfato epimerase. Este operon também responde a CRP, mas tem uma regulação mais complexa. Dentre vários outros mecanismos, a proteína regulatória AraC, que se liga no sítio araI (de indutor) ou araO2, pode agir tanto como repressora como ativadora, dependendo de sua conformação, determinada por moléculas sinal. A ligação de AraC a araO2 e parte de araI forma um loop de DNA que inibe a transcrição em condições de alta glicose/baixa arabinose. Quando a glicose está ausente e arabinose presente, a AraC assume nova configuração e se liga completamente a araI, removendo o loop e ativando a transcrição. A síntese de AraC é regulada pela sua concentração, que reprime a transcrição do gene araC.

O operon de triptofano (trp) inclui genes necessários para a síntese deste aminoácido, e é regulado por um repressor Trp que se liga ao operador quando há triptofano em abundância. A atenuação da transcrição aparentemente envolve pareamento de porções complementares do mRNA, impedindo a transcrição de parte ativa. Há processos parecidos em operons de outros aminoácidos.

A repressão da transcrição é fortemente inativada durante o processo de resposta SOS, que ocorre após dano extenso ao DNA e é um exemplo claro de regulação coordenada da expressão gênica. Os genes envolvidos na resposta SOS estão normalmente reprimidos pelo repressor LexA. Em resposta a danos no DNA, a LexA se desliga, de modo facilitado por RecA. A RecA exerce esta função somente quando ligada a DNA simples fita, o que só ocorre em condições de dano extenso ao DNA. É interessante notar que dentre os vários genes ativados por esta resposta se encontram aqueles que levam à formação de bacteriófagos, que podem então rapidamente sair da célula comprometida. Deste modo, este sistema de resposta não só auxilia na sobrevivência da bactéria após grave dano, mas também de vírus normalmente inativos.

O aumento da reprodução bacteriana coincide com altas necessidades de síntese protéica, e ocorre na presença de altas quantidades de ribossomos. O aumento das proteínas e RNA ribossomal é coordenado por diversos processos, incluindo um grande número que afeta a tradução.

Outro mecanismo interessante de regulação gênica bacteriana é presente na síntese de flagelos de Salmonella. Há recombinação sítio-específica do promotor do gene da flagelina, modulando a síntese do repressor FljA.

Em eucariotos, o início da transcrição também é o ponto mais importante para a regulação da expressão gênica. A diferença mais proeminente entre encariotos e procariotos é que em eucariotos a RNA polimerase não pode atuar nem mesmo com baixa eficiência na ausência de promotores – o estado basal de transcrição é restritivo. Por causa desta e diferenças na estrutura do DNA, pelo menos quatro características da regulação da expressão gênica em eucariotos são muito distintas da de procariotos: (1) a expressão gênica necessita alterar a estrutura da cromatina antes de ocorrer; (2) há predominância de estímulos ativadores, devido ao estado basal restritivo; (3) as proteínas regulatórias são maiores e multiméricas e (4) há separação espacial entre a transcrição (no núcleo) e tradução (no citoplasma).

A condensação do DNA na cromatina fortemente inibe a transcrição, e regiões sendo transcritas são mais sensíveis à digestão por nucleosídeos, indicando que sua estrutura está alterada nestes locais, que contém ainda sítios hipersensíveis, com susceptibilidade maior ainda à DNase. Estes sítios freqüentemente correspondem a sítios de ligação de proteínas regulatórias da transcrição. É comum haver falta relativa de nucleossomos nestas regiões, o que pode contribuir para a interação com estas proteínas. Nucleossomos são completamente ausentes em algumas regiões onde a transcrição é muito ativa e contínua, como genes de rRNA. Nestas regiões onde há muita transcrição, tende a haver falta de histona H1 e modificações das outras histonas como acetilação e ubiquitinação. Há também em regiões altamente transcritas menor quantidade de citosona metilada no DNA. Deste modo, há remoção de barreiras estruturais que podem dificultar a transcrição. A formação de locais no DNA com menor estruturação da cromatina ocorre por remodelação da cromatina, envolve uma série de enzimas que acetilam histonas que formam o nucleossomo, diminuindo sua afinidade por DNA. Após a transcrição, há deacetilação e recomposição do nucleossomo, às custas de DNA.

Como mencionado anteriormente, há predominância de regulação positiva em eucariotos devido à inexistência de afinidade intrínseca entre a RNA polimerase e o DNA na ausência de promotores, à estrutura da cromatina que normalmente impede a transcrição, ao tamanho do genoma, que dificulta especificidade de promotores e à maior eficiência de regulação positiva, levando em consideração que a maioria dos genes está inativo em qualquer dado momento. Deste modo, a maioria dos genes eucarióticos possuem um número médio de pelo menos cinco sítios regulatórios. Apesar da presença predominante de ativadores, há vários exemplos de regulação negativa em eucariotos.

A RNA polimerase II, responsável pela formação de mRNA eucariótico, se liga principalmente à TATA box e ao iniciador, mas os promotores também incluem uma variedade de seqüências responsáveis pela regulação da transcrição. Essas seqüências incluem enhancers ou upstream activator sequences (UACs), que podem conter centenas a milhares de pares de bases upstream do início da transcrição. Enhancers, quando ligados a proteínas regulatórias apropriadas, aumentam a transcrição em promotores próximos independentemente da sua orientação no DNA. Na média, a RNA polimerase II será influenciada por 6 seqüências regulatórias deste tipo, e mecanismos mais complexos ainda são comuns.

Existem três tipos principais de proteínas envolvidas na ativação da transcrição. Os fatores de transcrição basais são necessários em todos os promotores de RNA polimerase II, e inclui TATA-binding proteins. São necessárias à transcrição, mas exercem pouco efeito regulatório, e não são capazes de interagir com promotores em cromatina organizada. Os transativadores ligados a DNA interagem com enhancers e auxiliam na transcrição. A necessidade de sua presença e especificidade varia muito com o promotor. O sítio de ligação destas proteínas pode estar longe da TATA box. Nestes casos, há looping do DNA para que as várias proteínas envolvidas possam interagir fisicamente, um processo facilitado por proteínas HMG (com alta mobilidade eletroforética). Finalmente os coativadores são proteínas que não interagem diretamente com o DNA, mas funcionam como mediadores de comunicação entre as proteínas envolvidas no processo.

Um sistema em eucariotos em que a regulação da transcrição é bem conhecida é o sistema GAL, que envolve a importação e metabolismo de galactose em S. cerevisiae. Cada gene é transcrito separadamente, pois não há operons, mas os promotores são similares e há regulação coordenada da transcrição. Os promotores, além do TATA box e seqüência iniciadora possuem um upstream activator sequence (UAS, o enhancer de levedura) reconhecido pelo ativador Gal4p, que forma um complexo com Gal80p, prevenindo sua função ativadora. Na presença de galactose ligada a Gal3p, há liberação da Gal80p, ativando a transcrição. A Gal4p têm um domínio tipo zinc finger onde liga DNA, em uma região palindrômica. O domínio responsável pela ativação desta proteína tem muitos resíduos ácidos, essenciais à sua função.

Transativadores normalmente têm um domínio para interação com DNA e outros para interação com outras proteínas regulatórias ou para a ativação. A interação entre proteínas regulatórias é freqüentemente mediada por domínios com domínios tipo “zíperes” de leucina ou hélice-volta-hélice. É interessante notar que os domínios de interação com o DNA e de ativação podem funcionar de modo independente, como demonstrado em experimentos que fundem o domínio de uma proteína regulatória com a porção ativadora de outra.

A transcrição gênica também pode ser regulada por sinais intercelulares em organismos multicelulares. Um exemplo são os efeitos de hormônios esteróides, que atravessam a membrana plasmática e se ligam a proteínas receptoras no núcleo. Estes receptores estão ligados via zinc fingers a seqüências específicas, e alteram a expressão gênica por alteração da estrutura dos receptores que permite interação com outros fatores de transcrição. A porção do receptor que reconhece hormônios é altamente específica para cada tipo de esteróide. Mutações nestas porções do receptor podem levar à perda de resposta a hormônios esteróides específicos. Sinais intercelulares também podem ser mediados por fosforilação de enzimas sinalizadas pelo aumento do mensageiro secundário cAMP. A fosforilação da cAMP response element binding protein (CREB) ativa sua função de fator de transcrição, levando à expressão dos genes próximos.

Em eucariotos, a regulação da tradução tem um papel mais importante na regulção d expressão gênica que em bactérias. Isso permite uma síntese mais rápida de proteínas pois não depende da transcrição e posterior transporte do mRNA para o citoplasma. Este processo é importante para genes longos e em células anucleadas como os reticulócitos. Os principais mecanismos de regulação da tradução são: (1) os fatores de iniciação são regulados por fosforilação, que leva, de modo geral, à menor atividade; (2) há proteínas que se ligam ao mRNA e reprimem a tradução por alterar a interação com fatores de iniciação e (3) há proteínas que se ligam a diversos fatores envolvidos na tradução, diminuindo sua eficiência por alterar a interação entre estes fatores.

Tecnologia do DNA Recombinante
A partir da década de 1970, começaram a se desenvolver metodologias que possibilitam o estudo isolado de genes e seus produtos, permitindo uma revolução no conhecimento sobre processos biológicos, além do desenvolvimento de ferramentas de interesse na agricultura, medicina, ecologia e investigação forense, entre outros. Essa nova tecnologia, desenvolvida em grande parte a partir dos laboratórios de Berg, Boyer e Cohen será descrita a seguir, além de alguns exemplos de suas aplicações.

Uma técnica importante é a clonagem de DNA, ou a separação de um gene ou segmento específico de DNA, ligação a uma molécula de DNA carreador e replicação em milhares ou milhões de cópias idênticas. Essas cópias são feitas normalmente em células, mais comumente E. coli, por ter metabolismo bem conhecido e mecanismos eficazes de troca de DNA entre células.

O primeiro passo para a clonagem de DNA é a quebra de DNA em locais precisos, feitas por endonucleases específicas a seqüências (de restrição). São enzimas encontradas naturalmente em várias espécies bacterianas, que possuem a função de destruir DNA não-próprio, como descrito por Arber. As seqüências semelhantes nas células que sintetizam estas enzimas são protegidas por metilação, promovida por uma enzima específica produzida em paralelo à enzima de restrição. As endonucleases de restrição do tipo II, isoladas inicialmente por Smith e cuja utilidade foi reconhecida por Nathans, são as mais adequadas para clonagem, pois são de estrutura mais simples, não utilizam ATP e clivam DNA no próprio sítio de reconhecimento. Existem milhares destas enzimas conhecidas, que clivam mais de 100 seqüências específicas, geralmente 4-6 pares de bases palindrômicas. Os cortes realizados por estas enzimas são em alguns casos não contínuos, deixando uma fita não pareada de cada lado, os sticky ends, assim chamados por sua facilidade de parear com outras fitas. Outras enzimas não deixam segmentos simples fita, mas sim blunt ends.

Uma vez fragmentado, um segmento específico de DNA pode ser enriquecido por eletroforese ou HPLC. Em genomas grandes, isso se torna pouco prático, e pode ser utilizada uma biblioteca de DNA para separá-lo, como descrito posteriormente.

Após a fragmentação e separação, DNA ligases são usadas para ligar o fragmento em estudo a um vetor de clonagem. Este processo é muito facilitado pela presença de sticky ends.

O vetor recombinante é então introduzido na célula que irá amplificá-lo. Existem três vetores mais comuns para se inserir o DNA em E. coli: plasmídeos, bacteriófagos e cromossomos bacterianos artificiais.

Os plasmídeos são DNA circulares que se replicam separadamente do cromossomo da célula hospedeira. Podem ser introduzidos na bactéria num processo conhecido como transformação, em que as células são incubadas com os plasmídeos e cloreto de cálcio sob gelo, depois rapidamente aquecidas até cerca de 40°C. Nessas condições, por mecanismos ainda não completamente compreendidos, algumas bactérias incorporam plasmídeos. Uma técnica alternativa é a eletroporação, em que as células têm sua membrana plasmática temporariamente permeabilizada por pulsos de alta voltagem.

Para separar as células que incorporaram o plasmídeo, costuma-se usar plasmídeos que conferem resistência a um determinado antibiótico, facilitando a seleção. Pode-se usar também a perda da resistência a um antibiótico específico para identificar células em que há plasmídeos em que o DNA a ser foi inserido, quebrando a seqüência que confere esta resistência. Deste modo, é comum plasmídeos utilizados para clonagem apresentarem genes que conferem resistência a dois antibióticos distintos. Estes plasmídeos devem conter ainda uma origem de replicação, sítios reconhecidos por enzimas de restrição para facilitar a inserção de DNA e um tamanho não limitante a sua incorporação. Seqüências de DNA maiores que 15000 pares de bases dificilmente podem ser inseridas utilizando plasmídeos.

Bacteriófagos λ podem inserir seqüências de DNA maiores em E. coli. Para colocar DNA no bacteriófago, ele precisa ter um tamanho específico entre 40000 e 53000 pares de bases, então os vetores utilizados normalmente vêm com DNA de “enchimento” de cerca de um terço do DNA total, que pode ser descartado para inserção da seqüência em estudo (até 23000 pares de bases). O próprio empacotamento do vírus se encarrega de selecionar partículas em que o DNA se inseriu corretamente. Encarrega-se também de transmitir o DNA à E. coli de modo altamente eficiente.

Cromossomos bacterianos artificiais (BACs) podem ser usados para clonar segmentos muito longos de DNA. Contém origens de replicação muito estáveis e marcadores de resistência, comumente a cloramfenicol. São introduzidos na célula por eletroporação, e normalmente não existem em mais de duas cópias por célula. As células que recebem BACs podem ser modificadas para terem paredes celulares deficientes, facilitando sua inserção.

Para separar o segmento de DNA de interesse para a clonagem, é possível utilizar uma biblioteca de DNA, contendo milhares de fragmentos de DNA de um genoma. O tipo mais comum de biblioteca de DNA, a biblioteca genômica, é produzida pela clivagem do genoma completo de um organismo e inserção de todos os fragmentos em vetores de clonagem. Cada bactéria transformada gera uma colônia de clones contendo o DNA recombinante. Para facilitar a identificação de cada um dos fragmentos, é comum gerar bibliotecas a partir de transcrição reversa de mRNA extraído do tecido (bibliotecas de cDNA), que contém apenas segmentos transcritos. Pode-se também gerar bibliotecas de tecidos que conhecidamente possuem grandes quantidades de mRNA do produto desejado.

Para identificar o clone que contém o DNA de interesse, pode-se fazer hibridização, que utiliza uma sonda de DNA marcado complementar à seqüência de interesse. Pode-se transferir parte de cada colônia de uma biblioteca para nitrocelulose, romper as células e denaturar o DNA com álcali e depois tratar a nitrocelulose com a sonda, localizando as colônias de interesse. A seqüência da sonda pode ser obtida a partir de seqüências do gene de interesse já determinadas em outros organismos, a partir de uma seqüência protéica conhecida ou de bancos de dados de seqüências.

Os chips (ou microarrays) de DNA utilizam a hibridização para testar simultaneamente milhares de genes. Fragmentos de genes conhecidos são colocados em uma superfície sólida, e a hibridização relativa, com cDNA fluorescente gerado a partir de mRNA, por exemplo, pode ser testada verificando a coloração de cada localidade do chip. Trata-se de uma técnica interessante para análise de expressão gênica em larga escala.

Outra maneira de localizar um gene de interesse é conhecer pelo menos parte de sua seqüência e ampliá-lo por reações de polimerazação em cadeia (PCR). O PCR, concebido por Mullis em 1983, consiste em utilizar duas seqüências de bases sintéticas (oligonucleotídeos) correspondentes a fitas opostas do DNA em estudo, marcando o fim da seqüência. Estes oligonucleotídeos servem de primers para a replicação. O DNA a ser amplificado é aquecido brevemente para denaturá-lo e resfriado na presença dos oligonucleotídeos. São adicionados então deoxinucleotídeo trifosfatos, e o segmento de DNA é replicado repetidamente em seqüências de aquecimento e resfriamento. Para esta replicação se utiliza TaqI polimerase, resistente a calor por ser extraída de bactérias termófilas.

O PCR é útil para DNA fingerprinting, uma técnica de interesse forense que identifica indivíduos com base em polimorfismos humanos e a variação que estes polimorfismos geram no padrão de digestão por enzimas de restrição. Os fragmentos de diferentes tamanhos são detectados por Southern blots, uma técnica em que os fragmentos são inicialmente separados por tamanho por eletroforese em gel de agarose, depois denaturados em solução alcalina e passados para uma membrana de nitrocelulose. A membrana é então incubada com sondas de DNA marcadas complementares a seqüências repetitivas. A membrana é revelada, e o padrão de bandas analisado. Utilizando várias sondas, é possível tornar o padrão de bandas tão seletivo que identifica um indivíduo na população humana inteira. Para ter a quantidade de DNA suficiente para esta técnica, amplia-se a amostra obtida por PCR.

Uma vez separado, identificado e clonado, um gene de interesse pode ser expresso, permitindo o estudo e uso de seus produtos protéicos. Para fazer isso com genes eucarióticos inseridos em bactérias, é necessário inserir seqüências regulatórias de transcrição e tradução nas posições corretas relativas ao gene eucariótico no vetor. Uma vez inseridas essas seqüências, utilizando vetores de expressão, o produto do gene pode ser expresso de modo altamente eficaz, chagando a representar 10% da proteína da E. coli transformada, podendo até matar as células em alguns casos.

O gene clonado pode também ser alterado por mutagênese sítio-dirigida, gerando um produto ligeiramente diferente do original. Isso pode ser feito por remoção do segmento a ser alterado com enzimas de restrição e substituição por um segmento artificial, desde que hajam sítios adequados próximos à região a ser alteradas. Se não, pode-se hibridizar um segmento curto de DNA com a mutação desejada com o vetor, gerando ~50% de células com a mutação, após funcionamento dos sistemas de reparo bacterianos. As células com a mutação desejada são então identificadas, geralmente por seqüenciamento do plasmídeo. Pode-se também mudar mais drasticamente a estrutura do produto protéico, eliminando um segmento ou fundindo dois genes para gerar um produto de fusão. Essas técnicas de alteração de produtos protéicos têm sido utilizadas em estudos de dobramento, estrutura e função protéica, e têm aplicações para a geração de produtos mais eficazes ou mais resistentes a agressões ambientais.

Além de E. coli, outro organismo utilizado freqüentemente como hospedeiro para DNA recombinante é S. cerevisiae, por ser um eucarioto de crescimento rápido, ter genoma relativamente pequeno e seqüenciado completamente. També há vetores de expressão construídos para uso em S. cerevisiae, onde há a vantagem de promover modificações pós-traducionais necessárias para a atividade de muitas proteínas eucarióticas. A propagação de genes em S. cerevisiae pode ser feita por plasmídeos específicos, alguns dos quais permitem uso tanto em levedura quanto em E. coli, os shuttle vectors.

O uso de levedura também permite a clonagem de segmentos longos de DNA, nos cromossomos artificiais de levedura (YACs). Esta tecnologia permite economizar no número de colônias necessárias para criar uma biblioteca, devido ao maior tamanho dos segmentos incorporados. As YACs consistem nos elementos necessários para manter um cromossomo no núcleo de leveduras, incluindo origens, centrômeros, telômeros e marcadores. Inicialmente, é amplificado como plasmídeo em bactéria, depois clivado por uma endonuclease, removendo o DNA entre a região que gerará telômeros, e formando dois braços distintos. O DNA fragmentado é separado por eletroforese em campo pulsado, e os fragmentos de tamanho correto são selecionados. Os YACs são então cultivados com as células a ser transformada em meio seletivo.

A inserção e modificação de genes em plantas têm inúmeras aplicações na agricultura. Em plantas, a clonagem é dificultada pela falta de plasmídeos, então genes são regularmente introduzidos utilizando bactérias, geralmente o Agrobacterium tumefaciens, capazes de invadir plantas e transformá-las com o DNA plasmideal, que é integrado a cromossomos de plantas infectadas. Esta transferência gênica pode ser demonstrada pela expressão concomitante de marcadores como luciferase ou GFP. Um exemplo de transformação de importância agronômica é a criação de soja resistente ao herbicida glifosfato, permitindo a eliminação de ervas daninhas das plantações de soja.

A clonagem, além de expandir nosso conhecimento sobre o funcionamento celular e providenciar produtos biotecnológicos, permite gerar células, animais e tecidos com novas características. Culturas de células podem ser transformadas por eletroporação na presença de DNA, com baixa eficiência, microinjeção, que permite a manipulação de poucas células, ou com vetores virais ou lipossomos. Essas técnicas, apesar de muito utilizadas, ainda apresentam alguns problemas técnicos, como a incerta do sítio de inserção do DNA recombinante, a falta de transfecção estável (por exemplo com adenovírus) por falta de integração com o DNA cromossomal e a falta de controle de níveis de expressão. A transformação de óvulos fertilizados de animais permite a geração de animais com novas características, transgênicos, e facilita o estudo das propriedades de genes em organismos multicelulares.

Deste modo, a tecnologia do DNA recombinante já pôde gerar muitos produtos novos com claras vantagens comerciais. Dentre eles podemos citar, para uso médico, fatores de coagulação, insulina, hormônio de crescimento e interferon recombinantes. Na indústria, enzimas recombinantes são utilizadas para produzir sabões, açúcares e queijos, e peptídeos e preoteínas sintéticas são utilizadas como aditivos para aumentar sabor e odor. Microorganismos foram gerados para remover óleos e realizar detoxificação. Finalmente, plantas resistentes a várias formas de estresse foram geradas.