Biomolecules

Biomoléculas
Iremos abordar aqui os princípios químicos que governam as propriedades das moléculas biológicas.

Dos 90 elementos químicos existentes, 30 sao essenciais à vida; a maioria destes são elementos de baixa massa molecular e estão presentes em baixas concentrações.

Lavoisier foi o primeiro a notar a complexidade da composição das moléculas biológicas, que sabidamente continham os elementos carbono (C), oxigênio (O), nitrogênio (N) e fósforo (P).

99% dos seres vivos são compostos por quatro elementos químicos: hidrogênio, oxigênio, nitrogênio e carbono, os elementos de mais baixa massa capazes de fazer uma, duas, três e quatro ligações respectivamente. A baixa massa molecular dos elementos garante a força destas ligações.

Quanto aos outros elementos, geralmente compõe estruturas essenciais à ação de proteínas, como os íons ferro da hemoglobina.

Mais de metade do peso seco das células é composto por carbono. Este fato, somado a grande variedade de interações estáveis do C com H, O e N, além de com ele mesmo (ligações simples (C-C), duplas (C=C) ou triplas) permite uma grande variedade de moléculas. Estas ligações são do tipo covalente, relativamente forte.

A ligação de quatro grupos em único carbono gera uma estrutura tetraédrica com livre rotação em cada ligação. Assim, os quatro ligantes ficam o mais longe possível um do outro, por intereferência estérica mútua.

A existência de ligações duplas entre dois átomos gera um plano com pouca rotatividade baixa entre os dois átomos. Em outras palavras, o pequeno espaço para os elétrons compartilhado em ua ligação dupla resulta em rigidez da ligação.

Moléculas que contém carbono realizando ligações covalentes são chamadas de orgânicas. As suas cadeias carbônicas podem ser lineares, conter ramificações, ou formar estruturas cíclicas.

Além das ligações covalentes C-C, existem ligações com outros átomos gerando funções químicas bem características, os chamados grupos funcionais.

Como as cadeias de carbono são altamente estáveis, são os grupos funcionais que oferecem às moléculas orgânicas a maior parte de suas propriedades químicas.

Alguns grupos funcionais típicos são hidroxilas (presentes nos álcoois), aminos (presentes nas aminas), carbonilas (presentes nos aldeídos e cetonas) e carboxilas (presentes nos ácidos carboxílicos).

Além dos grupos funcionais presentes, outra característica que determina as propriedades das biomoléculas é sua configuração tridimensional, ou o resultado do arranjo da biomolécula quando vista em três dimensões.

Algumas moléculas, quando comparadas, podem ser chamadas de '''estereoisômeros. '''Neste caso, elas possuem a mesma estrutura linear, mas relações espaciais entre os átomos é diferente.

Quando um átomo de carbono possui quatro ligantes diferentes, ele é chamado de carbono quiral, e a estrutura como um todo é chamada de centro quiral.

Quando falamos em configuração de uma molécula, nos referimos a organização espacial promovida pela presença de duplas ligações que não permitem rotação ou pela presença de centros quirais. Assim, os chamados Isômeros de configuração não podem ser interconvertidos sem que seja quebrada uma ou mais ligações covalentes.

Isômeros geométricos ou cis-trans diferem na posição de ligantes de um carbono que participa de uma dupla ligação. Possuem propriedades químicas e biológicas distintas.

Em compostos com carbonos quirais, estereoisômeros podem ser enantiômeros (quando são imagens em espelho um do outro) ou diasteroisômeros (que não são imagens em espelho e requerem mais de um centro quiral para se formar).

Enantiômeros têm propriedades químicas, mas não biológicas, quase idênticas.

Quando produzidos quimicamente, compostos formam misturas racêmicas (termo introduzido por Pasteur), contendo quantidades iguais de enantiômeros.

Em organismos vivos, moléculas quirais normalmente estão presentes em apenas uma de suas formas.

Como exemplos, aminoácidos são encontrados na forma L, e a glicose, na forma D.

Isso ocorre porque as enzimas que sintetizam estas moléculas são estereo-específicas, por reconhecer e ligar moléculas de acordo com sua estrutura tridimensional.

A conformação é o arranjo espacial que grupos diferentes podem assumir por rotação, sem quebra de ligações.

A combinação de configuração e conformação determina a estrutura tridimensional da molécula, essencial para a sua função biológica.

Técnicas como a cristalografia de raios X e Ressonância Magnética Nuclear (NMR) permitem o estudo destass estruturas.

O NMR tem a vantagem de poder determinar também a dinâmica da molécula, ou sua variação estrutural no tempo, sua flexibilidade.

A reatividade das biomoléculas obedece às principais regras da reatividade química geral. Vamos revisar alguns destes conceitos antes de analisar os principais tipos de reações bioquímicas.

A força de uma ligação reflete a energia necessária para quebrá-la, medida em joules ou calorias, e depende da eletronegatividade (ou afinidade por elétrons) dos elementos ligantes, o número de elétrons compartilhados, a distância dos elétrons ligantes dos núcleos e as cargas nucleares.

Quando ligações são quebradas e formadas em reações biológicas, a diferença de energia liberada do sistema corresponde aproximadamente à variação entálpica (ΔH) desta reação.

Em reações endotérmicas o sistema absorve calor; enquanto reações exotérmicas o liberam.

A variação entálpica, junto com a temperatura e variações entrópicas, determinam a variação de energia livre e espontaneidade de reações.

Existem milhares de reações que ocorrem no ambiente intracelular, mas a maioria se enquadra em alguns tipos básicos de reações, que ocorrem por mecanismos parecidos.

Nas reações de óxido-redução ocorrem transferências de elétrons de um composto para o outro. Átomos de carbono podem existir em cinco formas progressivamente mais oxidadas: alcanos, álcoois, aldeídos, ácidos carboxílicos e dióxido de carbono.

Nota-se que o dióxido de carbono, produto da oxidação da maioria dos nutrientes pelo metabolismo oxidativo, é a forma mais oxidada que uma molécula orgânica pode assumir.

As desidrogenases catalisam transferências de dois elétrons e dois átomos de hidrogênio entre moléculas, enquanto as oxidases e oxigenases catalisam reações com formação de uma ligação covalente entre carbono e oxigênio.

Em todas estas reações, enquanto composto é oxidado, outro é reduzido. Em geral, as oxidações liberam grande quantidade de energia, e são a fonte principal de energia para fomentar a síntese de moléculas orgânicas e organização da vida.

Exemplos típicos deste tipo de reação são catalisados pela lactato e piruvato desidrogenases.

Estas enzimas utilizam o NAD+ como aceptor de elétrons. Outros aceptores comuns são o FAD e o NADP+.

Em reações de substituição nucleofílica, há quebra heterolítica de uma ligação, com substituição do grupo nucleofílico.

A reação pode ocorrer por dois mecanismos: no primeiro, o nucleófilo deixa a biomolécula antes da participação do substituinte, no segundo, o substituinte ataca a molécula original, forçando a saída do nucleófilo.

Na reação catalisada pela aldolase, a substituição nucleofílica é utilizada para formar uma ligação carbono-carbono, numa reação reversível.

Moléculas podem ser também degradadas por hidrólise, em que a água é o nucleófilo que ataca a ligação.

Grupos funcionais que podem participar como nucleófilos incluem a água, íon hidróxido, hidroxilas, sulfidrilas, aminos, imidazóis e fosfato.

Estes últimos são nucleófilos fracos, e agem bem como grupos de saída. O fosforil é um grupo de saída de centenas de reações metabólicas.

O fosfato inorgânico, por apresentar o fósforo central com polaridade mais positiva que os oxigênios periféricos, pode agir como eletrófilo.

A transferência de grupos fosforil entre moléculas é realizada por quinases. A forsforilação de resíduos de serina, treonina e tirosina por proteínas quinases são também exemplos deste tipo de reação.

Reações de rearranjo intramolecular envolvem redistribuição de elétrons, resultando em isomerização, transposição de duplas ligações e rearranjos cis-trans.

Um exemplo é a reação de transformação de glicose 6 P em frutose 6 fosfato pela fosfohexose isomerase.

Esta reação envolve um grupo básico (B1) da enzima que retira um próton do carbono 2 da G6P, formando uma dupla ligação temporária, que leva à abstração de um próton de um segundo grupo básico (B2) da enzima pelo O do C 1.

Em seguida, B2 abstrai um próton do carbono 2, formando uma nova dupla ligação em C 2 e levando à doação de um próton da dupla ligação temporária para B1.

Uma porção significativa das biomoléculas são macromoléculas, polímeros de alta massa molecular formados a partir de precursores relativamente simples, como aminoácidos (que compõe proteínas), sacarídeos (que compõe polissacarídeos) e nucleotídeos (que compõe ácidos nucléicos).

As macromoléculas podem ainda se organizar em complexos supramoleculares, como o ribossomo.

As proteínas são o tipo de macromolécula mais abundante. Podem agir como enzimas, elementos estruturais, receptores e transportadores.

Os ácidos nucléicos DNA e RNA armazenam e transmitem a informação genética.

Polissacarídeos são utilizados como fonte de energia e elementos estruturais extracelulares. Oligossacarídeos podem também participar de mecanismos de sinalização e reconhecimento.

Os lipídeos (que isoladamente não são classificados como macromoléculas por apresentar tamanho mais restrito), participam da formação de membranas, servem como fonte energética, pigmentos e sinais intracelulares.

Todas essas classes de biomoléculas podem ser sintetizadas no ambiente intracelular por reações de condensação e quebradas por hidrolise.

A presença de um número relativamente pequeno de monômeros nos principais tipos de macromoléculas facilita seu estudo.

É a combinação destes monômeros em inúmeras seqüências únicas que fornece a elas a capacidade de assumir diferentes funções e guardas informações distintas.

Há vinte aminoácidos naturais diferentes, todos contendo um grupo amino (ou imino, no caso da prolina) e carboxil no mesmo carbono, o Cα.

A diferença entre estes aminoácidos ocorre apenas nas cadeias laterais.

Há oito tipos de nucleotídeos, quatro no DNA e quatro no RNA, todos com uma base orgânica nitrogenada, uma pentose e um fosfato.

Os lipídeos geralmente contêm pelo menos um ácido graxo de cadeia longa derivado do ácido palmítico ou oléico.

É comum também a presença de um álcool como o glicerol e fosfato.

Os polissacarídeos mais abundantes são polímeros de D-glicose e outros monossacarídeos derivados. Deste modo, menos de 50 compostos orgânicos simples formam a maioria das biomoléculas.

A condensação espontânea de monômeros, formando macromoléculas, é um processo extremamente improvável, pois representa um aumento de ordenação do universo.

A desordem, ou entropia (S), do universo tende a aumentar, de acordo com a segunda lei da termodinâmica.

Reações de condensação também tendem a aumentar a entalpia (H) do sistema, por aumentar o número de ligações.

A variação de energia livre (ΔG) de uma reação é definida por ΔG = ΔH – TΔS, onde T é a temperatura absoluta.

Sendo assim, a síntese de macromoléculas só pode ocorrer à temperatura constante se for fornecida energia ao sistema. Esta energia geralmente vem de reações de hidrólise de ligações de fosfanidridos acopladas à síntese.

HAKUNA MATATA <3

Aminoácidos, peptídeos e proteínas
sdAs proteínas são as biomoléculas mais abundantes. São formadas pela polimerização de aminoácidos, através da ligação covalente entre resíduos desidratados destes. A hidrólise de proteínas gera 20 tipos diferentes de aminoácidos padrão, designados por nomes comuns muitas vezes derivados da primeira fonte em que foram identificados. Todos os 20 aminoácidos naturais são α aminoácidos, apresentando o grupo carboxil e amino ligado ao mesmo carbono (o carbono α). Eles diferem por suas cadeias laterais, os grupos R.

Em todos os aminoácidos padrão menos a glicina, o carbono α se encontra ligado a quatro grupos diferentes: carboxil, amino, hidrogênio e R, tornando o carbono α um centro quiral. Deste modo, os aminoácidos podem ter configurações espaciais não passíveis de sobreposição, como imagens em espelho, enantiômeros entre si. Baseado na comparação dos substituintes do gliceraldeído, Fischer propôs que a configuração fosse designada como D ou L, de modo independente da propriedade ótica destes (d, dextrógira ou l, levógira). Os resíduos de aminoácidos que compõem proteínas são exclusivamente L aminoácidos. D-aminoácidos são encontrados raramente na natureza, geralmente fazendo parte de paredes celulares bacterianas, e são gerados por modificação pós-traducional.

Os aminoácidos são classificados pelas características de seus grupos R. Aminoácidos apolares ou hidrofóbicos incluem a glicina, alanina, valina, leucina, metionina e isoleucina (com cadeias alifáticas) e fenilalanina, tirosina e triptofano (com cadeias aromáticas). Aminoácidos polares sem carga incluem a serina, treonina, cisteína, prolina, asparagina e glutamina. Lisina, arginina e histidina são os aminoácidos com carga positiva, enquanto aspartato e glutamato têm carga negativa. Claramente, esta classificação é feita por conveniência, é há alguns pontos questionáveis: a cadeia lateral da glicina é tão pequena que tem muito baixa hidrofobicidade; tirosina e triptofano possuem alguma polaridade; e alguns aminoácidos classificados como polares sem carga pode apresentar carga em determinados pHs, mas não na maior parte dos micro-ambientes celulares.

Alguns aminoácidos possuem características especiais interessantes. Os aminoácidos aromáticos são capazes de absorver luz UV, uma propriedade muito utilizada para quantificar proteínas em solução. A cisteína pode realizar ligações covalentes com outros resíduos de cisteína, o único tipo de ligação covalente fora a ligação peptídica encontrado comumente em proteínas. A hisitidina é capaz de se protonar reversivelmente com variações fisiológicas de pH.

Além dos 20 aminoácidos padrão, algumas proteínas contêm outros aminoácidos formados por modificações pós-traducionais. Alguns exemplos são a hidroxiprolina e hidroxilisina, formadas a partir de prolina e lisina, respectivamente. Estes aminoácidos são importantes para a estrutura do colágeno, pois permitem a realização de mais pontes de hidrogênio. O carboxiglutamato, formado a partir do glutamato, está presente na protrombina e age como ponto de interação com íons Ca2+.

Existem também aminoácidos encontrados em organismos vivos que não formam proteínas. A ornitina e citrulina, componentes do ciclo da uréia, são exemplos. Além disto, derivados de aminoácidos agem como neurotransmissores, pigmentos e hormônios.

Aminoácidos que não possuem grupos R ionizáveis apresentam uma curva de titulação característica com dois patamares em torno dos pKas do grupo amino e carboxil. O grupo carboxil possui pKa em torno de 2, enquanto o grupo amino possui pKa ~ 9. Em solução a pH = 7, os aminoácidos livres existem na forma zwiteriônica, com duas cargas opostas, podendo agir tanto como aceptor quanto doador de prótons. Esta característica de agir como ácido ou base é denominada amfotérica. Aminoácidos com grupos R ionizáveis apresentam 3 patamares nas suas curvas de calibração, sendo um correspondente à protonação do grupo R. Muitas vezes é possível diferenciar os aminoácidos por suas curvas de calibração e pelo pKa do grupo R. Quando agem como resíduos em proteínas, apenas os grupos R ionizáveis e os grupos carboxil e amino terminais influenciam a curva de calibração.

Dois aminoácidos podem ser ligados covalentemente através da ligação peptídica, com desidratação do grupo caboxil de um e amino do outro, formando um dipeptídeo. A hidrólise da ligação peptídica é um processo exergônico, mas possui alta energia de ativação, o que a faz bastante lenta espontaneamente: a meia vida natural de uma ligação peptídica é de cerca de sete anos. A ligação seqüencial de alguns peptídeos forma um oligopeptídeo, enquanto vários aminoácidos ligados formam um polipeptídeo. Cada um destes possui um carbono ∝ com grupo amino livre (N terminal) e um carbono ∝ com grupo carboxil livre (C terminal). As características iônicas dos peptídeos, que incluem os grupos C e N terminais mais os resíduos ionizáveis, podem ser utilizadas para separação e caracterização de peptídeos, como veremos em detalhes abaixo.

Os peptídeos naturais variam muito em tamanho, contendo entre dois e milhares de resíduos. Vários peptídeos pequenos têm importantes funções biológicas, sendo ativos em baixas concentrações. Vários agem como hormônios, como a ocitocina e bradicinina, que contém nove resíduos cada, insulina, com 51 resíduos em duas cadeias distintas e glucagon, com 29 resíduos.

As proteínas podem ter cadeias de milhares de aminoácidos, e freqüentemente possuem mais de uma cadeia polipeptídica, sendo cada uma conhecida como uma subunidade. Proteínas com subunidades idênticas são conhecidas como oligoméricas, e cada subunidade é denominada um protômero.

O número de resíduos de uma proteína pode ser estimado dividindo sua massa molecular por 110, a média das massas de aminoácidos individuais, levando em consideração sua abundância. A abundância de cada aminoácido varia bastante de uma proteína para outra, mas de modo geral, os aminoácidos de menor massa são mais comuns. Além de aminoácidos, algumas proteínas contêm outros componentes químicos, ou grupos prostéticos, que comumente possuem papéis importantes na função protéica.

Para facilitar o estudo da estrutura de proteínas, esta é descrita em quatro níveis hierárquicos. A estrutura primária descreve as ligações covalentes que determinam a seqüência de aminoácidos das cadeias polipeptídicas. A estrutura secundária descreve arranjos estruturais específicos, recorrentes e bastante estáveis destes resíduos de aminoácidos. A estrutura terceária descreve o dobramento tridimensional da proteína, enquanto a estrutura quaternária descreve interações entre diferentes subunidades protéicas.

Para estudar melhor a estrutura e função de proteínas, estas devem ser separadas umas das outras através do uso de técnicas de separação. A química de proteínas é uma disciplina clássica da Bioquímica, que continua sendo de extremo interesse. A fonte principal de proteínas é um extrato (homogenato) de tecido ou células, contendo milhares de proteínas e outras biomoléculas. Frações sub-celulares ou organelas específicas podem ser separadas deste extrato através de centrifugação diferencial. A proteína específica pode então ser separada por vários passos de fracionamento, em que se separa as moléculas com determinadas solubilidades em diferentes condições de pH, temperatura, concentração iônica ou outros fatores.

A adição de sal em baixas concentrações pode favorecer a dissolução de proteínas (salting in), enquanto quantidades maiores promovem sua separação (salting out). Como a concentração de sal em que isso ocorre em um determinado pH é uma propriedade intrínseca de cada proteína, pode-se utilizar esta técnica para purificar frações. A diálise permite separar proteínas se sais em que estão dissolvidos, ou de proteínas pequenas, deixando estas partículas passar por uma membrana semi-permeável para um líquido de lavagem exterior.

A cromatografia é um dos métodos mais poderosos de separação de proteínas. Consiste em passar a suspensão por uma coluna contendo material poroso com características físicas e químicas específicas (a fase estacionária), lavando-a com uma fase estacionária, que pode ser modificada com o passar do fracionamento. Os três tipos mais comuns de cromatografia são: (1) de exclusão (ou filtração em gel), em que a fase estacionária contém poros de tamanho determinado que retém proteínas menores e permitem a passagem de maiores; (2) de troca iônica, em que a fase estacionária está ligada a grupos carregados positivamente ou negativamente, e a fase móvel normalmente utiliza um gradiente de força iônica ou pH para alterar a interação das cargas das proteínas com as cargas da fase estacionária e (3) de afinidade, em que a fase estacionária é ligada a um ligante específico da proteína a ser estudada, permitindo sua separação com alta seletividade. A resolução da cromatografia pode ser muito aumentada utilizando colunas bastante longas e alta pressão para aumentar a passagem e diminuir a difusão, como é feito na cromatografia líquida de alta pressão (HPLC).

Outra técnica que separa proteínas por suas propriedades migratórias é a eletroforese, em que as proteínas são separadas por suas propriedades migratórias em um campo elétrico. A mobilidade elétrica da proteína (μ), uma propriedade intrínseca destas, consiste na razão entre sua velocidade (V) e o potencial elétrico (E), e também na razão entre sua carga (Z) e coeficiente de fricção (f). Deste modo, a migração é função do tamanho, carga e formato da proteína. Um tipo de eletroforese muito empregada é a eletroforese em gel de poliacrilamida na presença do detergente SDS (SDS-PAGE). A presença do detergente retira o efeito de carga e forma da proteína, e a separação ocorre por massa molecular, uma técnica interessante para monitorar a presença de proteínas de massa conhecida em determinadas frações, ou para determinar a massa de proteínas desconhecidas. A focalização isoelétrica é outra técnica interessante, onde a proteína nativa migra por um gel contendo amfólitos, que se organizam de acordo com o campo elétrico. As proteínas então migram até atingir ponto no gel com pH igual a seu ponto isoelétrico, em que não possui mais carga. A combinação da focalização isoelétrica seguida de SDS-PAGE na eletroforese bidimensional permite separação de grande quantidade de proteínas, até de homogenatos totais. Esta técnica vem sendo largamente utilizada para separação de proteínas posteriormente identificadas individualmente em projetos de seqüenciamento em larga escala (proteômas).

Após os fracionamentos feitos, a fração contendo a proteína de interesse é comumente detectada por SDS-PAGE ou, quando são enzimas, por sua atividade, ou capacidade de catalisar reações. A atividade específica, ou atividade por miligrama de proteína total, é uma medida da pureza da preparação.

Tendo a proteína purificada, é possível estudar suas propriedades estruturais, que estão relacionadas a sua função. A determinação da estrutura primária pode auxiliar a entender a sua conformação estrutural, como se relaciona com outras proteínas com funções semelhantes ou de outras espécies. A maior parte das proteínas humanas tem seqüência mantida, enquanto 20-30% são polimórficas, com variáveis na população humana.

Em 1953, o mesmo ano da descrição da estrutura do DNA por Watson e Crick, Sanger descreveu a seqüência de aminoácidos da insulina. Ficou rapidamente claro que a seqüência protéica e do DNA eram relacionadas, e menos de uma década depois já se havia revelado os principais mecanismos de tradução da seqüência do DNA em aminoácidos.

Utilizando melhoramentos sobre a metodologia de Sanger, hoje se conhece milhares de seqüências protéicas. Consideram-se proteínas homólogas aquelas que são ligadas evolutivamente e geralmente exercem a mesma função em espécies diferentes. Estas proteínas têm alguns resíduos invariáveis e outros variáveis. Algumas das substituições envolvem sempre resíduos semelhantes, e são conhecidas como conservadas, enquanto em outras podem ser menos restritivas. As regiões invariáveis e conservadas estão localizadas em regiões da proteína essenciais para a manutenção de sua função. Através da análise de seqüências de proteínas homólogas, pode-se construir árvores evolutivas das espécies que as produzem, pois espécies mais distantes possuem menos resíduos iguais.

A hidrólise e determinação da composição de aminoácidos de uma proteína podem ser úteis pra identificar algumas de suas características, mas não permite a descrição de sua seqüência. Para determina a seqüência, Sanger desenvolveu o 1-fluoro-2,4-dinitrobenzeno (FDNB), que se liga ao grupo amino terminal, realizando depois a hidrólise e determinando qual resíduo (ou resíduos, no caso de haver mais de uma subunidade) se encontra nesta posição. Além do FDNB, pode-se também utilizar clorido de dansila ou dabsila.

Para se detectar o restante da seqüência da proteína, se utiliza muito a metodologia desenvolvida posteriormente por Edman, em que o grupo amino terminal reage e é removido por fenillisotiocianato, sendo identificado, e permitindo que o resto da proteína seja tratada para que o próximo aminoácido seja identificado. Este processo de degradação de Edman pode ser automado, determinando seqüências com grande precisão, desde que o polipeptídeo não seja muito longo. Neste caso, a proteína geralmente é pré-tratada com duas ou mais proteases específicas para certos aminoácidos (como a tripsina), criando segmentos mais curtos com cortes previsíveis. Os fragmentos são então seqüenciados e os resultados com diferentes proteases comparados para poder ordenar os peptídeos obtidos. Se a proteína possui pontes dissulfeto, o seqüenciamento é feito inicialmente após a redução destes, depois repetido sem este passo para determinar sua posição.

Hoje também se utiliza espectrometria de massa para determinar a seqüência de aminoácidos de proteínas de modo muito rápido. A técnica ioniza partículas em vácuo, e depois submete os íons recém-formados a campos elétricos ou magnéticos, analisado sua mobilidade, que é uma função da razão massa/carga. Para analisar peptídeos e outras moléculas grandes, é comum colocá-los em uma matriz sólida e submetê-los a um pulso de laser antes da ionização, a espectrometria de massa MALDI. Outra técnica utilizada consiste em forçar a passagem da macromolécula de uma fase líquida para gasosa, dispersando a solução e acelerando a evaporação do solvente, a espectrometria de massa ESI (eletrospray ionizante). O peptídeo é seqüenciado por espectrometria de massa em tandem (MS/MS), em que é clivada em peptídeos menores, passado por um espectrômetro que separa os peptídeos formados. Depois cada peptídeo é fragmentado mais ainda, e passa por novo espectrômetro. Como cada peptídeo se quebra em média uma vez nesta segunda fragmentação, o espectro obtido pode ser analisado para montar a seqüência de cada peptídeo.

Além disso, o advento de técnicas de seqüenciamento de DNA e grandes bancos de dados, além de técnicas para separação de genes permite a obtenção de seqüências protéicas por meio indireto, inferido a partir do DNA. É comum hoje se obter apenas a seqüência de alguns aminoácidos da proteína em estudo, buscar o gene complementar em bancos de dados, e assim inferir o restante da estrutura primária desta proteína.

Além de poder degradar e determinar a estrutura de peptídeos, podemos também sintetizá-los, para uso como fármacos, por exemplo. Isto pode ser feito por técnicas de engenharia genética ou através da síntese química de peptídeos. Merrifield desenvolveu uma técnica prática para este fim em 1962, quando incorporou um suporte sólido (uma resina) ao peptídeo em expansão para facilitar sua separação. Cada grupo reativo onde não se deseja realizar ligações é bloqueado, por exemplo com um grupo 9-fluorenilmetoxicarbonil, para evitar reações indesejadas, e a adição de aminoácidos novos e desbloqueio do seu grupo amino é feita seqüencialmente. Este processo é hoje automado e pode gerar peptídeos de até cerca de 100 aminoácidos com bom ganho e fidelidade, no prazo de alguns dias. Notadamente, este processo se realiza no ambiente intracelular com altíssima fidelidade dentro de poucos segundos!

QUIMICA É TOP <3

Estrutura Tridimensional de Proteínas
Como a maioria das ligações entre aminoácidos permite rotação, proteínas poderiam, teoricamente, existir em um número de conformações (organizações espaciais de seus átomos) ilimitado. Porém, cada proteína apresenta uma função específica, sugerindo que assume uma estrutura tridimensional própria. Hoje, já se conhece a organização estrutural de várias proteínas, e o conhecimento nesta área confirma a hipótese de que a estrutura protéica é essencial a sua função.

De modo geral, as proteínas existem em condições biológicas em uma ou poucas conformações, sendo estas as termodinamicamente mais estáveis, com a menor energia livre de Gibbs (G). Proteínas na conformação funcional e dobrada são conhecidas como nativas, e possuem tendências específicas de manter esta conformção (estabilidade). De modo geral, a estabilidade de proteínas nativas é pequena, com um ΔG entre conformações nativas e denaturadas menor que 70 KJ/mol. A conformação denaturada da proteína é estabilizada principalmente pela entropia da proteína e por interações de seus componentes com a água. Por outro lado, a forma nativa da proteína é mantida por uma somatória de interações fracas entre os grupos protéicos, fazendo com que a conformação com menor G seja geralmente aquela com maior número de interações fracas. Porém, porque a maioria das interações fracas na proteína nativa poderia ser realizada com a água na forma denaturada, fica claro que estas não são as únicas responsáveis pela manutenção da conformação protéica.

Cada grupo protéico apolar em solução é envolvido por águas de solvatação, que apresentam uma estrutura altamente ordenada em forma de gaiola, parecida com clatratos. A forma nativa da proteína diminui a exposição de grupos hidrofóbicos, aumentando a entropia da água. Deste modo, a principal contribuição para o dobramento e manutenção da estrutura da água é seu efeito entrópico. Para viabilizar este dobramento, o centro da proteína apresenta alta compactação, com grupos carregados ou polares interagindo entre si para “neutralizar” sua polaridade no centro hidrofóbico. Há também maximização da formação de pontes de hidrogênio para evitar perdas entálpicas em relação às pontes de hidrogênio formadas com a água na proteína denaturada.

Os estudos sobre conformação de proteínas ganharam importância a partir do final da década de 1930, quando Pauling e Corey estudaram a ligação peptídica por difração de raios X e verificaram que a ligação C-N é um pouco mais curta que àquela de uma amina simples. Também viram que os átomos associados a esta ligação estavam distribuídos num único plano. Isso indicava uma ressonância (compartilhamento de elétrons) entre o oxigênio da carbonila e o nitrogênio da amida. ISo força os seis átomos do grupo peptídico a ocupar o mesmo plano, com o O do carboli e H do N da amida em trans. A falta de rotação da ligação C-N peptídica restringe o número de conformações possíveis para cada ligação peptídica. Há então rotação somente nas ligações N-Cα (φ, fi) e Cα-C (ψ, psi), transformando a cadeia polipeptídica numa série de planos rígidos com ponto de rotação comum no Cα.

Por convenção, φ e ψ são definidos em 180° quando o peptídeo está completamente estendido com todos os grupos peptídicos no mesmo plano. Vários dos ângulos destes são restritos por interferência estérica entre os átomos da ligação peptídica ou grupos laterais. Os ângulos permitidos para a maioria dos aminoácidos variam pouco, e são indicados em plots de Ramachandran.

Dentro dos ângulos permitidos, peptídeos podem se arranjar de diversas maneiras. Conformações locais de partes de polipeptídeos são conhecidas como estruturas secundárias, cujo estudo se foca principalmente em padrões de dobramento que se repetem em diferentes proteínas. As estruturas secundárias mais proeminentes, a α-hélice e folhas β, foram previstas por Pauling e Corey em 1951, e posteriormente confirmadas com a elucidação de estruturas completas de proteínas naturais.

A estrutura da α-hélice foi compreendida através de modelagem inspirada por difrações de raios X de α-queratina (hoje sabidamente formado por coiled-coils de α-hélice) feitas por Astbury na década de 1930, que mostrava uma estrutura regular com repetições a cada ~ 5,2 Å. Trata-se de uma organização em hélice em mão direita em que as ligações peptídicas se encontram no centro e as cadeias laterais se localizam para fora do cilindro formado. Cada volta da hélice é formada por 3,6 resíduos, com a periodicidade de 5,4 Å, com ψ = -45° e φ = -60°. Trata-se de uma organização muito comum em proteínas, abrangendo em média aproximadamente um quarto dos aminoácidos. Esta alta probabilidade de ocorrência se deve principalmente ao grande aproveitamento de pontes de hidrogênio, que se formam entre o H do N da ligação peptídica e O da carbonila do quarto aminoácido do lado amino-terminal da ligação.

A estabilidade e probabilidade de se formar uma α-hélice dependem das cadeias laterais dos resíduos envolvidos. Cadeias laterais volumosas com repulsão de cargas entre cadeias desestabilizam esta estrutura, assim como resíduos de prolina e glicina (o primeiro por causa de restrições à mobilidade do nitrogênio e o segundo por não ter as restrições que favorecem a α-hélice). Por outro lado, a interação entre cargas opostas ou dois grupos aromáticos com 3 resíduos de distância é freqüentemente um fator estabilizador. Nas pontas da hélice, os grupos não participam plenamente das pontes de H, mas podem ajudar a estabilizar o dipolo formado pela hélice. Os aminoácidos que são mais provavelmente encontrados em α-hélices são glutamato, metionina, alanina e leucina.

Um segundo tipo de estrutura secundária prevista por Pauling e Corey foi a folha β, em que a cadeia de aminoácidos se dispõem de modo estendido, pregueado. Cadeias de aminoácidos em folhas β se organizam lado a lado, paralelas ou antiparalelas, formando uma estrutura em folha pregueada, com pontes de hidrogênio entre as cadeias. As cadeias laterais se localizam acima e abaixo da folha, em alternância. As folhas β também dependem do tipo de aminoácido que as compõem, mas as interferências estéricas são menores. Assim, isoleucina, valina, fenilalanina, triptofano e tirosina ocorrem em folhas β com grande probabilidade. Se duas ou mais folhas estão próximas, cadeias volumosas são mais proibitivas na superfície de contato.

Em rpoteínas globulares, quase um terço dos aminoácidos fazem parte de voltas em que a cadeia muda de direção, conectando porções de folhas β ou α-hélice, por exemplo. As voltas β são um tipo particularmente comum, conectando duas fitas de folhas β antiparalelas. Nessas estruturas, prolina e glicina são comuns, pois permitem ângulos de torção proibidos na maioria dos aminoácidos.

O arranjo tridimensional dos átomos de uma proteína forma sua estrutura terciária, e é mantida por uma somatória de interações fracas e às vezes, pontes dissulfeto. Parra facilitar a descrição destas estruturas, é útil classificar as proteínas em fibrosas (com arranjo longo e chato) e globulares (com forma aproximadamente esférica).

Proteínas fibrosas geralmente têm um tipo único de estrutura secundária, são insolúveis em água e possuem função estrutural predominante. A α-queratina, encontrada na pele, cabelos e unhas, é formada por coiled-coils paralelos em mão esquera de duas α-hélices, como sugerido por Crick e Pauling. Estas estruturas se organizam em paralelo, formando cordões retorcidos de notável força. As superfícies de contato entre as hélices são formadas por resíduos hidrofóbicos, aumentando a estabilidade. Entre subunidades, pontes dissulfeto podem contribuir para aumentar a força. O número destas determina a dureza da queratina. O colágeno, encontrado em tecido conjuntivo como tendões e cartilagem, é formado por hélices em mão esquerda com três resíduos por volta, em coiled-coil contendo três cadeias polipeptídicas. É rico em prolina e hidroxiprolina, que permitem ângulos de torção menos usuais, e glicina e alanina, que permitem aproximação e compactação das cadeias. A hidroxiprolina é formada por modificação pós-traducional, e permite a formação de pontes de hidrogênio ausentes na prolina. A seda é formada por cadeias polipeptídicas em folha β, ricas em glicina e alanina, que permitem interação próxima entre as folhas.

Proteínas globulares possuem segmentos de cadeia polipeptídica dobrando sobre si mesmos, criando estruturas compactas e uma diversidade de micro-ambientes apropriados para muitas funções diferentes. A primeira proteína globular a ter a estrutura resolvida foi a mioglobina, pelo grupo de Kendrew, que possui uma cadeia polipeptídica única e um grupo prostético heme. Há predominância de α-hélices separadas por voltas e se dobrando em torno do heme. Como mostrado depois em outras proteínas, os resíduos hidrofóbicos se localizam predominantemente no interior altamente compactado da proteína, enquanto os resíduos carregados, com a exceção de dois que interagem entre si no interior da proteína, estão na superfície e hidratados. A resolução da estrutura da mioglobina confirmou várias teorias sobre a estrutura de proteínas, como a configuração planar da ligação peptídica e a existência de α-hélices.

A resolução da estrutura da mioglobina e posteriormente de centenas de outras proteínas por difração de raios X e ressonância nucelar magnética ilustra a importância destas técnicas na bioquímica moderna. A difração de raios X se baseia no padrão de raios X promovido pelos elétrons do material estudado. O baixo comprimento de onda de raios X permite a resolução ao nível de ~1 Å. O material deve estar na forma cristalina para permitir a análise da ordenação espacial de seus átomos. Algumas das proteínas fibrosas estudadas por esta técnica originalmente possuem estruturas praticamente cristalinas, mas estudos mais detalhados requerem o desenvolvimento de cristais puros de proteínas, inclusive das globulares e solúveis. Infelizmente, as técnicas de cristalização de proteínas eficazes variam enormemente de uma proteína para a outra, tornando a geração de cristais um processo um pouco empírico. Esta dificuldade tem feito a ressonância magnética nuclear uma técnica cada vez mais utilizada, pois não requer a formação de cristais protéicos. A capacidade de determinar estruturas por ressonância magnética nuclear depende basicamente da capacidade computacional de análise dos dados colhidos, que tem evoluído rapidamente, permitindo estudos de proteínas de tamanho médio. A técnica se baseia na propriedade de núcleos de certos átomos possuírem spin nuclear que gera um dipolo magnético. Quando se aplica um campo magnético forte, as molécula em solução tendem a se alinhar em orientações paralelas (baixa energia) ou antiparalelas (alta energia). A aplicação de energia leva à passagem de alguns núcleos para a forma de alta energia, gerando um espectro de absorção que pode fornecer dados sobre o tipo de núcleo e seu micro-ambiente. A técnica pode ser utilizada em duas dimensões (NOESY), para melhorar a análise de núcleos de 1H, muito abundantes mesmo nas menores macromoléculas. O NMR, além de fornecer informações sobre a estrutura de proteínas, pode também determinar aspectos dinâmicos da proteína, como movimentações de seus componentes, processos de dobramento e desdobramento.

A elucidação da estrutura de outras proteínas trouxe confirmação experimental para a existência também de folas β e de uma variedade muito grande de conformações protéicas. Em comum, todas têm um centro altamente compacto e rico em resíduos hidrofóbicos, enquanto a superfície de proteínas globulares hidrossolúveis é composta predominantemente por resíduos carregados. Para facilitar o estudo destas estruturas, se descrevem motivos ou estruturas supra-secundárias comuns, padrões estruturais compostos por segmentos mais curtos da proteína, que aparentam possuir alta estabilidade porque aparecem em muitas proteínas distintas. Um exemplo são motivos β-α-β e cantos α-α, comuns na superfície de proteínas, pois permitem a formação de duas camadas necessárias para a exclusão de água do centro hidrofóbico. A estrutura também pode ser estudada em porções globulares relativamente separadas das proteínas, os domínios. É comum domínios serem formados por resíduos adjacentes da seqüência de aminoácidos, podendo, inclusive, ser separados do resto da proteína por proteólise branda. Domínios específicos podem ser relacionados a funções semelhantes em diversas proteínas. Com base nos motivos presentes em proteínas, estas podem ser classificadas em α, β, α/β (com motivos α/β) e α + β (contendo tanto estruturas α quanto β, sem estar em alternância).

Proteínas com mais de uma subunidade possuem estrutura quaternária, que descreve a conformação relativa das diferentes subunidades. Subunidades separadas podem servir como domínios regulatórios, ou exercer ações separadas envolvidas na função central da proteína. A maioria dos multímeros (proteínas com mais de uma subunidade) possui unidades idênticas repetidas, os protômeros, que podem ser compostas por uma ou mais subunidades. O primeiro multímero a ter sua estrutura resolvida foi a hemoglobina, composta por dois protômeros, cada um com uma cadeia α e uma β, organizados em simetria rotacional cíclica (em que há um eixo de rotação) C2. Não há simetria em imagem em espelho em proteínas, pois não há proteínas naturais compostas por D-aminoácidos. Proteínas com simetria diédrica apresentam mais de um eixo de rotação, e pelo menos quatro protômeros. Outros tipos de simetria existem também, como a simetria icosaédrica da cápsula do vírus da pólio ou helical do vírus do mosaico do tabaco. A construção de proteínas grandes a partir de várias subunidades distintas tem como vantagem conservar material genético e diminuir o impacto de erros de síntese.

Como todas as proteínas são sintetizadas em cadeias lineares no ribossomo, devem existir processos levando à sua conformação final, regendo o dobramento ou naturação destas. Por outro lado, alterações no ambiente podem levar à perda de estrutura (denaturação) protéica. O calor, por exemplo, denatura por quebrar as interações fracas que mantém a proteína na sua forma nativa. É interessante notar que o efeito do calor, ácidos ou bases na estrutura de proteínas é abrupto, ou seja, o desdobramento completo é cooperativo, e é estimulado pelo início deste processo em determinada porção da proteína. A remoção do fator de denaturação em condições específicas permite a renaturação, sugerindo que a seqüência de aminoácidos contém as informações necessárias para gerar a estrutura final. Este conceito foi comprovado por Anfisen na década de 1950, promovendo a recuperação da atividade de ribonuclease denaturada por uréia e redutor após a remoção seqüencial da uréia e do redutor.

O processo de dobramento protéico não é randômico, ocorrendo em passos hierárquicos. Inicialmente pequenos focos de dobramento, geralmente segmentos de α-hélice se formam, e a formação destes propicia para dobramentos subseqüentes de estruturas cada vez maiores. Durante este processo, há diminuição da entropia da proteína, com aumento da entropia da solução, caminhando pro estado de menor energia livre. Este processo pode ser auxiliado pela presença de proteínas específicas, as chaperonas, que providenciam ambientes em que o dobramento é facilitado. As chaperoninas, um tipo de chaperona, possuem uma estrutura que engloba completamente o polipeptídeo denaturado, forçando seu dobramento com mudanças do seu microambiente de hidrofílico para hidrofóbico. O dobramento também é auxiliado pela proteína dissulfeto isomerase, que muda a posição de ligações dissulfeto, e a peptidil-prolil cis-trans isomerase, que converte ligações cis da prolina em trans, presentes em algumas moléculas.

Falhas no dobramento protéico estão relacionadas a diversas patologias como a fibrose cística e alterações do colágeno. Um exemplo marcante da importância do dobramento correto de proteínas é o príon, uma proteína normal que, quando incorretamente dobrada, promove distúrbios neurológicos. Mais fascinante é que o dobramento alterado é propiciado pela presença da proteína anormal, que é, desta maneira, uma proteína infectante. A elucidação dos mecanismos patológicos envolvidos nas doenças priônicas é um foco de grande interesse atual na comunidade científica.

BIOLOGIA É FODONA!!!

Função Protéica
Como exemplos de função protéica, iremos examinar o transporte de oxigênio, função imune e contração muscular em detalhes. Estes processos ilustram a interação entre uma proteína e ligantes, a importância da dinâmica protéica e de conformação induzida. As enzimas serão consideradas separadamente.

O oxigênio é pouco solúvel em água, não podendo ser transportado em quantidade suficiente para tecidos de mais de alguns milímetros por simples difusão. Deste modo, a existência de animais maiores depende de sistemas de transporte e fixação de O2, que não interage de modo reversível com nenhuma cadeia lateral de aminoácidos. Esta função é mediada por metais de transição como ferro (na hemoglobina, por exemplo) e cobre (na citocromo c oxidase, por exemplo). Como o ferro livre é bastante tóxico, podendo participar de reações de Fenton e gerar radicais hidroxil, por exemplo, e se oxida irreversivelmente, geralmente se encontra ligado a grupos que diminuem sua reatividade. Em organismos multicelulares, o grupo prostético heme é a forma mais comum de ligação deste íon. O heme possui um complexo orgânico anelar, a protopofirina, e um Fe2+, com seis coordenações – quatro com N do anel porfirínico e duas perpendiculares a estas. Em proteínas, uma das ligações perpendiculares do heme interage com uma histidina, que previne a conversão do Fe2+ a Fe3+. A outra ligação é o local de interação com oxigênio.

A mioglobina é uma proteína que contém um grupo heme, podendo se ligar reversivelmente a uma molécula de O2 e servindo como depósito deste gás no tecido muscular. A ligação entre a proteína mioglobina (P) e seu ligante O2 (L) possui uma constante de equilíbrio Ka = [PL]/[P][L], que mede a afinidade do ligante pela proteína. Como a concentração de O2 [L] total é pouco modificada, pode-se dizer que a proporção de sítios de ligação ocupadas, θ (teta) = pO2/(pO2 + P50), sendo P50 a pressão parcial de O2 em que metade dos sítios de ligação estão ocupados. Isto confere à saturação da mioglobina uma curva hiperbólica em relação à pressão parcial de O2. Esta proporção ocorre porque a mioglobina possui apenas um sítio de ligação e pouca mudança de afinidade por O2 com mudanças estruturais que fazem parte da sua dinâmica normal. O mesmo não é verdadeiro para a hemoglobina.

A hemoglobina é responsável pelo transporte de O2 no sangue de animais. Ao passar pelos pulmões, a fração de grupos heme ligados é maior que 0,95, baixando para menos de 0,65 no tecido periférico. Sua afinidade mais baixa por O2 em baixas tensões deste gás permitem que funcione como transportador, muitas vezes doando O2 para a mioglobina muscular, que possui maior afinidade nestas tensões.

A estrutura da hemoglobina é aproximadamente esférica, formada por 4 subunidades (2 α e 2 β) que interagem com grupos heme. Os dois tipos de subunidades são muito semelhantes entre si em relação a sua estrutura tridimensional. São também semelhantes à mioglobina, que faz também parte da família das globinas. As subunidades α1 e β1 interagem de modo bastante estável entre si, assim como a α2 e β2, enquanto a interface α1/β2 e α2/β1 envolvem apenas 19 resíduos, com predomínio de interações hidrofóbicas e pontes de hidrogênio. Estas interações se modificam quando a hemoglobina passa do seu estado R (de alta afinidade por O2) para T (baixa afinidade, mais comum em baixas tensões de O2). Durante esta transição há também aumento do espaço central entre as subunidades. Perutz propôs que estas mudanças conformacionais são causadas por alterações nas posições de aminoácidos próximos ao heme. A ligação de O2 no heme promove uma conformação mais plana deste, mudando a posição da histidina proximal e levando a todas as outras alterações da molécula. Esta mudança conformacional induzida pela ligação de O2 e que leva a maior afinidade pelo gás faz com que a hemoglobina tenha uma curva sigmóide de θ em relação à pressão parcial de O2, uma propriedade interessante para uma molécula cuja função é ligar O2 nos pulmões, onde a tensão é alta, e liberá-lo no tecido periférico, onde a pressão é baixa. Neste sentido, a hemoglobina é uma proteína alostérica (em que ligantes em um sítio afetam as propriedades de ligação em outro local da proteína) homotrópica (em que ligante e modulador são a mesma molécula.

O comportamento de ligação cooperativa de O2 na hemoglobina pode ser descrito pela equação de Hill log[θ/(1-θ)] = n logpO2 – logP50, onde n é o número de sítios de ligação. O gráfico de log pO2 versus log[θ/(1-θ)] (plot de Hill) teoricamente deveria apresentar inclinação igual a n, mas experimentalmente reflete, em geral, o grau de cooperatividade que para a hemoglobina se aproxima de 3.

Além de transportar O2, a hemoglobina também transporta H+, que pode ser gerado no tecido periférico a partir da hidratação de CO2 a bicarbonato, catalisada pela anidrase carbônica. A ligação de H+ na hemoglobina altera sua estrutura de modo a diminuir sua afinidade por O2, o efeito Bohr. Os prótons se ligam em diversas cadeias laterais da hemoglobina, sendo o mais importante a His146 das subunidades β. O CO2 também se liga à hemoglobina, no grupo amino-terminal das globinas, promovendo diminuição da afinidade por O2 por favorecer a conformação T. Ambos estes processos contribuem para a liberação de O2 nos tecidos. Por fim, outra molécula que influencia a afinidade de hemoglobina por O2 é o 2,3 bisfosfoglicerato, que possui cargas negativas que interagem com resíduos positivamente carregados da cavidade central da hemoglobina e estabiliza o estado T, aumentando a liberação de O2. Sua produção aumentada é um dos mais importantes mecanismos de adaptação a baixas tensões ambientais de O2, como ocorre a alta altitude. A hemoglobina fetal, que tem subunidades γ em vez de β possui afinidade muito menor por 2,3 bisfosfoglicerato, permitindo que mantenha afinidade mais alta por O2 que a hemoglobina materna.

A anemia falciforme é uma doença hereditária que ilustra a importância da seqüência de aminoácidos na determinação e manutenção da estrutura de proteínas. Consiste na substituição do resíduo de glutamato na posição 6 por uma valina das cadeias β, que deve ser herdado de ambos os pais para gerar sintomatologia significante. Há perda da carga negativa do glutamato, e o caráter hidrofóbico desta porção da hemoglobina resultante (hemoblobina A) a permite a polimerizar com outros resíduos de hemoglobina, gerando fibras insolúveis que levam à falcização das hemácias. A agregação é favorecida pela forma T da hemoglobina, ocorrendo em maior proporção no tecido periférico em situações como infecções e exercício, que promovem hipóxia. Esta mutação é comum na população humana, pois heterozigotos possuem resistência à infecção por malária, e, portanto, foram geneticamente selecionados em regiões onde esta doença é endêmica.

A interação entre proteínas e ligantes pode também ocorrer na ausência de grupos prostéticos, como ocorre no sistema imune, nosso segundo exemplo de função protéica. As proteínas MHC (major histocompatability complex) existem na superfície das células, e se ligam a fragmentos de proteínas degradadas no interior, expondo-as como sítios de reconhecimento de células T. Quando são expostas proteínas não-próprias, como ocorre, por exemplo, em infecções virais, elas são reconhecidas por receptores da célula T, que se liga e pode levar a célula infectada à apoptose. Estes sistemas fazem parte da resposta imune celular.

A resposta imune humoral é mediada por imunoglobulinas, proteínas solúveis produzidas por células B que se ligam a antígenos. A imunoglobulina G (IgG), a mais abundante, é composta por duas cadeias polipeptídicas pesadas e duas leves, ligadas por pontes dissulfeto e interações não covalentes que se organizam em forma de “Y”, com locais para reconhecimento do antígeno em ambas as pontas superiores. Esta porção da molécula é altamente variável, para reconhecer inúmeros antígenos. A estabilidade e especificidade da interação antígeno-anticorpo é muito utilizada para investigação laboratorial. Anticorpos podem ser utilizados em cromatografia por afinidade, por exemplo,ou em quantificações de ligantes por ELISA ou imunoblot.

O último exemplo de função protéica que vamos apresentar envolve proteínas fibrosas e mudanças de posição que levam à contração muscular. O músculo é composto principalmente por filamentos de actina e miosina. A miosina possui seis subunidades (2 leves, 4 pesadas) em foram de coiled-coil na maior extensão, com um domínio mais globular na ponta. A actina que é formada por subunidades de actina G polimerizadas em fibras. Cada actina G pode interagir com a porção mais globular da miosina. A ligação de ATP à cabeça da miosina causa sua dissociação da actina, seguida da hidrólise do ATP e mudança da conformação da cabeça da miosina, que avança em relação à actina. Há então re-associação com a actina e liberação de Pi e nova mudança conformacional, que recoloca a cabeça da miosina no ângulo original e a dissocia do ADP. Este movimento leva a actina a deslizar em relação a miosina, promovendo a contração.

Enzimas
As enzimas cumprem uma função que faz parte da definição da vida: modificam o ambiente ativamente, catalisando reações de modo eficiente e seletivo. A grande maioria das enzimas são proteínas, com exceção de algumas moléculas de RNA catalíticas, as ribozimas. Todas as enzimas dependem de sua estrutura tridimensional para funcionar, e algumas requerem cofatores (íons inorgânicos) e/ou coenzimas (complexos orgânicos ou metalorgânicos). Coenzimas ligadas fortemente à enzima são conhecidas como grupos prostéticos, e a parte protéica de enzimas com cofatores ou coenzimas é conhecida como apoenzima. O conjunto completo é uma holoenzima.

As enzimas (E) aceleram a velocidade de reações por promover um ambiente específico, seu centro ativo, em que as reações são mais favoráveis. O centro ativo contém resíduos que interagem com substrato (S) e catalisam a transformação química, formando o produto (P). A reação pode ser representada pelo equilíbrio E + S ↔ ES ↔ EP ↔ E + P. O resultado global é a transformação S ↔ P, que possui uma variação característica de energia livre (ΔG) que não é modificada pela enzima. Isto significa que enzimas não são capazes de promover reações energeticamente desfavoráveis. Porém, a velocidade em que reações favoráveis ocorrem depende da energia de ativação, necessária para passar o substrato para o estado de transição. Reações com alta energia de ativação ocorrem de maneira muito lenta, pois a probabilidade de atingir o estado de transição é baixa. As enzimas são capazes de diminuir a energia de ativação necessária, através da modificação dos passos pelos quais a reação ocorre, especificamente, pela formação dos complexos ES e EP e finalmente E + P, três reações que possuem energias de ativação menores que a reação direta. Na reação catalisada enzimaticamente, a velocidade será determinada pelo passo limitante (com maior energia de ativação), que varia de acordo com a enzima.

A capacidade de catálise das enzimas é fantástica, levando a velocidades geralmente entre 5 e 17 ordens de grandeza maior que a reação espontânea, com alta especificidade. Esta capacidade é promovida por reações intermediárias e por interações fracas entre substratos e enzimas. A energia liberada pela ligação do substrato na enzima possui um papel importante na diminuição da energia de ativação. Na realidade, a enzima possui melhor interação com o estado de transição da molécula modificada, favorecendo deste modo a reação, segundo o modelo de conformação induzida elaborado por Pauling em 1946. Este modelo veio em oposição ao modelo de chave-fechadura, em que haveria estabilização do substrato, sem catálise.

A existência do estado de transição é difícil de comprovar experimentalmente por causa de seu curto tempo de vida. Há, porém várias evidências de que este estado existe no ambiente enzimático, que ajudam a comprovar o modelo da conformação induzida. Uma evidência é que alguns grupos funcionais modificados no substrato não modificam a afinidade da enzima por este, mas alteram a velocidade de catálise e a energia liberada pela ligação na enzima, sugerindo que estes grupos interferem na formação do estado de transição, alterando a energia liberada com a formação de ES. Outra evidência é que análogos de grupos previstos para ocorrer no estado de transição freqüentemente ligam muito fortemente a enzimas, 100 a 100000 vezes melhor que o substrato. Os inibidores de protease utilizados em terapia anti-HIV foram desenvolvidos para ser análogos do estado de transição da protease do HIV, ligando-se fortemente à enzima. Por fim, anticorpos desenvolvidos contra análogos de estados de transição podem agir como catalisadores da reação em que este estado de transição era previsto, sugerindo que o sítio ativo da enzima também reconhece estas estruturas.

Ao mesmo tempo em que a energia de ligação providencia a energia para a catálise, é também o motivo para a especificidade das enzimas. Só haverá energia para catálise se o substrato for capaz de realizar as interações adequadas com a enzima. A ligação do substrato na enzima também favorece a catálise por este processo diminuir a entropia (quando há mais de um substrato) e promover desolvatação. Por fim, as alterações estruturais da enzima decorrentes da interação com o substrato (conformação induzida, proposto por Koshland em 1958) levam ao rearranjo espacial de grupos que participam da catálise.

O estudo das velocidades de reações enzimáticas e como estas se alteram com condições experimentais constitui a disciplina de cinética enzimática. Um fator essencial para a determinação de velocidade é a concentração de substrato. Para facilitar estas medidas e evitar o efeito de diminuição desta concentração com o tempo, se faz estes estudos nos seus primeiros segundos ou minutos, a velocidade inicial (Vo). Nestas condições, a velocidade de reação em função da concentração de substrato se aproxima de uma hipérbole e tende a um platô, a velocidade máxima (Vmax), que representa a condição em que quase a totalidade de enzima está na forma de complexo ES. A equação de Michaelis-Menten expressa esta curva: Vo = Vmax[S]/(Km + [S]), onde Km é a constante de Michaelis-Menten. Deriva-se da equação o fato de que Km = [S] quando Vo = Vmax/2. Graficamente, os valores da equação de Michaelis-Menten podem ser obtidos de modo prático plotando 1/[S] versus 1/Vo (plot de Lineweaver-Burk). A reta resultante tem inclinação igual a Km/Vmax, intercepta o eixo 1/Vo no valor de 1/Vmax, e o eixo 1/[S] no valor de –1/Km. A grande maioria das enzimas segue cinéticas previstas por Michaelis-Menten, com a exceção importante de enzimas regulatórias, discutidas posteriormente.

Quando a reação envolve dois ou mais substratos, a relação de Michaelis-Menten pode ser utilizada fixando-se a concentração de todos os componentes menos aquele analisado. Assim, cada substrato possui um Km característico. O plot de Lineweaver-Burk utilizando duas ou mais concentrações fixas do segundo substrato de uma reação pode fornecer informações sobre seu mecanismo: linhas paralelas representam reações de dupla troca, enquanto reações em que um complexo ternário é formado apresentam retas que se cruzam.

As enzimas podem ser inibidas por compostos fisiológicos ou fármacos de modo reversível ou irreversível. Um tipo de inibidor reversível comum são os inibidores competitivos, que se assemelham ao substrato e competem pelo seu sítio de ligação na enzima. Porque ocupam o sítio de ligação do substrato, este tipo de inibidor aumenta o Km aparente, mas não afeta a Vmax, que ainda pode ser atingida mediante aumento suficiente do substrato para tornar a concentração efetiva de inibidor inexistente. No plot de Lineweaver-Burk, na presença de um inibidor competitivo há formação de uma nova reta que intercepta o eixo 1/Vo no mesmo ponto que a reta obtida na ausência de inibidor, devido à manutenção da Vmax.

Outro tipo de inibição reversível é o incompetitivo, em que o inibidor se liga em um sítio fora do sítio ativo do complexo ES, em que há diminuição do Vmax e também do Km aparente. Os inibidores mistos são semelhantes, mas ligam tanto ES quanto E. Um inibidor classicamente descrito, o inibidor não competitivo, que diminui Vmax, mas não altera Km, dificilmente é encontrado na prática.

Inibidores irreversíveis se ligam a ou destroem grupos essenciais ao funcionamento da enzima. Podem ser fármacos poderosos, além de ferramentas úteis para estudos de vias metabólicas e função enzimática. As enzimas também possuem um pH ideal para seu funcionamento. Este pH pode indicar resíduos essenciais para o funcionamento da proteína.

Iremos agora analisar em maior detalhe a função de algumas enzimas específicas, para ilustrar alguns mecanismos de catálise. A quimiotripsina catalisa a clivagem hidrolítica de ligações peptídicas adjacentes a aminoácidos aromáticos. A reação envolve uma fase de acilação, em que a ligação peptídica é quebrada e uma ligação éster é formada entre o carbono carbonila do peptídeo e a enzima. Na fase de deacilação, esta ligação é quebrada pela ação nucleofílica do oxigênio de um resíduo de serina, que está desprotonada devido a sua interação próxima com uma histidina, que interage com um aspartato. A histidina remove o próton, de modo estabilizado pelo aspartato. O oxigênio da carbonila assume momentaneamente uma carga negativa, finalmente liberando o produto.

A hexoquinase catalisa a interconversão de frutose ou, mais comumente, glicose e Mg-ATP a Mg-ADP e frutose ou glicose 6 fosfato. O hidroxil em C6 da glicose é semelhante à água, que é altamente abundante no ambiente desta enzima e interage com o seu sítio ativo, mas a hexoquinase discrimina a água de seu substrato por grandes mudanças conformacionais induzidas com a ligação de glicose. A enzima possui forma ce “C”, com a cavidade central aberta na ausência de glicose, o que distancia os grupos ativos do substrato. A ligação de glicose e Mg-ATP promove a diminuição da cavidade central e ativa a enzima. A xilose, capaz também de promover as mudanças conformacionais da glicose, mas não de ser fosforilada, leva a um aumento de hidrólise de mg-ATP por esta enzima, reforçando a ideia de que esta enzima funciona por conformação induzida.

A enolase catalisa a desidratação de 2-fosfoglicerato a fosfoenolpiruvato na via glicolítica. Esta reação ocorre quando um resíduo de lisina abstrai um próton do C2 do 2-fosfoglicerato, de modo estimulado pela presença de Mg2+, que diminui o pKa deste grupo. Em seguida, um resíduo de glutamato doa um próton para formar H2O a partir do -OH formado no C3.

Um grupo de enzimas que merece atenção especial devido a sua importância metabólica e por não se enquadrar em cinéticas clássicas de Michaelis-Menten são as enzimas regulatórias. Estas enzimas respondem a modificações do ambiente alterando sua velocidade de catálise, determinando assim a atividade de vias metabólicas inteiras. Em geral, são as primeiras enzimas de vias metabólicas, e podem ser reguladas por moduladores alostéricos, compostos que se ligam não-covalentemente à enzima, geralmente pequenos metabólitos ou cofatores. Enzimas alostéricas apresentam alterações de forma e, portanto, de função com a ligação destes moduladores, podendo ser tanto ativadas quanto inibidas. As enzimas possuem, portanto, sítios de ligação de moduladores distintos dos sítios ativos, com afinidades distintas.

É comum um substrato e modulador serem a mesma molécula, com tendência de ligação distinta. A fosfofrutoquinase 1 liga ATP em seu sítio ativo com alta afinidade, catalisando a transformação de ATP em ADP acoplada à fosforilação de glicose 6 fosfato a glicose 1,6 bisfosfato. Também possui um sítio de ligação a ATP com baixa afinidade, que leva à inibição da atividade enzimática quando altos níveis de ATP estão presentes. Outro tipo de modulador comum é um metabólito final da via envolvida que, quando acumulado, promove retroalimentação negativa, inibindo a via que o forma.

A curva de velocidade de reação em função de substrato de enzimas alostéricas freqüentemente apresenta forma sinusoidal, com K0,5 (Não se pode falar em Km porque não são Michelianas) e Vmax claros. Isto reflete um comportamento cooperativo de enzimas que normalmente contém múltiplas subunidades, de modo similar à ligação de O2 na hemoglobina. Os moduladores alostéricos podem alterar o K0,5, a Vmax ou ambos os parâmetros.

Outro tipo de regulação importante envolve modificação covalente da enzima, das quais a fosforilação é a mais comum. Consiste em transferir um grupo fosforil a resíduos de tirosina, serina, treonina ou histidina, numa reação catalisada por proteínas quinases. A presença deste grupo carregado e volumoso altera as interações destes resíduos de aminoácidos, modificando a estrutura e função da enzima, que podem tanto ser ativadas quanto inativadas por fosforilação. Diferentes proteínas quinases reconhecem grupos fosforiláveis em diferentes seqüências consenso, podendo fosforilar várias diferentes ao mesmo tempo, ativando algumas vias e inibindo outras. Esta fosforilação pode então ser revertida por fosfatases.

Em algumas enzimas, a ativação envolve clivagem de um precursor (zimógeno) para formar o produto ativo. É o caso de muitas enzimas digestivas como tripsina e quimotripsina, que são ativadas por clivagem somente ao entrar no tubo digestivo. Este processo é irreversível, e a inibição posterior destas enzimas tem que ser realizada por proteínas inibitórias específicas. Mecanismos de clivagem são também importantes nas cascatas de coagulação e apoptose.

As enzimas regulatórias mais importantes apresentam múltiplos mcanismos de regulação descritos acima, podendo assim responder a várias modificações ambientais distintas. Para isso, apresentam estruturas tridimensionais complexas, com vários domínios e sítios de ligação distintos.

Carboidratos
Os carboidratos são a biomolécula mais abundante na Terra, e a sua oxidação é a fonte de energia química principal na maioria dos organismos que não realizam fotossíntese. Os carboidratos têm também função estrutural, como sinalizadores, e participam de sistemas de reconhecimento e adesão. Os carboidratos são na maioria polihidroxi-aldeídos ou -cetonas, com a fórmula empírica (CH2O)n, apesar de existirem vários variantes contendo outros átomos.

Os monossacarídeos, ou açúcares simples, consistem de apenas uma unidade de polihidroxi-aldeído ou -cetona, como, por exemplo, a D-glicose. Oligossacarídeos são cadeias curtas com monossacarídeos agindo como unidades, sendo os dissacarídeos os mais abundantes, como a sacarose, por exemplo. Polissacarídeos geralmente apresentam mais de 20 subunidades, podendo chegar a milhares destas, como na celulose e glicogênio. Podem ser formadas por cadeias lineares ou ramificadas, e mudam de característica de acordo com o tipo de monômero e ligações formadas.

Os monossacarídeos são aldeídos ou cetonas com um ou mais grupos hidroxil, muitas vezes ligados em centros quirais, e existem muitos estereoisômeros na natureza. São compostos sem cor, solúveis em água, que geralmente apresentam sabor adocicado. Na forma não-cíclica, possuem um carbono em ligação dupla com um oxigênio, podendo estar na ponta da molécula (aldose) ou em não (cetose). Todos os outros carbonos estão ligados ao grupo -OH. Seus nomes se referem ao número de carbonos, variando entre 3 e 7: triose, tetrose, pentose, hexose e heptose, sendo as hexoses as mais comuns na natureza.

Todos os monossacarídeos exceto a diidroxiacetona possuem centros quirais. O gliceraldeído, por exemplo, possui um centro quiral, e pode ocorrer em duas formas, D e L, enquanto açúcares com n centro quirais possuem 2n estereoisômeros. Compostos distintos do gliceraldeído são classificados como D e L por semelhança de configuração espacial de seus grupos com os do D e L gliceraldeído. Se houver mais de um centro quiral, é utilizado aquele mais distante do carbono com a carbonila. Com esta classificação, a maioria das hexoses naturais são D-hexoses. Açúcares que possuem como diferença apenas a organização de grupos em torno de um carbono quiral são conhecidos como epímeros.

Em solução aquosa, monossacarídeos com 5 ou mais carbonos ocorrem em forma cíclica predominantemente. O grupo carbonil forma uma ligação covalente com um hidroxil, formando hemiacetais ou hemicetais, que possuem um carbono quiral a mais, produzindo duas formas anoméricas, α e β. Estas configurações se interconvertem em água por mutarrotação, em que há abertura e resselamento do anel. Açúcares que formam anéis contendo seis membros são denominados piranoses, enquanto àqueles com cinco membros são furanoses. As piranoses tendem a assumir conformações retorcidas, em forma de cadeira.

Monossacarídeos podem ser oxidados com facilidade, transformando o carbonil em carboxil e agindo como agentes redutores. Este processo é amplamente utilizado no teste de Fehling para quantificar açúcares, utilizado por muito tempo pra quantificar glicose sangüínea. No caso da glicose, a reação só ocorre com o açúcar na forma não cíclica, mas como esta está em equilíbrio com a forma cíclica em solução, o ensaio pode ser utilizado com precisão.

Dissacarídeos são formados quando dois monossacarídeos são unidos covalentemente por uma ligação glicosídica, formada pela reação entre um hidroxil e o carbono anomérico de outro monossacarídeo, formando um acetal a partir de um hemiacetal e um álcool. O monossacarídeo cujo carbono anomérico participa desta reação perde sua capacidade redutora. A nomenclatura de dissacarídeos envolve tanto descrever a característica e configuração dos monossacarídeos envolvidos quanto sua configuração e posição da ligação.

A maioria dos carboidratos na natureza se encontram na forma de polímeros de alta massa molecular, os polissacarídeos ou glicanos, que podem ser homopolisacarídeos (com um tipo de monômero) ou heteropolissacarídeos. Os homopolisacarídeos podem servir como estoques para substratos que geram energia, como amido e glicogênio. Outros como a celulose, têm função estrutural. Heteropolisacarídeos estão presentes no ambiente extracelular da totalidade dos organismos. Estes carboidratos não têm tamanho fixo, pois, ao contrário das proteínas, não são sintetizados utilizando um templete.

O amido é produzido como forma de depósito na maioria das plantas, e é formado por dois tipos de polímero de glicose: a amilose, formada por cadeias de D-glicose não ramificadas em ligações α1→4, e a aminopectina, em que a D-glicose forma cadeias ramificadas contendo ligações α1→4 e α1→6.

O glicogênio é a principal forma de estocagem de carboidratos animais. Tem estrutura semelhante à amilopectina, mas maior número de ramificações, tornando-a mais compacta. Está presente em altas quantidades no fígado, onde chega a ser 7% do peso total, possui estrutura granular, e cada grânulo contém tanto glicogênio quanto as enzimas responsáveis pela sua síntese e degradação. Cada ramificação do glicogênio acaba em uma ponta não redutora, de modo que a molécula inteira possui apenas uma ponta redutora, a tornando altamente estável. As glicoses são removidas das pontas não redutoras, permitindo a liberação de várias moléculas ao mesmo tempo. Estocar glicose como glicogênio tem a vantagem de diminuir drasticamente o espaço ocupado por molécula, já que há extensa hidratação da glicose, mas não do glicogênio. Há também mais estabilidade química.

A celulose é um composto fibroso e insolúvel em água que compõe a parede celular de plantas. É composto por cadeias não ramificadas de glicose com ligações β1→4, que permite maior quantidade e força de pontes de hidrogênio, fornecendo maior rigidez ao material. Este tipo de ligação não pode ser digerido por animais, tornando a maior parte das estruturas de plantas uma fonte pobre de alimentação.

A parede celular bacteriana é composta por peptideoglicanos, um heteropolímero de N-acetilglucosamina e ácido N-acetilmurâmico em ligação β1→4, que se ligam entre si por curtas seqüências peptídicas. A lisozima possui poder antibiótico por quebrar as ligações β1→4, enquanto a penicilina impede a formação das pontes peptídicas.

A matriz celular de animais contém as glicosaminoglicanas, heteropolissacarídeos compostos por N-acetilglucosamina, N-acetilgalactosamina, ácido urônico, D-glucurônico e L-idurônico.

Muitos carboidratos são ligados a lipídeos, formando glicoconjugados, e agem na interação entre células e como sinais de reconhecimento. As proteoglicanas são compostas por cadeias de glicosaminoglicanas ligadas covalentemente a proteínas de membrana ou proteínas secretadas. Compõe a maior parte do tecido conjuntivo, como cartilagem, por exemplo, e possuem força e resistência devido às múltiplas interações não covalentes feitas entre si, com glicosaminoglicanas e proteínas. O ponto de ligação das glicosaminoglicanas na proteína são freqüentemente resíduos de serina rodeados por duas glicinas. Além de serem secretados para a matriz extracelular, proteoglicanas podem ser também inseridas em membranas pela porção protéica. Proteoglicanas podem se agragar em torno de uma molécula de ácido hialurônico, formando complexos imensos, que contribuem para a força tênsil da cartilagem.

Glicoproteínas possuem um ou mais oligossacarídeos ligados covalentemente a proteínas, em resíduos de serina, treonina ou asparagina. São encontrados na face externa da membrana plasmática, matriz extracelular e sangue, além de organelas intracelulares específicas (Golgi, grânulos de secreção e lisossomos). Possuem alta diversidade estrutural, que permitem ser utilizadas como moléculas de reconhecimento. Um exemplo é a glicoforina A da membrana de eritrócitos. A glicosilação de proteínas secretadas muda dua estrutura, por conferir um caráter altamente hidrofílico à porção modificada e pode, portanto, ser utilizada como forma de regulação da função protéica.

Glicolipídeos são lipídeos de membrana em que as cabeças polares são oligosacarídeos. Gangliosídeos são glicolipídeos de eucariotos encontrados predominantemente na face extracelular da membrana plasmática. lipopolisacarídeos são característicos da membrana externa de bactérias Gram-negativas, e alvo de grande número de anticorpos produzidos por vertebrados.

As lecitinas são proteínas que se ligam com alta afinidade e especificidade a carboidratos. Participam de uma variabilidade de processos de reconhecimento e adesão. Selectinas são um tipo de lecitina que mediam o movimento de células imunes dos capilares para o sítio de infecção, além de outros processos.

A estrutura de oligonucleotídeos é notadamente difícil de estudar, devido ao grande número de ramificações e variabilidade que podem apresentar. Porém, tanto NMR quanto espectroscopia de massa têm sido utilizadas com sucesso para este fim. Os carboidratos podem ser previamente por processos de fracionamento ou reconhecimento por lecitinas. Podem ser hidrolisados em ácido e seus monossacarídeos determinados por cromatografia. A estrutura global de oligossacarídeos intactos pode ser medida por NMR.

Lipídeos
Lipídeos são um grupo de compostos com variadas características químicas, com a propriedade comum de ser insolúveis em água. Como funções, realizam estocagem de energia, fazem parte de membranas biológicas, podem ser cofatores enzimáticos, pigmentos, hormônios e mensageiros intracelulares.

Gorduras e óleos derivados de ácidos graxos são utilizados como forma de depósito de fontes de energia quase universalmente. Os ácidos graxos são ácidos carboxílicos com cadeias de 4-36 carbonos altamente reduzidos, possuindo reações de oxidação altamente exergônicas. A cadeia carbônica pode conter zero, uma ou duas insaturações, e ser linear ou ramificada. Mais raramente, se encontram anéis de três carbonos, hidroxilas e metilas nestas cadeias.

A nomenclatura simplificada de ácidos graxos não ramificados consiste em apresentar o número de carbonos na cadeia seguido do número de insaturações, com o posicionamento das insaturações colocado em parênteses após o símbolo Δ. Assim, um ácido graxo de 20 carbonos com insaturações entre C9-C10 e C12-C13 é designado 20:2(Δ9,12). As insaturações em ácidos graxos ocorrem mais comumente entre C9-C10 e C12-C13 ou C15-C16. Raramente são conjugados, mas sim separados por uma metila. Ocorrem naturalmente em configuração cis.

As propriedades físicas de ácidos graxos variam bastante com a quantidade de insaturações e comprimento das cadeias carbônicas. É esta cadeia que confere a característica de pouca hidrosolubilidade, sendo cadeias mais longas e mais saturadas menos solúveis em água. As saturações também determinam o ponto de fusão. Ácidos graxos saturados geralmente são sólidos (como ceras) à temperatura ambiente, enquanto os insaturados são líquidos (óleos). Isto se deve a diferenças de empacotamento - as insaturações impedem o empacotamento próximo das cadeias laterais de vários ácidos graxos, impedindo sua ordenação em forma sólida.

Os triacilgliceróis (ou triglicerídeos) são formados a partir de três ácidos graxos ligados a uma molécula de glicerol. Podem ser simples, contendo apenas um tipo de ácido graxo ou mistos, com dois ou mais tipos de ácidos graxos. São moléculas apolares e essencialmente insolúveis em água, com baixas densidades e alto poder energético, servindo de depósito de energia na forma de gotículas depositadas no citosol. Na maioria dos seres humanos, os depósitos de triacilgliceróis são suficientes para manter as necessidades energéticas por meses, após serem degradados a glicerol e ácidos graxos por lipases. Os triacilgliceróis também servem como camada protetora contra traumas e baixas temperaturas, e podem auxiliar a manter as baleias em profundidades muito baixas, por se solidificar e aumentar em densidade com a diminuição da temperatura. Os tracilgrliceróis também estão presentes em vários alimentos como óleos vegetais (predominantemente insaturados) e gorduras animais (predominantemente saturados). Estão presentes também em ceras, utilizadas para várias funções incluindo lubrificação e impermeabilização.

As membranas celulares são compostas por uma dupla camada de lipídeos, que age como barreira para a passagem de água, íons e moléculas polares. Os lipídeos que compõe estas membranas possuem uma porção polar onde interagem com o meio aquoso e outra porção apolar, com que interagem entre si e criam uma barreira hidrofóbica para a passagem de moléculas hidrofílicas.

Os glicerofosfolipídeos (ou fosfoglicerídeos) são lipídeos de membrana com dois ácidos graxos ligados aos primeiros dois carbonos do glicerol, e um grupo altamente polar (como um álcool) ou carregado (como uma amina) no terceiro carbono. A fosfatidilcolina, por exemplo, possui uma colina ligada por uma ligação fosfodiester ao terceiro carbono do glicerol. Os grupos substituíntes da cabeça polar podem possuir diferentes polaridades e cargas, determinando as propriedades da superfície da membrana. Os ácidos graxos podem ser de tipos variados, mas em geral em membranas biológicas possuem ácidos graxos com cadeias entre 16 e 20 carbonos, alguns com insaturações em carbonos proximais, como C2.

Esfingolipídeos são uma classe grande de lipídeos de membrana com uma cabeça polar e duas cadeias carbônicas, mas sem glicerol. Possuem a esfingosina (um amino-álcool de cadeia longa) ou um derivado desta. A cabeça polar pode interagir por ligação fosfodiéster (tornando alguns esfingolipídeos também fosfolipídeos) ou ligação glicosídica. Alguns esfingolipídeos, as ceramidas, têm a cadeia carbônica ligada ao -NH2 do C2 da esfingosina, e são os precursores de todos as outras moléculas desta classe. As esfingomielinas, por exemplo, contém fosfocolina ou fosfoetanolamina na cabeça polar, e agem como camada de insulação para facilitar o impulso nervoso. Os glicofosfolipídeos possuem um ou mais açúcares na cabeça polar, mas não fosfato. São comuns na face extracelular da membrana plasmática. Cerebrosídeos pussuem um açúcar ligado a ceramidas, e também compõe membranas plasmáticas. Gangliosídeos são altamente complexos, com cabeças polares contendo ácido siálico.

Os fosfo e esfingolipídeos são continuamente degradados e regenerados no ambiente celular. Fosfolipases do tipo A removem um dos ácidos graxos, gerando um lisofosfolipídeo, que são degradados por lisofosfolipases. Gangliosídeos são degradados por enzimas lisossomais que removem açúcares até gerar uma ceramida. Deficiências nestas enzimas levam ao acúmulo de gangliosídeos, como na doença de Tay-Sachs, em que a falta de atividade de hexosaminidase A leva a acúmulo de gangliosídeo GM2 no cérebro e baço.

Esteróis são lipídeos estruturais presentes em células eucarióticas que contém um núcleo composto por quatro anéis fusionados, três com seis carbonos e um com cinco. Esta estrutura não permite grande rotativodade, gerando uma estrutura rígida. Um exemplo deste tipo de lipídeo é o colesterol, que além de participar da estrutura de membranas é também precursor de hormônios esteróides e sais biliares.

Um outro grupo de lipídeos, presente em menores quantidades, possui um papel ativo no metabolismo, agindo como sinais, cofatores e pigmentos. O fosfoinositol e seus derivados fosforilados podem agir como sinais. fosfoinositol 4,5 bisfosfato fica inserido na membrana plasmática até ser metabolizado pela fosfolipase C, formando inositol 1,4,5 trifosfato (que migra para o citosol) e diaciglicerol (que fica na membrana). O inositol 1,4,5 trifosfato promove a liberação de Ca2+ contido no interior do retículo endoplasmático. O Ca2+ então ativa a proteína quinase C em conjunto com o diacilglicerol, promovendo alteração de função protéica por fosforilação.

Eicosanóides são hormônios parácrinos, agindo somente nas células próximas. São derivados de ácido aracdônico (20:4(Δ5,8,11,14)) envolvidos em reprodução, inflamação, febre, dor coagulação e outras funções. As prostaglandinas são uma classe de eicosanóide que contém um anel de 5 carbonos originado a partir da cadeia de carbonos do ácido aracdônico. Estas moléculas regulam a síntese de AMPc, afetando várias funções celulares. Controlam a contração uterina, o ciclo circadiano e a elevação de temperatura e inflamação associadas à infecção, entre outras funções. Os tromboxanos são um grupo que contém um anel de seis carbonos contendo um éter. São liberadas por plaquetas para mediar a coagulação. Sua síntese é inibida por antiinflamatórios não esteróides. Os leucotrienos possuem três ligações duplas conjugadas, e são encontradas em leucócitos. Induzem à contração brônquica, sendo responsáveis pelo ataque asmático quando em excesso.

Os hormônios esteróides, derivados de esteróis, são mais polares que o colesterol e podem se mover pelo sangue ligados a proteínas carreadoras. Ao chegar ao tecido periférico penetram a membrana, atingem receptores no núcleo e promovem mudanças na expressão gênica e metabolismo.

As vitaminas lipossolúveis A, D, E e K são isoprenóides sintetizados pela condensação de vários anéis isoprenóides. A vitamina D3, ou colecalciferol, é formada na pele a partir de ação fotoquímica no 7-dehidrocolesterol, sendo depois convertida a 1, 25 dihidroxicolecalciferol no fígado e rins, e agindo na absorção de cálcio. A vitamina A, ou retinol, possui várias formas e funciona tanto como hormônio como pigmento no olho de vertebrados. Seu derivado, o ácido retinóico, regula a expressão gênica, incluindo genes que regulam o desenvolvimento da pele, sendo utilizado para tratar acne grave. A vitamina E designa um grupo de moléculas, os tocoferóis, que contém um anel aromático substituído e uma longa cadeia isoprenóide. Se associa com membranas biológicas, onde age como antioxidante, pois seu anel aromático pode reagir com radicais livres. A vitamina K possui um anel aromático que é oxidado e reduzido durante a formação de protrombina ativa.

Para estudar lipídeos, as técnicas mais empregadas envolvem a extração destes com solventes orgânicos como éter, clorofórmio, benzeno, metanol ou etanol. A cromatografia de adsorção utiliza uma fase estacionária polar, separando os lipídeos por sua afinidade pela coluna e pelo eluente, que é alterado para ter polaridade progressivamente maior. A cromatografia em camada delgada emprega o mesmo princípio. A espectrometria de massa é muito precisa na determinação do tamanho da cadeia carbônica e na posição das duplas ligações, normalmente difíceis de determinar por métodos cromatográficos.

Nucleotídeos e ácidos nucléicos
Nucleotídeos têm várias funções intracelulares: carregam ligações ricas em energia, compõe hormônios, co-fatores e neurotransmissores e são componentes dos ácidos nucléicos DNA (ácido desoxirribonucléico) e RNA (ácido ribonucléico), que carregam a informação genética.

O DNA tem como funções estocar e transmitir informações, incluindo a seqüência de aminoácidos das proteínas e de nucleotídeos do RNA intracelular. O segmento de DNA que contém, na forma de seqüências específicas de nucleotídeos, informações necessárias para produzir um produto biológico funcional é conhecido como o gene. Uma célula típica tem milhares de genes.

O RNA tem múltiplas funções. RNA ribossomal (rRNA) é componente dos ribossomos, que realizam a síntese de proteínas. RNA mensageiro (mRNA) carrega informações genéticas do gene para o ribossomo, permitindo a síntese de proteínas correspondentes. RNA de transferência (tRNA) traduz a informação do mRNA em uma seqüência característica de aminoácidos. Existem também outros tipos de RNA com funções específicas e até atividade catalítica.

Nucleotídeos têm como componentes característicos uma base nitrogenada, uma pentose e um fosfato. Na ausência de fosfato, a molécula é denominada nucleosídeo. As bases nitrogenadas podem ser purinas (adenina e guanina) ou pirimidinas (citosina, timina e uracila). As bases são ligadas em N-1 (pirimidinas) ou N-9 (purinas) numa ligação N-β-glicosil ao carbono 1´ da pentose. Por convenção, os carbonos das pentoses de nucleotídeos são marcadas por “´”, para distinguí-las dos carbonos das bases nitrogenadas. O fosfato se liga ao carbono 5´ na maioria dos nucleotídeos.

A adenina, guanina e citosina estão presentes tanto no DNA quanto no RNA. A timina está presente no DNA, enquanto a uracila é quase exclusiva ao RNA. Além destas bases, o DNA e RNA também apresentam proporções menores de outras bases, incluindo formas metiladas, hidroximetiladas e glicosiladas das bases mais comuns. Estas bases alteradas podem ter funções de regulação ou proteção do material genético.

As pentoses dos ácidos nucléicos são a 2-deoxi-D-ribose (DNA) e a D-ribose (RNA). Essas pentoses se apresentam em forma β-furanosídica, composta por um anel fechado de cinco membros que não ocupam o mesmo plano.

Os nucleotídeos podem ser ligados covalentemente entre si utilizando os grupos fosfato como “ponte”, unindo a hidroxila 5´ de um nucleotídeo ao 3´ de outro, formando a ligação fosfodiester. Ligações sucessivas formam uma macromolécula com pentoses e fosfatos alternados de um lado, de caráter hidrofílico, e bases nitrogenadas, de caráter mais hidrofóbico, do outro. As cargas negativas dos grupos fosfato em DNA eucariótico interagem com aminoácidos básicos das histonas para formar os nucleossomos, que contribuem para o empacotamento do DNA.

A regularidade das ligações fosfodiester confere aos ácidos nucléicos uma polaridade específica e terminações com grupos 3´ e 5´ sem ligações com outro nucleotídeo. A seqüência de nucleotídeos de um ácido nucléico pode ser representada esquematicamente, por convenção, da ponta 5´ para a 3´. O início da seqüência é freqüentemente marcado por “p” de fosfato. Seqüências curtas (~ < 50) são chamadas de oligonucleotídeos, enquanto as mais longas são conhecidas como polinucleotídeos.

As purinas e pirimidinas livres têm caráter levemente básico, o que lhes concede o nome de bases nitrogenadas. Tanto purinas como pirimidinas têm estrutura razoavelmente plana, e várias ligações em ressonância nos anéis. As bases livres podem existir em duas ou mais formas tautoméricas, dependendo do pH. Esta ressonância faz com que as bases absorvam luz UV próximo a 260 nm.

As bases nitrogenadas, por apresentar caráter mais apolar, tendem a interagir melhor entre si, se posicionando com seus anéis paralelos, como uma pilha de moedas. A interação entre as bases de uma mesma fita envolve uma combinação de interações de van der Waals e dipolo-dipolo. Em pHs alcalinos ou ácidos, a hidrofobicidade das bases nitrogenadas diminui por causa da ionização destas, e propicia à perda da estrutura normal do DNA.

A interação entre bases de fitas distintas ocorre por pontes de hidrogênio entre grupos carbonila, nitrogênio dos anéis e aminas extracíclicas. A adenina interage especificamente com a timina através de duas pontes de hidrogênio, enquanto a guanina interage especificamente com a citosina através de três pontes de hidrogênio. Esta complementaridade entre pares de bases permite a formação de DNA e RNA dupla fita. É também esta complementaridade que permite a duplicação precisa do DNA.

A estrutura primária do DNA compreende sua estrutura covalente e a seqüência de aminoácidos. A estrutura secundária do DNA compreende a interação estável entre duas fitas assumindo a forma de dupla hélice, descrita a seguir. Já a estrutura terceária do DNA compreende seu dobramento e formação de cromossomos e nucleóides.

A compreensão da estrutura e função do DNA se iniciou pelos estudos de Miescher, em 1868, que isolou uma porção ácida no material nucléico, hoje identificada como DNA. Miescher fez a hipótese que este material estava associado à herança celular, uma teoria confirmada somente em 1944 por Avery, MacLeod e McCarthy. Estes investigadores demonstraram que o DNA de uma cepa bacteriana virulenta transformava cepas não encapsuladas, que não causavam doença, em cepas virulentas encapsuladas. Em 1952, Hershey e Chase demonstraram, com fosfato e enxofre marcados, que era o DNA viral, e não a cápsula protéica, que causavam a infecção de E. coli por bacteriófagos, trazendo maior suporte à teoria de que o DNA era carregador da informação genética.

Na década de 1940, Chargaff e colaboradores estudaram a composição do DNA em maiores detalhes. Eles descobriram que as bases nitrogenadas ocorriam em quantidades diferentes em organismos distintos, mas iguais em células de diferentes tecidos de uma mesma espécie. Também demonstraram que a composição do DNA de um organismo não variava com alterações metabólicas, ambientais ou envelhecimento. Por fim, identificaram que a quantidade de adenosina e timina sempre era igual (A = T), e que a quantidade de citidina e guanosina também se igualava (C = G). Deste modo, a soma de resíduos purínicos se iguala à de pirimidinas (A + G = T + C). Estes achados seriam cruciais para a elucidação da estrutura secundária do DNA.

Para compreender melhor a estrutura tridimensional do DNA, Franklin e Wilkins fizeram análises de difração de raios X utilizando fibras de DNA isolado. No início da década de 1950, eles demonstraram que o DNA apresentava um padrão de difração característico, sugestivo de uma estrutura em hélice com duas periodicidades ao longo do eixo principal, medindo ~3,4 e 34 Å.

Watson e Crick, em 1953, utilizaram os dados de Franklin, Wilkins e Chargaff e modelos moleculares para propor uma estrutura secundária do DNA, consistindo de duas fitas antiparalelas formando uma hélice em mão direita. Neste modelo, a porção hidrofílica compreendendo os fosfatos e deoxiriboses se posicionava no exterior da molécula, enquanto as bases se direcionam pro interior da hélice, com suas estruturas hidrofóbicas e planares em contato próximo. Há a formação de dois grooves, um maior e outro menor, pelas fitas de DNA, que seriam as fontes das periodicidades visualizadas por difração de raios X. A estrutura de Watson-Crick ainda demonstrava a maior compatibilidade das interações entre A e T (com duas pontes de hidrogênio, A = T) e C e G, com três pontes de hidrogênio (C ≡ G). Assim, no modelo Watson-Crick as fitas antiparalelas de DNA apresentam complementaridade, sendo possível prever a estrutura de uma fita a partir da fita complementar. Esta propriedade é a base da capacidade de replicação do DNA. O modelo Watson-Crick foi amplamente confirmado por estudos posteriores e proporcionou um desenvolvimento notável em torno da compreensão dos mecanismos pelos quais a informação genética contida nele é processada.

Apear do modelo Watson-Crick, que identificou a forma B do DNA, ser o mais estável em condições fisiológicas, a estrutura do DNA permite bastante flexibilidade, e se encontram vários variantes no ambiente intracelular. Porém, nenhum destes variantes muda as propriedades de complementaridade, a presença de fitas antiparalelas ou os pareamentos A = T e C ≡ G. As mudanças estruturais podem ocorrer por alterações da conformação da desoxirribose, da ligação do fosfato com a desoxirribose ou da ligação da base nitrogenada com a ribose. Variantes estruturais mais comuns caracterizados são a forma A e a forma Z. A forma A do DNA é comum em ambientes pobres em água, e apresenta uma hélice mais larga e com mais bases por volta que a forma B. A forma Z do DNA apresenta uma hélice em mão esquerda, com 12 pares de bases por volta, e uma estrutura mais fina e alongada. Esta forma é propiciada por determinadas seqüências de nucleotídeos, como a alternância C/G. Já foi comprovada a existência de forma Z em DNA intracelular.

Além de variações no formato da hélice, existem variações estruturais do DNA que são dependentes da seqüência, e podem afetar a função e metabolismo do DNA próximo. Como exemplo, dobras ocorrem no DNA sempre que há quatro ou mais adenosinas, que podem ser importantes para a interação do DNA com certas proteínas. Regiões do DNA que têm repetições invertidas de seqüências de bases, conhecidas como palíndromos, são complementares a si mesmas, e tendem a formar hairpins ou crucifixos. Quando as repetições não apresentam complementaridade, como imagens em espelho, não pode haver formação destas estruturas. Há também a possibilidade de formação de posições de Hoogsteen, com mais pontes de hidrogênio entre bases que o modelo Watson-Crick, permitindo regiões de DNA com três ou quatro fitas. Estas regiões de formato diferente freqüentemente estão envolvidas com a regulação da expressão.

Como o DNA se encontra quase que exclusivamente no núcleo, enquanto a síntese de proteínas ocorre principalmente no citoplasma, algum tipo de mecanismo de transmissão da informação do DNA nuclear para o citoplasma deve existir. O RNA parece um bom candidato a esta função, pois se encontra tanto no núcleo como no citoplasma e sua quantidade aumenta quando há aumento de síntese protéica. Em 1961, Jacob e Monod propuseram que um tipo específico de RNA, o mRNA, carrega a informação genética aos ribossomos, onde funciona como templete que especifica a ordem de aminoácidos para a síntese de proteínas.

Em procariotos, um mRNA pode codificar mais que uma proteína, sendo chamada de policistrônico, enquanto mRNA que codifica para uma cadeia polipeptídica é monocistrônico. Em eucariotos, a grande maioria do mRNA é monocistrônico. Em geral, os mRNAs são um pouco maiores que três vezes o número de aminoácidos do polipeptídio que codificam, pois incluem seqüências regulatórias.

O tRNA se liga a aminoácidos covalentemente e interage com o mRNA para mediar a união de aminoácidos na síntese protéica. rRNAs são componentes do ribossomo, onde ocorre a síntese protéica. As ribozimas são RNAs com atividade catalítica. A grande riqueza de funções do RNA reflete uma variabilidade maior de sua estrutura em relação ao DNA. Esta variabilidade de estrutura ocorre porque o produto de transcrição é sempre RNA simples fita, e este se dobra de múltiplas maneiras, dependentes de sua seqüência de bases. Seqüências curtas tendem a formar uma hélice em mão direita, mantida por interações de empilhamento de bases. Estas interações são mais fortes entre purinas, que tendem a interagir mais entre si que com pirimidinas. Há também dobramento do RNA para que bases complementares (C ≡ G, A = U) formem pontes de hidrogênio com bases em outro ponto da fita, formando hairpins e outros motivos. No RNA, há também pareamento G = U e A = T, que existe ocasionalmente em RNA. A estrutura do RNA também pode ser estabilizada por pontes de hidrogênio do grupo hidroxila do carbono 2´ da ribose. Deste modo, cada RNA pode formar uma estrutura tridimensional diferente e única, como as proteínas.

Além de diferir do ponto de vista estrutural, DNA e RNA tem diferentes características químicas. Como exemplo, o DNA apresenta alta estabilidade, uma propriedade essencial para seu papel como depositório de informações genéticas. Alterações lentas de sua estrutura podem estar relacionadas a alterações fisiológicas do envelhecimento e patologias como as neoplasias.

O aquecimento de DNA a altas temperaturas leva à perda das pontes de hidrogênio entre as fitas, além de quebrar as interações das pilhas de bases, resultando na desnaturação do DNA, sem perda das ligações covalentes. Ao retornar a temperaturas mais baixas, o DNA pode facilmente se renaturar, desde que apresente alguns segmentos que mantém a interação entre as fitas. Se houver separação completa das fitas, a renaturação pode depender de colisões randômicas entre as seções pareadas ou não ocorrer. A desnaturação e renaturação do DNA podem ser acompanhadas por sua absorção UV, pois a naturação e pareamento de bases diminui sua absorção de luz (efeito hipocrômico), enquanto a desnaturação aumenta a absorção de luz UV (efeito hipercrômico).

O DNA de cada espécie possui uma tendência diferente de se denaturar quando aquecido lentamente. A temperatura característica de denaturação, ou ponto de fusão, aumenta em DNA rico em C ≡ G, que possui uma interação mais rica em energia que A = T. Utilizando técnicas cuidadosas, é possível promover a denaturação apenas de regiões do DNA que são ricas em A = T, levando à formação de “bolhas” visíveis por microscopia eletrônica. Estas regiões ricas em A = T são também pontos iniciais para a separação das fitas que ocorre com replicação e transcrição. Por motivos ainda obscuros, o ponto de fusão de RNA dupla fita ou híbridos RNA-DNA é comumente ≥ 20°C maior que o DNA.

As propriedades de desnaturação e renaturação do DNA podem ser utilizadas para encontrar regiões de DNA com características semelhantes entre espécies diferentes ou mesmo na mesma espécie. Ao misturar DNA total de uma espécie com um segmento de seqüência e função conhecidas, seguido de desnaturação e renaturação, parte do DNA total com seqüência complementar ao DNA conhecido pode gerar híbridos. Se o DNA conhecido estiver marcado de alguma maneira, é possível usar esta técnica para detectar seqüências semelhantes, com provável função parecida, no DNA total. A técnica de hibridização pode também ser usada para detectar seqüências específicas de RNA.

As bases de purinas e pirimidinas sofrem transformações químicas lentas, mas de importância fisiológica considerável, pois podem alterar a informação genética armazenada. As alterações da estrutura do DNA que produzem mudanças permanentes na informação genética codificada são conhecidas como mutações, e possuem um papel decisivo na evolução, envelhecimento e carcinogênese. A deaminação, ou perda dos grupos amino exocíclicos, é um tipo de alteração química comum. Ocorre em cerca de um a cada 107 resíduos de citidina a cada 24 h, ou cerca de 100 vezes ao dia por célula de mamífero. A deaminação da adenina e guanina é cerca de 100 vezes mais lenta.

A deaminação da citidina gera uracila, e este é o provável motivo pelo qual o DNA não contém uracila, para evitar o reconhecimento errado desta base. A uracila é rapidamente reconhecida no DNA como um produto indesejado, e eliminada por sistemas de reparo. Deste modo, a presença de timina no genoma pode ter sido um ponto evolutivo crucial para a manutenção de informação genética a longo prazo.

Outra alteração química importante do DNA é a hidrólise da ligação N-β-glicosídica entre a base e a pentose. Esta reação ocorre mais rapidamente com purinas em relação a pirimidinas. Cerca de 10.000 purinas por célula de mamífero sofrem hidrólise diariamente. No RNA, esta reação é muito mais lenta e não tem importância fisiológica.

A luz UV pode promover modificações químicas do DNA, condensando duas pirimidinas para formar um anel ciclobutano. Esta reação é mais freqüente entre dois resíduos de timidina adjacentes. Um segundo tipo de produto de condensação de pirimidinas, o fotoproduto 6-4, também pode ser formado entre pirimidinas por ação da luz UV. Como luz próxima à UV compõe boa parte da luz solar, a células da superfície corpórea estão constantemente sujeitas a mudanças químicas potencialmente carcinogênicas. A radiação gama e raios X podem levar a abertura de anéis, fragmentação das bases, e quebra das ligações fosfodiéster. Junto com a luz UV, esses tipos de radiações ionizantes promovem cerca de 10% das alterações químicas do DNA de causa ambiental.

Outras causas de alteração da estrutura do DNA podem ser agentes químicos, que se dividem em duas classes principais: Agentes que deaminam, como o ácido nitroso, e agentes alquilantes. Agentes alquilantes podem alterar certas bases do DNA, gerando produtos incapazes de se parear. Um exemplo é o dimetilsulfato, que metila a guanina a metilguanina, incapaz de interagir com a citosina.

Lesões oxidativas são provavelmente as mais importantes causas de alterações da estrutura do DNA. Espécies reativas de oxigênio podem ser geradas por irradiação ou como produtos do metabolismo aeróbico. Apesar das células possuírem um elaborado sistema de remoção destas espécies, uma fração delas pode “escapar” e lesar o DNA. Estas lesões compreendem oxidação da deoxiribose ou bases e até quebras de fitas.

Alterações na estrutura das bases também são geradas propositadamente através da ação de enzimas. Um exemplo é a metilação de resíduos de adenina e citosina, por ação de DNA metilases que utilizam S-adenosilmetionina como substrato. As metilações geralmente se encontram concentradas em certas áreas do DNA. Em bactérias, podem servir como marcadores de DNA próprio, para ajudar a identificar DNA invasor. Podem também participar de sistemas de detecção de bases erroneamente pareadas durante a replicação. Em mamíferos, a metilação chega a atingir 5% das citidinas, e inibe a migração de transposons. A metilação de citidinas pode também ter função estrutural, pois diminui a tendência de formação da forma Z do DNA.

Em 1977, Maxam-Gilbert e Sanger desenvolveram independentemente técnicas que permitem o seqüenciamento de grandes trechos de DNA. O desenvolvimento destas técnicas foi possível graças a avanços no conhecimento da estrutura do DNA e à possibilidade de se separar pedaços de DNA com apenas um nucleotídeo de diferença de tamanho. O princípio geral de ambas as técnicas consiste em criar fragmentos marcados de acordo com a posição dos quatro tipo de bases. O método de Sanger apresenta menor dificuldade técnica e hoje tem uso mais difundido. Utiliza-se dideoxinucleotídeos marcados radioativamente para interromper a replicação na posição do nucleotídeo sendo analisado, permitindo conhecer sua posição pela localização em gel, onde só aparecem as amostras marcadas radioativamente em seu lado 5’. Repetindo o experimento para cada um dos quatro tipos de bases, pode-se obter a seqüência da porção do DNA estudada. Esta técnica foi posteriormente automatizada através do uso de marcadores fluorescentes com cores distintas para cada nucleotídeo.

Outra técnica automatizada que permitiu um grande avanço em estudos moleculares foi a síntese de oligonucleotídeos, para uso como primers, por exemplo. Hoje existe metodologia que permite a síntese química de seqüências de até 100 nucleotídeos. Esta síntese se baseia nos métodos criados pelo grupo de Khorana na década de 1970, utilizando um suporte sólido sobre o qual é feita a síntese, de modo similar ao método de Merrifield para síntese de peptideos.

Além de compor os ácidos nucléicos, os nucleotídeos possuem outras funções importantes. Podem servir como carreadores de energia química intracelular, pois o grupo fosfato ligado ao hidroxil 5´ do ribonucleotídeo pode ter um ou dois fosfatos a mais ligados. A hidrólise destas ligações do tipo anidrido fosfórico fornece energia química para uma variedade grande de processos bioquímicos de cerca de 30 kJ/mol. A adenosina 5´-trifosfato (ATP) é o carreador de energia química intracelular mais comum, mas UTP, CTP e GTP também exercem estas funções.

Os nucleotídeos de adenina também compõem co-fatores de várias enzimas. A adenosina geralmente não participa diretamente da função primária, mas sua remoção costuma levar a uma redução na atividade do co-fator. Acredita-se que a adenosina possa participar modulando a energia de ligação entre a enzima e o substrato ou co-fator. Este papel da adenosina provavelmente evoluiu após a adoção do ATP como fonte predominante de energia química intracelular, aproveitando uma molécula que se tornava abundante para uma segunda função.

Nucleotídeos podem também ter função regulatória, agindo como segundos mensageiros. O nucleotídeo que mais comumente age como segundo mensageiro é a adenosina 3´,5´-monofosfato cíclica (cAMP), formada pela adenilato ciclase a partir do ATP. O cGMP também tem função de segundo mensageiro.