MAPEAMENTO GENÉTICO

 

·        Produção: Laboratório de Bioinformática

·        Aplicativo suporte: Programa GBOL – Genética Básica on line

·        Comunidade (facebook): GbolNews


 

 

 Introdução

 Mapa Físico

 Relação entre Mapa Genético e Físico

  Populações de Mapeamento

 Marcadores Moleculares

 

INTRODUÇÃO

               O mapa genético de uma espécie é um modelo abstrato do arranjo linear de um grupo de genes ou marcadores (veja o exemplo do mapa genético do cacaueiro). Para a construção de um mapa de ligação é necessário que os genes ou marcadores sejam de herança simples. As seguintes etapas devem ser seguidas para a construção de um mapa de ligação ou mapa genético:

- Fazer teste de segregação de cada marca, constatando que as proporções estão dentro de valores esperados para a população de trabalho.

               -Estimar a freqüência de recombinação entre pares de marcadores.

               -Agrupar os marcadores em diferentes grupos de ligação.

               -Definir a ordem dos marcadores em cada grupo de ligação.

               -Estimar a freqüência de recombinação multiponto entre marcadores adjacentes.

 

MAPA FÍSICO

               Mapas físicos podem ser obtidos a partir das técnicas de bandeamento cromossômico e hibridização in-situ (mapa citogenético); pelo ordenamento de fragmentos de restrição (mapa de restrição) ou pelo seqüenciamento do genoma.

RELAÇÃO ENTRE MAPA GENÉTICO E MAPA FÍSICO

               Tanto o mapa genético pode ser utilizado para aumentar a resolução de mapas físicos, como mapas físicos podem ser utilizados para aumentar a resolução de mapas genéticos. Quando comparados, ambos devem refletir a mesma estrutura genômica, ou seja, a ordem dos marcadores deve ser a mesma (embora a distância possa variar de um mapa para outro). A informação combinada dos dois tipos de mapa é a chave para a clonagem de genes. Considerando um gene flanqueado por dois marcadores moleculares, para se chegar a seqüência do gene partindo dos marcadores, centenas de milhares de pb deverão ser seqüenciadas até se chegar ao gene. Se por outro lado for feito o mapeamento físico da região flanqueada pelos marcadores moleculares, é possível identificar os clones que contém partes do gene (pela distância estimada entre os marcadores e o gene) e seqüenciar apenas estes clones.

POPULAÇÕES DE MAPEAMENTO:

Para o mapeamento genético de plantas, diversos tipos de populações podem ser utilizadas, cada uma com características próprias, apresentando vantagens e desvantagens que devem ser levadas em consideração pelo pesquisador no memento da escolha. A escolha da população deve levar em conta os objetivos a que se propõe o pesquisador, além do tempo disponível para a execução do trabalho, e dos recursos disponíveis. As populações de mapeamento com o maior conteúdo de informação são aquelas obtidas a partir do cruzamento entre dois indivíduos homozigotos contrastantes. Nas plantas F1 obtidas, o desequilibrio de ligação é máximo, e as populações derivadas a partir destas plantas F1 procuram explorar este desequiliíbrio.

-Populações F2: obtidas por autofecundação das plantas F1 obtidas do cruzamento entre parentais endogâmicos. Nestas populações, os marcadores co-dominantes segregam na proporção 1:2:1, e os marcadores dominantes segregam na proporção 3:1. Populações híbridas, oriundas do cruzamento entre parentais heterozigotos também podem ser analisadas com F2, desde que os marcadores segreguem na proporção esperada.

-Populações derivadas por autofecundação a partir da geração F2. Em programas de melhoramento genético de plantas, são comuns populações derivadas por autofecundação, a partir da geração F2 (tais como F3, F4, etc...). Se um mesmo número de plantas F3 é obtido de cada planta F2, ou um mesmo número de plantas F4 é obtida de cada planta F3, e assim por diante, estas populações podem ser utilizadas para mapeamento genético.

-Linhagens Endogâmicas Recombinantes (Recombinant Imbreed Lines - RILs): são também populações derivadas por autofecundação a partir de uma população F2, porém as populações são avançadas até atingirem um elevado grau de homozigose, pelo método da descendência de uma única semente (SSD). Desta forma, cada planta F2 gera uma planta F3, que por sua vez gera uma planta F4 e assim por diante. Quando a população atinge a geração F6 ou F7, abrem-se linhas, que são as RILs. Desta forma, cada planta F2 é representada por uma linha endogâmica homozigota. Assim, toda a variabilidade existente na população F2 original estará representada pelas RILs, desde que um tamanho de população adequado seja utilizado. Como todos os locos estão em homozigose, a variância de uma população composta por RILs é geralmente o dobro da variância na geração F2.

-Duplo Haplóides: obtidas pela duplicação do número de cromossomos de grãos de pólen. Todos os indivíduos são homozigotos e representam a variabilidade genética encontrada no indivíduo parental que produziu os grãos de pólen.

-Retrocruzamento: são obtidas pelo cruzamento de plantas F1 com um dos progenitores. Apenas dois genótipos são obtidos (heterozigotos: Aa; e homozigotos para o progenitor recorrente: aa).

 MARCADORES MOLECULARES

Para analisar corretamente os dados moleculares, é necessário ter conhecimento de como esses dados são obtidos. Por este motivo, vamos listar as características dos marcadores moleculares atualmente mais utilizados em mapeamento genético (RFLP, RAPD, Microssatélites e AFLP).

Marcadores RFLP (Restriction Fragment Lenght Polimorphism)

               Consiste na digestão (corte) do DNA com enzimas de restrição e hibridização com sondas de DNA. O DNA digerido é submetido a eletroforese em gel de agarose. O produto deste gel é um "arraste" de DNA, pois são gerados muitos fragmentos de diferentes tamanhos. O DNA é transferido do gel para uma membrana de nitrocelulose, onde também é colocada uma sonda (fragmento de DNA) marcada, geralmente com radioatividade (também pode ser por fluorescência). A revelação é feita em filme de raio X, e apenas os fragmentos que hibridizarem com a sonda produzirão uma impressão (banda) no filme. É uma técnica relativamente complexa, que requer grande quantidade de DNA em sua execução. Possui herança co-dominante (os três genótipos de um loco podem ser identificados), mas requer conhecimento prévio do genoma para o desenvolvimento das sondas. Por ser uma técnica altamente reprodutível, e por usar sondas de DNA, permite o mapeamento comparativo. As sondas geralmente são partes de genes, e portanto esta técnica analisa regiões codificadoras do genoma.

A técnica de PCR (Polimerase Chain Reaction)

               Esta técnica consiste na síntese in vitro de fragmentos de DNA. São colocados em uma reação, juntamente com o DNA genômico, um par de "primers", os oligonucleotídios (ATP, TTP, CTP e GTP), a enzima DNA polimerase, e os co-fatores necessários para a síntese de DNA. "Primers" são pequenos fragmentos de DNA, com tamanhos que podem variar de menos de 10 até mais de 20pb, dependendo do objetivo da análise. A utilização da enzima DNA polimerase obtida da bactéria Thermophilus aquaticus (Taq DNA polimerase), que é resistente a altas temperaturas, a técnica de PCR pode ser automatizada. Para a amplificação de um fragmento de DNA são necessárias três etapas: desnaturação, anelamento e síntese. Vários ciclos contendo estas três etapas são realizados na técnica de PCR.

Marcadores moleculares derivados de PCR.

RAPD (Random Amplified Polimorphic DNA)

               Utiliza apenas um "primer" de seqüência aleatória, com 10 bases. Teoricamente é possível sintetizar 5.040 "primers", combinando os quatro em seqüências aleatórias de 10. Algumas combinações no entanto não podem ser utilizadas. Um "primer" deve conter algumas características especiais, tais como:

Nem todos os "primers" disponíveis obedecem a estas regras.

Considerando que a seqüência do genoma de uma espécie seja aleatória, um "primer" com 10 bases deve encontrar um sítios de anelamento a cada 410 pb. Para que uma região seja amplificável é necessário que o "primer" encontre dois sítios em sentido oposto em um intervalo máximo de 5000 pb. A probabilidade de que isto ocorra é:

(5.000 / 410) x (1/410) = 4,5 x 10-9

O número de bandas esperado para cada "primer" RAPD é 4,5 x 10-9 x G, onde G é o tamanho do genoma haplóide, em pb. Por exemplo, o genoma da soja possui 1,8x109 pb, e cada "primer" deve produzir em média 8,1 bandas.

Por utilizar "primers" aleatórios, o RAPD mapeia todo o genoma, e não requer conhecimento prévio do genoma (o mesmo conjunto de "primers" pode ser utilizado para diferentes espécies). Como o DNA é amplificado muitas vezes, requer quantidades mínimas de DNA. Além de ser derivada de PCR, a separação dos fragmentos é feita em gel de agarose, o que torna a técnica relativamente simples e de custo reduzido, além de poder ser automatizada. Não utiliza radiatividade, e os fragmentos são corados com Brometo de Etídio e visualizados sob luz ultra-violeta.

As desvantagens do RAPD é que a técnica nem sempre é reprodutível, a presença de uma banda na mesma posição em dois indivíduos diferentes não é garantia de que são os mesmos alelos (podem ser fragmentos do mesmo tamanho amplificados em locos diferentes), a ausência de uma determinada banda em dois indivíduos não significa que seja o mesmo alelo (apenas que ambos possuem alelo diferente daquele que é amplificado). Além disso, a técnica é dominante, ou seja, o heterozigoto possui o mesmo padrão de um dos homozigotos.

 

MICROSSATÉLITES (ou SSR - Single Sequence Repeat)

               Microssatélites são regiões do genoma que contém seqüências curtas (de 2 a 5 pb) repetidas várias vezes. As seqüências que flanqueiam estas regiões são conservadas dentro da mesma espécie, o que permite que se construam "primers" que amplifiquem, via PCR, o mesmo loco, em todos os indivíduos da espécie. Diferentemente do RAPD, para amplificar locos de microssatélites utiliza-se um par de "primers", cada um com sítio de anelamento localizado em um dos lados da região repetitiva. O polimorfismo encontrado é de tamanho de fragmentos, e é devido ao número diferente de cópias das seqüências repetitivas.

AFLP (Amplified Fragment Lenght Polimorphism)

               Esta técnica reúne a especificidade das enzimas de restrição com a praticidade do PCR. Após a digestão do DNA genômico com enzimas de restrição, são ligados adaptadores nas extremidades dos fragmentos gerados. Os adaptadores podem ser ligados, pois o corte com as enzimas de restrição produz extremidades desencontradas que são utilizadas para ligar os adaptadores. São utilizadas duas enzimas de restrição, uma de corte freqüente (o sítio de restrição possui 4 pb) e uma de corte raro (sítio de restrição com 6 pb). São gerados 3 tipos de fragmentos: a)com ambas as extremidades cortadas pela enzima de corte freqüente, b)com ambas as extremidades cortadas pela enzima de corte raro, e c)com uma extremidade cortada com cada enzima. Estes últimos são amplificados para aumentar sua freqüência na amostra de DNA a ser avaliada. "Primers" complementares aos adaptadores, e com diferenças nas 3 últimas bases da extremidade 3' são utilizados para amplificar os fragmentos de AFLP. Os "primers" possuem cerca de 20 bases, o que garante especificidade e reprodutibilidade aos resultados. Como o polimorfismo é dado pela presença ou ausência do sítio de anelamento do "primer", o resultado é observado como presença ou ausência de banda, sendo o AFLP também um marcador dominante, como o RAPD. É uma técnica sofisticada, e que envolve muitas etapas. O sítio de anelamento do "primer" é constituído das três bases da extremidade 3' do "primer" (o restante do "primer" anela no adaptador), e portanto muitas bandas são amplificadas por cada combinação de "primers". Géis de seqüenciamento devem ser utilizados na separação dos fragmentos amplificados. Utiliza radioatividade ou fluorescência para a visualização dos fragmentos.