Universidade Federal de Viçosa

Programa de Pós Graduação em Genética e Melhoramento

Mesa Redonda

                               

 

Genômica no Melhoramento

 

Prelecionistas: Cristiana Libardi Miranda

                         Samuel Mazzinghy Alvarenga

                         Janaína Oliveira Melo

                         Fernanda Abreu Santana

Moderador: Prof. Sérgio H. Brommonschenkel

 

Genômica no Melhoramento

A genômica é a ciência que estuda o genoma dos organismos a partir do seu sequenciamento completo, com o objetivo de entender a sua estrutura, organização e função. O sequenciamento do genoma de espécies animais, inclusive do genoma humano, e vegetais tem fornecido evidências para estudos de sintenia das funções gênicas. Essa ciência divide-se em estrutural, funcional e comparativa.

A genômica estrutural estuda a organização e estrutura dos genes, analisando seqüências transcritas e estruturais por meio de metodologias como marcadores de DNA e sequenciamento. O estudo das funções gênicas cabe à genômica funcional, que tenta compreender as mudanças no funcionamento do genoma em diferentes estágios do desenvolvimento e sob diferentes condições ambientais. Os estudos da função dos genes baseiam-se na construção de Bibliotecas de cDNA e em técnicas como Diferencial Display Reverse Transcriptase – PCR, Serial Analyses of Gene Expression e Microarray . Interligando e complementando esses dois estudos surge a genômica comparativa a qual busca conhecer as relações entre genomas, a homologia entre seqüências e genes, determinando o grau de sintenia de espécies correlacionadas.

Essas ferramentas moleculares proporcionam ao Melhoramento Clássico um grande avanço na busca de indivíduos geneticamente superiores por permitir que regiões ou genes que controlam características de interesse.sejam identificados.

O Melhoramento Assistido permite acompanhar a variação fenotípica das características e a localização de QTLs, genes candidatos e genes de efeito maior. Identificado o gene, é possível selecionar contra ou a favor do genótipo pré-existente, ou obter novos genótipos por meio do silenciamento ou da superexpressão de genes de interesse.

Assim, a genômica surge como uma ferramenta de grande importância para programas de melhoramento genético.

 

Bioinformática na Genômica

            A análise genômica pode ser efetuada tanto em nível de DNA (genômica estrutural), quanto de mRNA (transcriptômica). Enquanto a primeira abordagem determina-se a seqüência completa de um organismo, a segunda concentra-se na análise das seqüências transcritas  

A primeira etapa de um projeto genoma consiste no sequenciamento do DNA total ou de cDNAs. O conjunto de clones provenientes de DNA genômico é chamado de Biblioteca genômica, e a coleção de clones de cDNAs obtidos a partir de mRNAs é chamada de Biblioteca de cDNAs. As bibliotecas de cDNA podem ser construídas de acordo com o interesse de cada pesquisador. Por exemplo, pode-se construir uma biblioteca de algum tecido infectado por algum patógeno. Dessa forma será possível identificar genes envolvidos em respostas de defesa, por meio da análise das seqüências geradas a partir dessa biblioteca.

            Após o sequenciamento é necessário fazer a retirada de contaminações, numa etapa chamada de trimagem, ou trimming. Seqüências de adaptadores, vetores, rRNAs e cauda poli-A são excluídas das seqüências obtidas. Com as seqüências “limpas” prossegue-se então para a fase de montagem dos fragmentos. Os reads (seqüências geradas pelo sequenciamento) são analisados por programas de bioinformática, que fazem cálculos de sobreposições, montam os contigs (seqüências consenso), melhoram a qualidade das seqüências e fecham os gaps (espaços na seqüência).

      Depois de remontar o genoma, é preciso dar um significado biológico para todas as seqüências geradas. Nessa etapa, chamada de Anotação, é feita a comparação das seqüências obtidas com seqüências depositadas em bancos de dados; a identificação de fases abertas de leitura (ORFs); a análise de domínios protéicos na seqüência de aminoácidos deduzida a partir da seqüência de bases; a identificação de regiões regulatórias; o estabelecimento de relações filogenéticas entre a seqüência de interesse e seqüências similares de outros organismos e a identificação e análise das vias metabólicas com as quais a seqüência de interesse pode estar relacionada. Para isso, existem várias ferramentas de bioinformática disponíveis na internet de forma gratuita.

Com as seqüências anotadas pode-se avançar para a etapa de mineração de dados (Data Mining). Por meio desse processo é possível selecionar, dentre todas as seqüências geradas pelo projeto genoma, as seqüências possivelmente relacionadas com uma característica de interesse. Posteriormente, é necessário fazer a confirmação das funções atribuídas aos genes identificados com o auxílio de ferramentas da bioinformática. Aqui começa a Genômica Funcional, que agrega informações de regulação gênica e níveis de expressão aos dados já conhecidos baseando principalmente em experimentos biológicos.

 

Metodogias Utilizadas em Genômica Funcional

A genômica funcional estabelece as relações entre as seqüências de DNA e as características fenotípicas do organismo. O acúmulo de seqüências gênicas e genomas depositados em bancos de dados têm aumentado a demanda por metodologias que permitam sua análise funcional. Dentre as técnicas que podem ser utilizadas para uma análise mais eficiente e rápida de um grande número de genes simultaneamente, destacam-se: Análise da Expressão Diferenciada (Diferencial Display – DD), Análise Serial da Expressão Gênica (Serial Analysis of Gene Expression –SAGE) e Microarranjos de DNA (Microarrays).

A técnica differential display (DDRT) foi desenvolvida em 1992 por Liang e Pardee com o objetivo de comparar, identificar e isolar genes expressos em determinadas condições em vários tipos de células eucarióticas. A metodologia baseia-se na extração do RNA mensageiro (mRNA), obtenção do DNA complementar (cDNA) por meio da transcrição reversa utilizando primers oligo(dT) com uma ou duas bases ancoradas. O cDNA obtido é amplificado em uma reação de PCR (Polymerase Chain Reaction) através de primers curtos e aleatórios e utilizando desoxinucleotídeos marcados radioativamente ou com fluorescência. A visualização do resultado da amplificação geralmente é feita em gel de poliacrilamida (quando a marcação é isotópica) ou em seqüenciadores automáticos (marcação por fluorescência). Os resultados da DDRT podem ser confirmados através de Northern blot ou clonagem dos cDNAs diferencialmente expressos. A clonagem do cDNA é necessária para o porterior sequenciamento e pesquisas em bancos de dados (Liang & Pardee, 1995).

A Análise Serial da Expressão Gênica (SAGE – Serial Analysis of Gene Expression) é um método rápido e abrangente utilizado para a elucidação quantitativa da expressão gênica. A tecnologia SAGE é baseada em dois princípios: primeiro, uma seqüência curta – tag (9-11 pb) contém informação suficiente para identificar um transcrito único. Segundo, vários tags podem ser concatenados em uma única molécula e seqüenciados, resultando na caracterização de muitos tags simultaneamente. O padrão de expressão de qualquer população de transcritos pode ser quantitativamente avaliado pela abundância dos transcritos e pela identificação do gene correspondente a cada tag (Velculescu et al., 1997).

O microarray quantifica o transcriptoma de uma amostra de células comparando-as com uma amostra referência, resultando numa medida funcional da expressão gênica feita em um único experimento. O microarray corresponde a um suporte de vidro (chip) contendo milhares de clones de cDNA ou oligonucleotídeos (sondas) roboticamente imobilizados que podem ser escolhidas a partir de um banco de dados de ESTs ou de clones de cDNA disponíveis comercialmente. A hibridização é feita com as bibliotecas de cDNA controle e teste marcadas, cada uma com uma fluorescência diferente e a leitura feita por um scanner. Devido ao fato de ambas as bibliotecas de cDNA serem hibridizadas juntas, em um único chip,  genes presentes em ambas as bibliotecas competirão pela ligação à sonda. Portanto, a intensidade da fluorescência é diretamente proporcional à quantidade do gene presente em uma amostra comparada com a outra (Zachariah, G.G. & Dhanasekaran, N., 2004).

As metodologias citadas anteriormente têm sido aplicadas em análises transcricionais em humanos, fungos, animais e plantas. A utilização dessas técnicas tem contribuído para a análise global dos transcritos, o entendimento da expressão gênica diferencial, a caracterização da transcrição em células ou tecidos específicos ou em condições fisiológicas diversas (Torres et al., 2006; Matsumura et al., 1999; Whetten et al., 2001). Apesar da grande contribuição das metodologias utilizadas na análise da genômica funcional, vale ressaltar que todas elas apresentam limitações e vantagens, considerando o custo da implementação, as dificuldades de otimização, reprodutibilidade dos procedimentos laboratoriais, volume de dados gerados, etc. Portanto, a utilização de uma técnica dependerá dos objetivos da pesquisa e dos recursos disponíveis para sua implementação. Além disso, uma técnica pode ser utilizada em complementação à outra (Stein & Liang, 2002).

 

Marcadores moleculares na Genômica

Uma grande aplicação dos projetos genoma é a possibilidade de gerar novos marcadores moleculares que poderão ser de grande utilidade em diversos programas de melhoramento. Os marcadores microssatélites e SNPs (polimorfismos de uma única base, single nucleotide polymorphism) têm sido beneficiados com a era genômica, uma vez que o desenvolvimento e a identificação desses marcadores têm sido facilitado pelo sequenciamento do DNA.

Os microssatélites substituíram outros marcadores em diversos estudos genéticos, principalmente devido a sua alta reprodutibilidade, expressão codominante e multialelismo. Os projetos de sequenciamento de genomas tem ampliado a possibilidade de desenvolvimento desses marcadores. Por meio da análise das seqüências depositadas é possível  a identificação de microsatélites e o desenho dos primers de uma maneira muito mais rápida e eficiente quando comparada com a estratégia tradicional. Atualmente, os microssatélites têm sido amplamente utilizados para construção de mapas genéticos, estudos de diversidade e sintenia e seleção assistida (BAO et al., 2006).

Os SNPs são as variações mais freqüentes no genoma de qualquer organismo e correspondem a posições do DNA onde existe uma alternância dos nucleotídeos, em uma freqüência alélica mínima de 1% em uma dada população (BROOKES, 1999). Estes marcadores podem ser inicialmente identificados in silico, explorando bancos de dados públicos contendo informações de vários organismos (htpp://www.ncbi.nlm.nih.gov/) com o auxílio de ferramentas da bioinformática. Após a identificação dos SNPs, há a necessidade da validação dos dados e estudos de associação para se avaliar o potencial  informativo de cada polimorfismo. A genotipagem dos SNPs não se baseia no tamanho dos fragmentos dos alelos, e para a distinção dos mesmos podem ser utilizadas várias técnicas que exigem um grande investimento. O grande interesse na utilização do SNPs é que eles podem ser utilizados na análise de genes e na associação com características de interesse econômico da espécie. Segundo USECHE et al. (2001) os SNPs possuem grande potencial para a aplicação no melhoramento.

 

Referências:

BAO, J. S., CORKE, H. AND SUN, M. (2006). Microsatellites, single nucleotide polymorphisms and a sequence tagged site in starch-synthesizing genes in relation to starch physicochemical properties in nonwaxy rice (Oryza sativa L.). Theor Appl Genet, 113:1185–1196.

BROOKES, A.J. (1999). The essence of SNPs. Gene, 234(2):177-186.

LIANG, P. & PARDEE, A.B. (1992). Differential Display of eukaryotic messenger RNA by means of the polymerase chain reaction. Science, 257: 967-971.

LIANG, P. & PARDEE, A.B. (1995). Recent advances in differential display. Current Opinion in Immunology, 7: 274-280.

MATSUMURA, H., NIRASAWA, S. AND TERAUCHI, R. (1999). Transcript profiling in rice (Oryza sativa L.) seedlings using serial analysis of gene expression (SAGE). The Plant Journal, 20(6): 719-726.

STEIN, J. & LIANG, P. (2002). Differential Display technology: a general guide. Cellular Molecular Life Science, 59: 1235-1240.

TORRES, G.A.M., PFLIEGER, S., CORRE-MENGUY, F., MAZUBERT, C., HARTMANN, C. AND LELANDAIS-BRIÈRE, C. (2006). Identification of novel drought-related mRNAs in common beans roots by differential display RT-PCR. Plant Science, 171: 300-307.

USECHE, F., GAO, G., HARAFEY, M. AND RAFALSKI, A. (2001). High-throuphput identification, database storage and analysis of SNPs in EST sequence. Genome Informatics, 12:194-203.

VELCULESCU, V.E., ZHANG, L., ZHOU, W., VOGELSTEIN, J., BASRAI, M.A., BASSETT JR, D.E., HIETER, I.P., VOLGESTEIN, B. AND KINZLER, K.W. (1997). Characterization of the Yeast Transcriptome. Cell, 88: 243-251.

WHETTEN, R., SUN, Y.H., ZHANG, Y. AND SEDEROFF, R. (2001). Functional genomics and cell wall biosynthesis in loblolly pine. Plant Molecular Biology, 47: 275-291.

ZACHARIAH, G.G. & DHANASEKARAN, N. (2004). The Microrevolution: Applications and Impacts of Microarray Technology on Molecular Biology and Medicine. International Journal of Molecular Medicine, 13: 483-495.