Universidade Federal de Viçosa

Viçosa, MG. Brasil

 

Programa Genes

 

Aplicativo computacional na área de Genética

e Estatística Experimental

 

Departamento de Biologia Geral

Viçosa, MG. 36570-00

 

 

 

 

 

Download

 

Introdução

            Para a obtenção de materiais genéticos superiores é necessário que os indivíduos selecionados reunam, simultaneamente, uma série de atributos favoráveis que lhes confiram rendimento comparativamente mais elevado e que satisfaça às exigências do consumidor. Assim, uma maneira de se aumentar a chance de êxito de um programa de melhoramento é a realização de experimentos fidedignos, dos quais são obtidos grande volume de dados experimentais. É a partir do processamento adequado destes dados que os parâmetros genéticos são estimados e os fenômenos biológicos são interpretados. Nesta etapa de análise e interpretação de resultados é fundamental a existência de recursos computacionais e aplicativos eficientes à disposição do pesquisador.

            O desenvolvimento de aplicativos na área de Genética e Melhoramento é fundamental pela sua escassez na comunidade científica. Sua disponibilidade visa atender a uma demanda crescente de usuários nas diversas instituições de pesquisa, que manipulam um grande volume de dados, os quais requerem um processamento adequado, para que parâmetros estatísticos e biológicos sejam convenientemente estimados.

            Para o caso específico da Genética verifica-se que o melhoramento intensivo de muitas espécies e a complexidade dos caracteres de maior importância têm requerido a utilização de critérios de seleção  cada vez mais apurados.  Nas diversas etapas do melhoramento os melhoristas têm a necessidade de utilizar informações, expressas em parâmetros de modelos biométricos, que normalmente não estão disponíveis nas saídas  da maioria dos softwares da a área científica.

            Assim,  foi  desenvolvido o programa GENES, com a finalidade de atender, principalmente, a área de Genética e Estatística Experimental. O software é distribuído gratuitamente para a comunidade científica.

 

 

Descrição

            O programa Genes deve ser ser utilizado sob sistema operacional Windows, sendo compatível com microcomputadores da linha IBM PC.

 

Com algumas configurações indispensáveis, tais como:

            - a resolução de vídeo de 1024 x 768 (fontes grandes 120ppp)

            - uso de símbolo decimal expresso por ponto.

 

 

Conta com 201 projetos executáveis, 131 documentos texto em formato rtf, ocupa cerca de 250Mbytes e está disponível nos idiomas inglês e português.

 

 

Fornecimento dos Dados para Processamento

Os procedimentos apresentam geralmente uma seqüência comum de análise de dados. Basicamente, o usuário fornece o nome do arquivo que contém os dados a serem processados, informa sobre os parâmetros (número de variáveis, de tratamentos, blocos etc.), fornece os nomes das variáveis (opcional) e imprime ou salva os resultados obtidos.

O fornecimento dos dados é feito via  arquivo que contenha dados em uma planilha, em que cada coluna representa determinada característica a ser analisada, e cada linha, a observação experimental. Algumas vezes, as primeiras colunas são reservadas para descrever variáveis classificatórias ou descritores de efeitos, como tratamentos, blocos, anos, locais etc.

 

 

Módulos

O programa Genes conta com os módulos de análise, descritos a seguir,  envolvendo vários procedimentos de análise biométrica.

 

1. Biometria

 

         Interação Genótipos x Ambientes:   análise de estratificação, cálculo de dissimilaridade e  correlações entre ambientes

 

         Estabilidade e Adaptabilidade: análise por métodos baseados na ANOVA (tradicional,  Plaisted e Peterson, 1959,  Wricke,1965 e  Annicchiarico,1992),  em regressão (Eberhart e Russell, 1966, Finlay e Wilkinson, 1963 e  Tai, 1971),  em regressão bissegmentada (Verma, Chahal e Murty, 1978,  Silva e Barreto, 1985 e Cruz, Torres e Vencovsky, 1989)  em análise não-paramétrica (Huehn, 1990,  análise visual e Lin e Binns,1988), em análise de fatores e  em componentes principais ou centróides.

 

            Ganhos por Seleção – Índices: cálculo de ganhos por  seleção entre famílias (univariada e índices) considerando a seleção direta e Indireta, índices clássico  de Smith,1936 e Hazel, 1943, baseado em soma de ranks  de Mulamba e Mock,1978, base  de Willians, 1962,   multiplicativo  de Subandi et al., 1973, livre de pesos e  parâmetros  de Elston, 1963,  baseado nos ganhos desejados  de Pesek e Baker, 1969 e  no Índice da distância genótipo-ideótipo). Cálculo de ganhos por seleção entre famílias por métodos univariados ou por índices restritos clássico de Smith,1936 e Hazel, 1943,  de Kempthorne e Nordskog, 1959, de Tallis,1962, de James, 1968, de Cunningham et al., 1970 e  baseado nos ganhos desejados de Pesek e Baker, 1969. Cálculo de ganho por seleção entre considerando índices sob colinearidade, de ganhos por seleção entre e dentro em experimento balanceados e desbalanceado),  por seleção entre e dentro massal e estratificada. Análide de seleção visual, seleção em vários ambientes e predição de ganhos por seleção dentro sem Informações de plantas dentro da parcela.

 

             Análise Dialélica:  Análise de dialelos balanceados (Metodologias de Griffing, 1956, de Gardner e Eberhart, 1966, de Hayman,1954 e de Cocherhan e Weir,1977, teste entre híbridos e recíprocos, predição de compostos e híbridos e de índices de família),  análise dialélica conjunta (de dialelos balanceados de Griffing, 1956, de Gardner e Eberhart, 1966, e de  dialelos parciais e circulantes),  dialelos Parciais( pelas metodologias de  Geraldi e Miranda Filho, 1988, de Miranda Filho e Geraldi,1984, de Kempthorne, 1966, de Viana et al. 1999 e 2000 e  predição de híbridos triplos e duplos). Análide de   dialelos circulantes, parciais circulantes e  desbalanceados.

              Gerações Segregantes e Não-segregantes: Teste de   escala conjunta (P1, P2, F1, F2 com inclusão facultativa de  RC1 e RC2 ) análise de experimentos de  linhas segregantes e pais em fileiras intercalares e análise de indivíduos na geração Ft e de suas  linhas Ft+1 derivadas

 

             Repetibilidade :  Análise de dados originais ou clasificados

             Seleção Combinada : análise de ensaios de famílias com dados balanceados ou desbalanceados. Análise de delianemento genético propostoso por  Comstock e Robinson (1948),   Comstock e Robinson (1948) envolvendo vários Sets

              Progresso Genético e Ambiental

             Coleção Nuclear

 

2. Análise Multivariada

 

         Componentes Principais

         Variáveis Canônicas

         Correlações Canônicas

         Análise Discriminante( pelo método propostos por  Anderson ou  baseada em componentes principais)

         Análise de Fatores

          Medidas de Dissimilaridade:  a partrir de variáveis quantitativas fenotípicas contínuas, multicategóricas ou binárias. Análise de dados moleculares originados de marcadores dominantes ou codominantes.

         Análise de Agrupamento:  Método de otimização de Tocher, hierárquicos,            dispersão gráfica e  projeção 2D e 3D. Identificação de acessos mais e menos similares      

           Importância de Caracteres: por  componentes principais ou pela  distância Generalizada de Mahalanobis e análise de variáveis canônicas

 

3. Simulação

 

         Simulação de Ensaios

         Simulação de Amostras (p populações  e v variáveis)

         Número Ótimo de Famílias

         Número Ótimo de Plantas (Amostragem Aleatória ou  Predefinida)

         Número Ótimo de Repetições ou Tamanho Ótimo de Amostra

 

4. Diversidade Genética

           Diversidade entre Acesso: baseada em variáveis fenotípicas contínuas   multicategóricas, binárias e análise de dados de marcadores dominantes  e codominantes (multialélicos).

 

            Diversidade entre Populações: Cálculo identidade genética de Nei (1972) e das distâncias euclidiana, de Rogers, Angular, de Goldstein et. al (1985) e de Hedrick.

           

           Diversidade dentro de populações: cálculo do coeficiente de endogamia e heterozigose, do índice de Shannon-Wiener e da heterozigose a partir de dados binários

 

            Diversidade entre e dentro de populações: análise descritiva, cálculo da diversidade de Nei (1973), do índice de fixação de  Wright (Dois alelos ou alelos múltiplos), da heterozigosidade de  Weir (1996). Análise de tabela de Contigência, anova da freqüência alélica (F, f e ), Amova  de Excoffier et al (1992) e análise de dados binários.

 

            Análise Discriminante: análise discriminante de Anderson, análise baseada em componentes principais ou no K vizinhos mais próximos. Análises discriminantes a partir de matrizes de dissimilaridade

 

           Coeficiente de parentesco

 

          Análise de agrupamento: pelo método de otimização de Tocher e hierárquicos,  por dispersão gráfica, por projeção 2D e 3D e análise de acessos mais e menos similares

 

          Matrizes de Dissimilaridade: cálculo da correlação e da soma entre elementos de matrizes de dissimilaridade

 

           Importância de Caracteres: considerando caracteres quantitativos fenotípicos ou informações moleculares, por meio da Manova

 

            Otimização: Análise do número ótimo de marcadores binários ou multialélicos para estudo da diversidade genética.

 

            Simulação: simulação de populações,  de cruzamentos e de amostras sob efeito da seleção divergente ou deriva genética

 

           Equilíbrio de Hardy-Weinberg: Análise de populações a partir de informações de marcadores codominante dialélico ou multialélico

 

            Desequilíbrio de Fase Gamética

 

5. Estatística Experimental

 

         Estatísticas descritivas

         Teste de Normalidade

         Análise de Variância: análise de delineamentos e esquemas inteiramente ao acaso, de experimentos com tratamentos regulares e não-regulares, em blocos ao acaso, fatorial e parcelas subdivididas. Análise de procedência/progênie/planta, látices simples e triplos e modelos hierárquicos.

         Regressões: regressão linear simples, não-linear, múltipla e polinomial,            superfície de resposta e análise por gráfico 3D.

 

         Correlações: cálculo de correlações genéticas, correlações de Pearson e de Spearman, parciais e canônicas. Análise de trilha (envolvendo 1 ou 2 cadeias) e  análise de trilha sob colinearidade.

 

         Comparação Entre Médias: Testes de Tukey, Duncan, Scheffé e Scott e Knott,  teste de Tukey  com número de repetições variável, de Dunnett,  teste t, de Tocher, teste de qui-quadrado para avaliar  hipótese, heterogeneidade e ligação Fatorial.

         Métodos de Correção de Estande

 

6. Matrizes

 

         Diagnóstico de Multicolinearidade

         Álgebra de Matrizes

         Solução do Sistema

         Solução do Sistema

 

Referências sobre o aplicativo

 

 

 

CRUZ, C. D. . Programa Genes - Análise multivariada e simulação. 1. ed. Viçosa, MG: Editora UFV, 2006. v. 1. 175 p. 

 

 

CRUZ, C. D. . Programa Genes - Biometria. 1. ed. Viçosa,MG: Editora UFV, 2006. v. 1. 382 p. 

 

 

CRUZ, C. D. . Programa Genes - Diversidade Genética. 1. ed. Viçosa, MG: Editora UFV, 2008. v. 1. 278 p.

 

 CRUZ, C. D. . Programa Genes - Estatística Experimental e Matrizes. 1. ed. Viçosa: Editora UFV, 2006. v. 1. 285 p.