Universidade Federal de Viçosa

Programa de Pós Graduação em Genética e Melhoramento

Seminário Tema Livre                              

 

JANGARELLI, Marcelo 1; EUCLYDES, Ricardo Frederico 2.

 

1 – Acadêmico do curso de Mestrado em Genética e Melhoramento / UFV (gmejanga@hotmail.com); 2 – Professor (orientador) do Departamento de Zootecnia / UFV.

 

Amostragem e Significância Estatística: Ferramentas Eficazes para Otimizar o Melhoramento Genético

 

A Estatística compreende um conjunto de técnicas e métodos de pesquisa que envolve o planejamento do experimento a ser realizado, a coleta qualificada dos dados, a inferência, o processamento, a análise e a disseminação das informações, objetivando fornecer métodos e técnicas para lidarmos, racionalmente, com situações sujeitas a incertezas. Neste contexto, o processo de amostragem e a análise estatística são de suma importância para a obtenção de inferências e elucidações a respeito de uma pesquisa.

Devido à impossibilidade de obtermos todas as informações disponíveis, podendo até mesmo ser desnecessário, os levantamentos de dados por amostragem, quando realizados seguindo rigidamente conceitos científicos, podem fornecer resultados preciosos a custos desprezíveis quando comparados aos levantamentos que tenham por alvo toda a população da pesquisa, além disso, às vezes são mais confiáveis que um censo.

A amostragem é um campo da estatística bastante sofisticado que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo de uma pequena parte de seus componentes, uma amostra. O processo de amostragem tem a finalidade de definir o tamanho de determinada amostra, baseado em informações fornecidas por uma variável base, que é uma característica medida, controlada ou manipulada numa pesquisa. Basicamente, o tamanho da amostra dependerá da variância da variável base e dos níveis de precisão exigidos.

A amplitude das conclusões de um estudo estatístico está limitada pela qualidade do processo de amostragem. Se a amostra for representativa, as conclusões que podemos tirar aplicam-se a toda população, sendo possível calcular as incertezas. Já se a amostra não for representativa, as conclusões devem limitar-se à própria amostra.

Uma amostra será representativa de uma população, em relação a um caráter / variável, se não houver qualquer razão para pensar que o valor desse caráter possa diferir da amostra para a população, sendo preciso também que todos os elementos da população tenham a mesma probabilidade de serem selecionados. Já quando a amostra é extraída da população segundo algum método de seleção, seja, por exemplo, por razões de comodidade do experimentador, esta não é representativa da população e não podemos extrair dela quaisquer conclusões relativas à população, podendo no máximo fazer indicações a cerca da população.

Desta forma, para otimizarmos qualquer fonte de pesquisa, seja da ordem Genética ou não, se faz necessário obtermos uma amostra representativa da população.

Em relação à análise estatística, sua importância consiste em determinar qual a significância / probabilidade do acaso ser responsável pelo resultado encontrado na pesquisa.

A significância estatística (nível-p) de um resultado é uma medida estimada do grau em que este resultado é "verdadeiro" (no sentido de que seja realmente o que ocorre na população, ou seja, no sentido de "representatividade da população"). Mais tecnicamente, o valor do nível-p representa um índice decrescente da confiabilidade de um resultado. Quanto mais alto o nível-p, menos se pode acreditar que a relação observada entre as variáveis na amostra é um indicador confiável da relação entre as respectivas variáveis na população. A significância depende principalmente do tamanho da amostra, se há poucas observações então haverá também poucas possibilidades de combinação dos valores das variáveis, e então, a probabilidade de obter por acaso uma combinação desses valores que indique uma forte relação é relativamente alta. Desta forma, numa amostra de animais, ao ser realizado uma seleção via marcadores moleculares, esta pode ser extremamente significante numa pequena amostra, contrapondo com uma amostra de tamanho maior, onde tais marcadores selecionados mostrar-se-ão não tão significantes ao mesmo processo de seleção, visto que, existe uma grande variabilidade de combinação entre os valores das variáveis.

Como visto, podemos dizer que a significância estatística representa a probabilidade de que um resultado similar seja obtido se toda a população fosse testada.

Para exemplificar a eficácia da “significância estatística” na otimização do Melhoramento Genético, estudos científicos foram realizados utilizando o Programa Computacional de Simulação Genética – GENESYS (EUCLYDES, 2006), objetivando mostrar que, utilizando diferentes níveis de significância para a localização / identificação e seleção de Marcadores Moleculares no Melhoramento, chegou-se a valores fenotípicos distintos ao final da seleção. Para isso, uma pesquisa utilizando a metodologia de simulação foi executada, onde foi simulado uma população de 500 aves (frango de corte), avaliando-se a característica ganho de peso, com uma herdabilidade de 0,35, onde considerou-se também, 40 cromossomos para a espécie, 100 QTL’s e 100 Marcadores Moleculares. Foram analisados quatro níveis de significância, 1%, 5%, 10% e 20% durante 10 gerações, com cinco repetições cada qual para minimizar o efeito da oscilação genética. Considerou-se um mesmo valor fenotípico inicial médio para todos os níveis, que foi de 2,763 kg. Como resultado final, após as 10 gerações de seleção por marcadores, observou-se que, para o nível de 1% de significância, chegou-se a um valor fenotípico final de aproximadamente 3,5 kg, para 5% 3,6 kg, 10% 3,7 kg e para 20% 3,8 kg (gráfico 01). Assim, podemos inferir que, apesar da escolha de um nível de significância menor proporcionar uma maior precisão nos resultados, visto que, a significância estatística representa uma medida de certeza de que o resultado obtido seja verdadeiro a nível populacional, os mesmos apresentam-se inferiores quanto ao ganho de peso após gerações de seleção, quando comparado com níveis de maior magnitude (10% e 20%), pois, de uma forma geral, os níveis de significância mais altos, aqui considerados, levaram a melhores resultados em valores fenotípicos após seleção, embora estejam mais sujeitos a erros. Tal superioridade fenotípica dos níveis de maior significância pôde ser observada já a partir da primeira geração de seleção, perpetuando no transcorrer das demais (gráfico 01). Este fato pode ser explicado em razão dos maiores níveis propiciarem um maior número de indivíduos que se enquadram à precisão exigida na pesquisa, ou seja, resulta em uma amostragem mais representativa, onde conseqüentemente uma maior variabilidade genética estará disponível para aperfeiçoar o progresso biogenético, fato esse primordial na obtenção de benfeitorias no melhoramento. É válido lembrar que, em relação ao melhoramento animal, uma certeza real dos resultados com 80 ou 90% de probabilidade, como observados para os níveis de 20% e 10% respectivamente, já são suficientes para otimizar um Programa de Melhoramento Genético.

Evidência - se a necessidade incessante de novas pesquisas nestas áreas de biotecnologia e bioestatística de modo a não nos acomodarmos, por exemplo, em adotar os “tradicionais” níveis de significância preestabelecidos (1% e 5%), visto que, existem inúmeras razões, de acordo com á área de pesquisa em questão, que contextualizam os resultados / números via a estatística, em prol de benefícios até então ignorados.

 

Gráfico 01 – Valores fenotípicos observados no decorrer das 10 gerações de seleção por Marcadores Moleculares de acordo com o nível de significância adotado (1%, 5%, 10% e 20%).

 

 

Em suma, a amostragem e a significância estatística são de extrema relevância em pesquisas científicas, visto que, a adoção de uma metodologia apropriada e documentada num processo de amostragem é de grande significância para validarmos inferências estatísticas a respeito da população em questão, e que o nível de significância nos fornece a confiabilidade / precisão das conclusões obtidas. Assim, análises estatísticas são importantes e responsáveis para elucidarmos questões científicas, tais como as pesquisas de caráter Biogenético.

 

Referências Bibliográficas

BOLFARINE, Heleno & BUSSAB, Wilton O. Elementos de Amostragem. 1ª ed. São Paulo: Edgard Blücher, 2005.

BUSSAB, Wilton de Oliveira & MORETTIN, Pedro Alberto. Estatística Básica. 5ª ed. São Paulo: Saraiva, 2003.

COSTA NETO, Pedro Luiz de Oliveira. Estatística. São Paulo: Edgard Blucher, 1977.

D’HAINAUT, Louis. Conceitos e Métodos da Estatística. 2ª ed. Lisboa: Fundação Calouste Gulbenkian, 1997.

 

EUCLYDES, R.F. Uso do sistema para simulação Genesys na avaliação de métodos de seleção clássicos e associados a marcadores moleculares. Viçosa, MG: UFV, 1996. 149p. Dissertação (Doutorado em Genética e Melhoramento) - Universidade Federal de Viçosa, 1996.