|
·
Produção: Laboratório de Bioinformática
·
Aplicativo suporte: Programa GBOL – Genética Básica on
line
·
Comunidade (facebook): GbolNews
|
Tópicos
Qui-quadrado - Utilização e
Limitações
INTRODUÇÃO
Entre os testes de avaliação de hipóteses genéticas, o teste de x² tem se
mostrado bastante útil e eficiente, pois leva em
consideração os desvios ocorridos entre valores previstos e observados e é
sensível ao tamanho da amostra.
A variável aleatória e contínua v, que tem distribuição de x², é definida como o quadrado da
variável u de distribuição normal reduzida, ou seja:
v = u²
Como u tem média zero e variância 1,0, a variável v
necessariamente passa pela origem e, por ser o quadrado de u, será sempre
positiva ou nula.
Volta
TESTE DE HIPÓTESE
NÍVEL DE SIGNIFICÂNCIA
PRÉ-ESTABELECIDO
Nesse caso, para se testar uma hipótese genética, é necessário obter duas
estatísticas denominadas x² calculado e x² tabelado. O x² calculado é obtido a
partir dos dados experimentais, levando-se em conta os valores observados e
aqueles que seriam esperados dentro da hipótese genética formulada. O x²
tabelado depende dos graus de liberdade e do nível de significância adotado. A
tomada de decisão é feita comparando-se o valor do x² obtido com base nos
resultados observados com o valor do x² apresentado nas tabelas. As seguintes
decisões devem ser tomadas:
Se x² calc ³ ou = x² tab => Rejeita-se Ho
Se x² calc < x² tab
=> Não se rejeita Ho
Ho refere-se à hipótese formulada a respeito do caráter que se está
estudando.
Assim, rejeita-se uma hipótese quando a máxima probabilidade de erro ao
rejeitar aquela hipótese for baixa (alfa baixo), ou, quando a probabilidade dos
desvios terem ocorridos pelo simples acaso for baixa. O valor do x² tabelado é encontrado em vários livros
de estatística (http://www.fm.usp.br/dim/info/tabchi2/tabchi2.php),
sendo obtido para um determinado nível de significância (alfa) e certos graus
de liberdade.
O grau de liberdade, na
maioria das vezes, é igual ao número de classes fenotípicas menos 1.0.
O nível de significância (alfa) representa a máxima probabilidade de erro que
se tem ao rejeitar uma hipótese.
O valor do qui-quadrado a ser comparado com o tabelado pode ser calculado por meio da expressão:
X² = S[(O –
E)²/E]
Como ilustração será considerado
o cruzamento entre plantas de frutos alongados, resultando a descendência:
Fenótipos |
Observado |
Alongados |
860 |
Achatados |
280 |
Ovais |
350 |
Redondos |
110 |
Será testada a hipótese de que o caráter é regulado por 2
genes com interação não-epistática, segregando na proporção 9:3:3:1. Assim,
tem-se:
Fenótipos |
Observado |
Esperado |
O-E |
(O-E)²/E |
Alongados |
860 |
900 |
-40 |
1,7777 |
Achatados |
280 |
300 |
-20 |
1,3333 |
Ovais |
350 |
300 |
50 |
8,3333 |
Redondos |
110 |
100 |
10 |
1,0000 |
Obtém-se o valor do qui-quadrado calculado pela
expressão:
x²calc = [(860-900)²/900] + [(280-300)²/300] + [(350-300)²/300] + [(110-100)²/100] = 12,44
Os graus de liberdade são: GL = n-1 = 4-1 = 3. Adotando-se o nível de
significância igual a 5%, encontra-se em uma Tabela de qui-quadrado,
o seguinte valor: x² = 7,81
G.L. |
0,99 |
0,95 |
0,80 |
0,50 |
0,20 |
0,05 |
1 |
0,0001 |
0,004 |
0,06 |
0,46 |
1,64 |
3,84 |
2 |
0,02 |
0,10 |
0,45 |
1,39 |
3,22 |
6,00 |
3 |
0,11 |
0,35 |
1,00 |
2,34 |
4,64 |
7,81 |
4 |
0,29 |
0,71 |
1,65 |
3,36 |
5,99 |
9,49 |
Conclui-se, portanto, que a hipótese é rejeitada ao nível de
significância estabelecido, pois x²cal (= 12,44) é menor que
x²tab (= 7,81)
NÍVEL DE SIGNIFICÂNCIA
ESTIMADO
O uso de um nível de significância pré-estabelecido é questionável, pois é determinado de forma arbitrária. Não se leva em consideração a característica que está sendo estudada e nem a qualidade dos dados experimentais. Assim, o mais apropriado é tornar o nível uma incógnita a ser estimada, sendo útil no processo de tomada de decisão e de comparação entre diferentes ensaios.
Para o exemplo em consideração em que os graus de liberdade são 3 e o x²calc = 12,44, pode-se estimar o nível de
significância por intervalo, usando uma tabela. Para este caso, verifica-se que
o nível (alfa) é menor que 0,05. Outra maneira é utilizar recursos
computacionais em que a função de probabilidade do teste qui-quadrado
está disponível. Tem-se neste caso:
alfa = nível de significância = 0,6018%
Trata-se
de um valor pequeno, que indica ser a probabilidade de erro, ao rejeitar Ho
inferior a 0,6%, mostrando a provável
falsidade da hipótese.
Volta
QUI-QUADRADO - UTILIZAÇÃO E LIMITAÇÕES
O teste de qui-quadrado, aplicável às análises de
resultados genéticos, tem as seguintes vantagens e limitações:
Vantagens
É sensível aos desvios definidos entre valores
previstos e observados e ao tamanho da amostra. O teste exige que, quanto maior
for o tamanho da amostra, menor sejam os desvios, para que não aconteça a
rejeição da hipótese.
Limitações
O teste deve ser utilizado somente nos dados numéricos do experimento e nunca
em proporções ou em porcentagens.
O teste
não pode ser corretamente aplicado em experimentos nos quais a freqüência esperada de qualquer classe fenotípica seja
menor que cinco.
O teste
deverá apresentar correções para amostras de tamanho pequeno.
A
expressão de qui-quadrado, dada anteriormente, é
aplicável à variável v de distribuição contínua. Entretanto, em vários
experimentos, está envolvido apenas um número reduzido de classes fenotípicas,
definindo, conseqüentemente, uma distribuição
discreta. É necessária uma correção na expressão do qui-quadrado,
afim de se corrigir a falta de continuidade. A
correção de Yates para continuidade é dada por:
X² = S[(|O – E| - 0.5)²/E]
Esta
expressão é recomendada quando existe somente um grau de liberdade e a freqüência prevista para alguma classe fenotípica situa-se
entre 5 e 10.
Exemplo: