Estatística - Testes não paramétricos

 Hoje queria resumir um pouco os testes não paramétricos. Estes testes são utilizados sempre que a distribuição das variáveis não é normal ou aproximadamente normal. Podemos também utilizá-los em todo o tipo de variáveis, e não precisam de pressupostos:


O que vamos avaliar nestes testes é a forma da distribuição dos valores. Em função da variável vamos escolher o teste que iremos aplicar. Estes testes não paramétricos não são tão precisos como os paramétricos portanto devemos sempre tentar usar os segundos sempre que possível.



Teste de ajustamento do Qui Quadrado ------------------------------------------------------------------------

Este teste é utilizado para testar a aderência de uma variável qualitativa a uma distribuição conhecida.

Hipóteses:

H0: a variável segue determinada distribuição conhecida

Ha: a variável não segue determinada distribuição conhecida

Pode ser utilizado com variáveis nominais ou ordinais, sendo o único em que podemos usar uma variável nominal.



Vamos então a um exemplo:








Aqui podemos ver se a frequências das respostas que temos (Observed N) são iguais à frequência esperada se a distribuição fosse uniforme (Expected N). O residual é a diferença.

Temos portanto:

Se Sig > Alfa : não rejeitamos H0
Se Sig <= Alfa : rejeitamos H0

Sendo que:

H0: a distribuição de preferência de semanários é igual (uniforme) na população;
Ha: (...) não é igual (...)



A nossa margem de erro quando não é definida, é sempre 0,05 (o nosso Alfa). 

Neste caso como o Sig é menor que Alfa (0.002 < 0.05), rejeitamos H0. A distribuição portanto não será uniforme e não se refletirá na população.

As condições de aplicação do teste são válidas:

- não pode haver mais do que 20% de células <5 (0%);

- não pode haver célula com valor esperado <1 (33.3)

Imaginemos agora que os nossos valores eram diferentes:


As nossas hipóteses seriam:

H0: a distribuição da variável semanário preferido é: Expresso (40), Regional (30), Sol (30);
Ha: (...) não é igual a(...)

Como o Sig > Alfa (0.125 > 0.05), não rejeitamos H0, ou seja, a distribuição de preferência do semanário na população é de 40, 30, 30 para o Expresso, Regional e o Sol.


Teste de Independência do Qui Quadrado -------------------------------------------------------------------

Permite saber se duas variáveis são independentes entre si ou não. Podem ser Nominais, Ordinais ou Quantitativas.


Exemplo 1:

Pretende-se testar se o Sexo é independente das preferências pelos semanários (Semanário preferido).
As nossas hipóteses são:

H0: as variáveis Sexo e Semanário Preferido são independentes (não estão relacionadas);
Ha: as variáveis Sexo e Semanário Preferido não são independentes (estão relacionadas)








Aqui vemos as variáveis reais e o que seria esperado caso a variável fosse independente.

Recordamos as nossas hipóteses:

H0: as variáveis Sexo e Semanário Preferido são independentes (não estão relacionadas);
Ha: as variáveis Sexo e Semanário Preferido não são independentes (estão relacionadas)



Se Sig for MAIOR que Alfa, não rejeitamos H0 (são independentes)
Se Sig for MENOR ou IGUAL que Alfa, rejeitamos H0 (não são independentes)

Neste caso, como o nosso Sig é igual a Alfa, rejeitamos H0 e chegamos à conclusão que estas variáveis não são independentes, havendo uma relação entre elas. 

Mas quão forte é essa relação ?


Existe alguma associação, mas esta não é muito alta.

Teste de Mann - Whitney -------------------------------------------------------------------------------------

Não se pode fazer a variáveis nominais.


Exemplo 1:

Se tivermos uma variável quantitativa com distribuição não normal, podemos também usar este teste.






Este teste vai verificar se as diferenças são grandes ou não.

Vamos às nossas hipóteses:

H0: a distribuição do nº de semanários lidos por mês é igual nos homens e nas mulheres na população
Ha: (...) não é igual (...)


Como o nosso Sig = 0.009 < Alfa = 0.05, rejeitamos H0, ou seja, a distribuição do nº de semanários lidos por mês é diferente no grupo dos homens e no grupo das mulheres, na população geral.

Intuimos que provavelmente os homens lêem mais jornais por mês que as mulheres.

Exemplo 2:




Hipóteses:

H0: a opinião face à facilidade de leitura do semanário preferido é igual nos homens e nas mulheres na população;
Ha: (...) não é igual(...)


Como Sig = 0,179 > Alfa = 0,05, não rejeitamos H0, ou seja, os homens e as mulheres apresentam uma distribuição de satisfação face à facilidade de leitura do semanário que é idêntica.


Teste de Kruskal - Wallis ----------------------------------------------------------------------------------------


Neste teste vamos verificar se todas as distribuições são normais ou se pelo menos uma é diferente.

Exemplo 1:


Só recorremos a este teste não paramétrico porque a distribuição nesta variável não é normal nem aproximadamente normal.




Vamos recordar as nossas hipóteses:

H0: a distribuição do números de semanários lidos por mês é igual para os leitores do Expresso, Regional e Sol;
Ha: existe pelo menos uma distribuição que é diferente das restantes.

Como Sig = 0,52 > Alfa = 0,05 não rejeitamos H0, ou seja, a distribuição do número de semanários lidos por mês é igual para os leitores do Expresso, Regional e Sol.
























Comentários

Mensagens populares deste blogue

Python - Gerador de nomes aleatórios: V2.0

Python - Jogo de adivinhar números !