Estatística - Testes Paramétricos

Ora bem, hoje vou falar um pouco sobre o que podemos fazer para sabermos se podemos pegar na relação entre duas variáveis e se podemos generalizar as suas médias para a população geral. 

Exemplo 1 ------------------------------------------------------------------------------------------------------------

Antes de mais temos de ter uma variável Quantitativa e outra Qualitativa. Depois vamos seguir os seguintes passos:

1) Verificar se a distribuição é normal ou aproximadamente normal em cada um dos grupos;

2) verificar se as variâncias nos grupos são iguais ou diferentes (teste de Levene);

3) fazer o teste propriamente dito.

Pegando na mesma base de dados de jornais que utilizei ontem, vamos fazer então a seguinte análise:

O nº médio de diários lidos por semana é igual nos homens e nas mulheres ?

É portanto um teste de comparação de 2 médias independentes. Vamos começar por definir o nosso H0 e o nosso Ha:

H0 : o nº médio de diários lidos por semana é igual no grupo de Homens e no grupo das Mulheres na população de onde foi retirada a amostra

Ha: (...)não é igual(...)

Passo 1:

Abrimos o nosso SPSS e fazemos os seguintes passos:




Vamos agora verificar se existe uma distribuição normal ou aproximadamente normal em cada um dos grupos:


Para as mulheres:

Vamos usar o teste de Shapiro-Wilk pois a amostra é menor do que 50.

Se o Sig > Alfa (margem erro - 0.05): não rejeitamos H0 (é portanto uma distribuição normal)
Se o Sig < Alfa: rejeitamos H0: não é uma distribuição normal.

Neste caso o nosso Sig é de 0.126 portanto é MAIOR do que 0.05 e portanto esta variável tem uma distribuição normal.

Para os homens:

Vamos usar o teste de Kolmogorov-Smirnov pois a amostra é maior que 50:

Para os homens o Sig é de .000 e portanto MENOR do que 0.05. A distribuição desta variável não é normal. Mas podemos ainda ver se será aproximadamente normal:


Pegamos no valor da Skewness e da Kurtosis e dividimos pelo seu desvio padrão. Se ambos os valores estiverem dentro do intervalo da nossa margem de erro (-1.96 a 1.96) podemos considerar que a distribuição será aproximadamente normal. Como tanto 1.61 e -0.44 estão dentro desta margem de erro podemos considerar que a variável dos homens tem uma distribuição aproximadamente normal

Visto que as duas variáveis são normais ou aproximadamente normais, podemos prosseguir com a nossa análise.

Passo 2:

Vamos agora verificar as variâncias das nossas duas variáveis:







Vamos agora verificar se as variâncias são iguais ou diferentes. Para tal temos de voltar a definir o nosso H0 e o nosso Ha:

H0: as variâncias do nº de diários lidos por semana é igual no grupo dos homens e no grupo das mulheres;
Ha: (...) são diferentes(...)


Vamos agora pegar no teste de LEvene e analisar o Sig que este nos deu.
Se o Sig > Alfa, não rejeitamos H0 (as variâncias são iguais);
Se o Sig < Alfa, rejeitamos H0 (as variâncias não são iguais)

Como o nosso Sig é de 0,790, é maior do que 0,05 portanto quer dizer que as variâncias são iguais. Com esta informação vamos definir qual a linha que iremos analisar. A primeira se as variâncias forem iguais, ou a segunda se as variâncias forem diferentes:


No nosso caso, vamos analisar a primeira linha, pois as variâncias são iguais.


Passo 3:

Como as distribuições são normais ou aproximadamente normais e as variâncias são idênticas, vamos então ao nosso teste principal:

Recordemos os valores das nossas hipóteses iniciais:

H0 : o nº médio de diários lidos por semana é igual no grupo de Homens e no grupo das Mulheres na população de onde foi retirada a amostra

Ha: (...)não é igual(...)

Vamos analisar o valor do Sig2 Tailed:



Como o Sig é menor que o Alfa ( 0.013 < 0.05 ), rejeitamos a hipótese nula e assim o nº médio de diários lidos por semana no grupo dos homens e nos grupo das mulheres não se reflecte na população em geral. Isto é, a média de jornais lidos pelos homens não é igual à média dos jornais lidos pelas mulheres. Como o Sig é menor, rejeitamos a nossa hipótese que dizia que as médias eram iguais.


Exemplo 2 -------------------------------------------------------------------------------------------------------------

Vamos agora fazer outro exemplo. Neste caso pretendemos saber se há diferenças significativas no Tempo de Leitura do semanário, em minutos, em função do modo de leitura do semanário preferido.

A nossa variável dependente vai ser o tempo de leitura dos semanários preferidos - variável quantitativa e a nossa variável independente poderá ter 3 opções:

1) Dar uma vista de olhos;

2) Ler algumas secções;

3) Ler tudo com atenção

Vamos tentar saber se os tempos médios de leitura são iguais ou diferentes consoante os tipos de leitura (1, 2 ou 3). Formulamos pois as nossas hipóteses:


Temos portanto de verificar se são todas iguais (H0) ou se pelo menos uma é diferente (ha).

Seguimos os mesmos passos do exemplo anterior, e começamos por analisar se as distribuições são normais:



Como todas as amostras das 3 opções são iguais ou menores que 50, temos que nos reportar ao teste de Shapiro-Wilk. Analisando os Sig, vemos que o único superior a 0.05 é o da opção "Dar uma vista de olhos", portanto teremos de ver se as restantes opções poderão ter uma distribuição aproximadamente normal:


Se fizermos as contas às divisões da Skewness e da Kurtosis pelas suas margens de erro, vemos que o valor de 2.83 não se enquadra no intervalo de -1.96 a 1.96, pelo que para este exemplo não poderemos realizar o teste paramétrico.








Comentários

Mensagens populares deste blogue

Python - Gerador de nomes aleatórios: V2.0

Python - Jogo de adivinhar números !