Ora bem, hoje vou falar um pouco sobre o que podemos fazer para sabermos se podemos pegar na relação entre duas variáveis e se podemos generalizar as suas médias para a população geral.
Exemplo 1 ------------------------------------------------------------------------------------------------------------
Antes de mais temos de ter uma variável Quantitativa e outra Qualitativa. Depois vamos seguir os seguintes passos:
1) Verificar se a distribuição é normal ou aproximadamente normal em cada um dos grupos;
2) verificar se as variâncias nos grupos são iguais ou diferentes (teste de Levene);
3) fazer o teste propriamente dito.
Pegando na mesma base de dados de jornais que utilizei ontem, vamos fazer então a seguinte análise:
O nº médio de diários lidos por semana é igual nos homens e nas mulheres ?
É portanto um teste de comparação de 2 médias independentes. Vamos começar por definir o nosso H0 e o nosso Ha:
H0 : o nº médio de diários lidos por semana é igual no grupo de Homens e no grupo das Mulheres na população de onde foi retirada a amostra
Ha: (...)não é igual(...)
Passo 1:
Abrimos o nosso SPSS e fazemos os seguintes passos:


Vamos agora verificar se existe uma distribuição normal ou aproximadamente normal em cada um dos grupos:
Vamos usar o teste de Shapiro-Wilk pois a amostra é menor do que 50.
Se o Sig > Alfa (margem erro - 0.05): não rejeitamos H0 (é portanto uma distribuição normal)
Se o Sig < Alfa: rejeitamos H0: não é uma distribuição normal.
Neste caso o nosso Sig é de 0.126 portanto é MAIOR do que 0.05 e portanto esta variável tem uma distribuição normal.
Para os homens:
Vamos usar o teste de Kolmogorov-Smirnov pois a amostra é maior que 50:
Para os homens o Sig é de .000 e portanto MENOR do que 0.05. A distribuição desta variável não é normal. Mas podemos ainda ver se será aproximadamente normal:
Pegamos no valor da Skewness e da Kurtosis e dividimos pelo seu desvio padrão. Se ambos os valores estiverem dentro do intervalo da nossa margem de erro (-1.96 a 1.96) podemos considerar que a distribuição será aproximadamente normal. Como tanto 1.61 e -0.44 estão dentro desta margem de erro podemos considerar que a variável dos homens tem uma distribuição aproximadamente normal.
Visto que as duas variáveis são normais ou aproximadamente normais, podemos prosseguir com a nossa análise.
Passo 2:
Vamos agora verificar as variâncias das nossas duas variáveis:
Vamos agora verificar se as variâncias são iguais ou diferentes. Para tal temos de voltar a definir o nosso H0 e o nosso Ha:
H0: as variâncias do nº de diários lidos por semana é igual no grupo dos homens e no grupo das mulheres;
Ha: (...) são diferentes(...)
Vamos agora pegar no teste de LEvene e analisar o Sig que este nos deu.Se o Sig > Alfa, não rejeitamos H0 (as variâncias são iguais);
Se o Sig < Alfa, rejeitamos H0 (as variâncias não são iguais)
Como o nosso Sig é de 0,790, é maior do que 0,05 portanto quer dizer que as variâncias são iguais. Com esta informação vamos definir qual a linha que iremos analisar. A primeira se as variâncias forem iguais, ou a segunda se as variâncias forem diferentes:
No nosso caso, vamos analisar a primeira linha, pois as variâncias são iguais.
Passo 3:
Como as distribuições são normais ou aproximadamente normais e as variâncias são idênticas, vamos então ao nosso teste principal:
Recordemos os valores das nossas hipóteses iniciais:
H0 : o nº médio de diários lidos por semana é igual no grupo de Homens e no grupo das Mulheres na população de onde foi retirada a amostra
Ha: (...)não é igual(...)
Vamos analisar o valor do Sig2 Tailed:
Como o Sig é menor que o Alfa ( 0.013 < 0.05 ), rejeitamos a hipótese nula e assim o nº médio de diários lidos por semana no grupo dos homens e nos grupo das mulheres não se reflecte na população em geral. Isto é, a média de jornais lidos pelos homens não é igual à média dos jornais lidos pelas mulheres. Como o Sig é menor, rejeitamos a nossa hipótese que dizia que as médias eram iguais.
Exemplo 2 -------------------------------------------------------------------------------------------------------------
Vamos agora fazer outro exemplo. Neste caso pretendemos saber se há diferenças significativas no Tempo de Leitura do semanário, em minutos, em função do modo de leitura do semanário preferido.A nossa variável dependente vai ser o tempo de leitura dos semanários preferidos - variável quantitativa e a nossa variável independente poderá ter 3 opções:
1) Dar uma vista de olhos;
2) Ler algumas secções;
3) Ler tudo com atenção
Vamos tentar saber se os tempos médios de leitura são iguais ou diferentes consoante os tipos de leitura (1, 2 ou 3). Formulamos pois as nossas hipóteses:
Temos portanto de verificar se são todas iguais (H0) ou se pelo menos uma é diferente (ha).Seguimos os mesmos passos do exemplo anterior, e começamos por analisar se as distribuições são normais:
Como todas as amostras das 3 opções são iguais ou menores que 50, temos que nos reportar ao teste de Shapiro-Wilk. Analisando os Sig, vemos que o único superior a 0.05 é o da opção "Dar uma vista de olhos", portanto teremos de ver se as restantes opções poderão ter uma distribuição aproximadamente normal:
Se fizermos as contas às divisões da Skewness e da Kurtosis pelas suas margens de erro, vemos que o valor de 2.83 não se enquadra no intervalo de -1.96 a 1.96, pelo que para este exemplo não poderemos realizar o teste paramétrico.
Comentários
Enviar um comentário