Estatística - Podemos transpor o resultado de uma amostra para a populaçao geral ?
Hoje estive a aprender a resposta a esta pergunta. Imaginemos que temos um base de dados com um inquérito que fizemos a 100 pessoas com várias perguntas acerca de jornais. Uma dessas perguntas era a idade do inquirido. Os resultados a essa pergunta foram os seguintes:
Vamos agora formular as nossas hipóteses:
H0 - testar se a variável tem uma distribuição normal;
Ha - hipótese disso não acontecer;
Vamos agora atentar no valor SIG, que nos apareceu na tabela "Testes de Normalidade":
Podemos ver que existem dois destes valores. Para amostras superiores a 50 instâncias vamos usar o valor de Kolmogorov-Smirnov, se o valor das instâncias da base de dados fosse menor, usaríamos o valor de Shapiro-Wilk. No nosso caso o SIG é de .039.
Agora temos de comparar este valor com o nosso Alpha. O Alpha é nos dados pelo valor de 1 menos a confiança que temos (95% ou 0.95):
Alpha = 1 - 0.95 = 0.05
Agora podemos comparar os nossos valores:
1) Se SIG > Alpha : Não rejeitamos H0 (a distribuição é portanto normal);
2) Se SIG < Alpha: rejeitamos H0 (temos de ver se a distribuição poderá ser aproximadamente normal)
No nosso caso temos que .039 é MENOR do que .050, portanto temos de ver se a distribuição desta variável poderá ser aproximadamente normal, para podermos fazer o nosso teste. E como fazemos isso ?
Precisamos dos valores da Assimetria, da Curtose, dos desvios padrões das mesmas e do valor na tabela de distribuição da nossa margem de erro:
Assimetria = .396 | Desvio Padrão = .257
Curtose = - .522 | Desvio Padrão = .508
Margem erro = -1.96 e 1.96
Para a distribuição ser aproximadamente normal, a divisão da Assimetria pelo seu desvio padrão e e da Curtose pelo seu desvio padrão terão de estar no intervalo entre - 1.96 e + 1.96.
.396 / .257 = 1.54
.522 / .508 = 1.027
Como podemos verificar, ambos os valores estão dentro do intervalo portanto a nossa distribuição é aproximadamente normal e podemos prosseguir com o teste.
Para fazermos o teste paramétrico, vamos a Analyze - Compare MEans - One Sample T Test:
Escolhemos o nosso intervalo de confiança (no caso 95%) e de seguida o valor da população geral contra o qual desejamos comparar o resultado da nossa amostra:
Isto vai dar-nos o seguinte quadro:
A partir daqui iremos comparar de novo o nosso SIG com o alpha:
1) Se o SIG for maior que o Alpha: a amostra é representativa (validamos a hipótese);
2) Se o SIG fôr menor que o Alpha: não podemos inferir que a amostra é representativa.
No nosso caso temos que 0.456 > 0.05 pelo que a idade na nossa amostra é representativa da idade da nossa população em geral.
Comentários
Enviar um comentário