Estatística - Podemos transpor o resultado de uma amostra para a populaçao geral ?

março 29, 2021

Hoje estive a aprender a resposta a esta pergunta. Imaginemos que temos um base de dados com um inquérito que fizemos a 100 pessoas com várias perguntas acerca de jornais. Uma dessas perguntas era a idade do inquirido. Os resultados a essa pergunta foram os seguintes:

Como podemos verificar a média de idades da nossa amostra é de 33.58 anos, descontando as 12 respostas que não nos foram dadas (100 - 12 = 88 casos).

Imaginemos que este era apenas um estudo igual a outros que já tinham sido feitos anteriormente, e nesses estudos chegámos à conclusão que a média dos leitores tinha sido 34 anos. A questão a que queremos responder agora seria: podemos considerar que esta amostra é representativa da nossa população geral ? Vamos responder-lhe:

Para sabermos se o resultado poderá ser transposto para uma população geral, temos primeiramente que trabalhar com uma variável quantitativa, como é o caso desta. De seguida teremos de descrever a variável dentro da amostra, para saber se esta terá uma distribuição normal, ou aproximadamente normal, pois só assim poderemos fazer o teste que determinará se a variável da nossa amostra é representativa da população em geral:

Abrindo o SPSS, vamos a Analyze - Descriptive Statistics - Explore

De seguida no menú que aparecer escolhemos a nossa variável "Idade", estabelecemos o nosso intervalo de confiança - neste caso 95% - e checkamos no submenú "Plots" as seguintes opções:

1) Normality Plots with Tests

2) Histograma

Posto isto, teremos a seguinte tabela com os valores mais importantes para esta variável já calculados:

Vamos agora formular as nossas hipóteses:

H0 - testar se a variável tem uma distribuição normal;

Ha - hipótese disso não acontecer;

Vamos agora atentar no valor SIG, que nos apareceu na tabela "Testes de Normalidade":

Podemos ver que existem dois destes valores. Para amostras superiores a 50 instâncias vamos usar o valor de Kolmogorov-Smirnov, se o valor das instâncias da base de dados fosse menor, usaríamos o valor de Shapiro-Wilk. No nosso caso o SIG é de .039.

Agora temos de comparar este valor com o nosso Alpha. O Alpha é nos dados pelo valor de 1 menos a confiança que temos (95% ou 0.95):

Alpha = 1 - 0.95 = 0.05

Agora podemos comparar os nossos valores:

1) Se SIG > Alpha : Não rejeitamos H0 (a distribuição é portanto normal);

2) Se SIG < Alpha: rejeitamos H0 (temos de ver se a distribuição poderá ser aproximadamente normal)

No nosso caso temos que .039 é MENOR do que .050, portanto temos de ver se a distribuição desta variável poderá ser aproximadamente normal, para podermos fazer o nosso teste. E como fazemos isso ?

Precisamos dos valores da Assimetria, da Curtose, dos desvios padrões das mesmas e do valor na tabela de distribuição da nossa margem de erro:

Assimetria = .396 | Desvio Padrão = .257

Curtose = - .522 | Desvio Padrão = .508

Margem erro = -1.96 e 1.96

Para a distribuição ser aproximadamente normal, a divisão da Assimetria pelo seu desvio padrão e e da Curtose pelo seu desvio padrão terão de estar no intervalo entre - 1.96 e + 1.96.

.396 / .257 = 1.54

.522 / .508 = 1.027

Como podemos verificar, ambos os valores estão dentro do intervalo portanto a nossa distribuição é aproximadamente normal e podemos prosseguir com o teste.

Para fazermos o teste paramétrico, vamos a Analyze - Compare MEans - One Sample T Test:

Escolhemos o nosso intervalo de confiança (no caso 95%) e de seguida o valor da população geral contra o qual desejamos comparar o resultado da nossa amostra:

Isto vai dar-nos o seguinte quadro:

A partir daqui iremos comparar de novo o nosso SIG com o alpha:

1) Se o SIG for maior que o Alpha: a amostra é representativa (validamos a hipótese);

2) Se o SIG fôr menor que o Alpha: não podemos inferir que a amostra é representativa.

No nosso caso temos que 0.456 > 0.05 pelo que a idade na nossa amostra é representativa da idade da nossa população em geral.

Pesquisar neste blogue

My Data Learning Blog

Estatística - Podemos transpor o resultado de uma amostra para a populaçao geral ?

Comentários

Enviar um comentário

Mensagens populares deste blogue

Python - Excel - Lista de Còdigos Postais de Portugal

Python - criar nomes aleatórios

Python - Gerador de nomes aleatórios: V2.0