Se eu ganhasse um real para cada vez que alguém me perguntasse qual deve ser o tamanho amostral hoje eu estaria rico!!!
Isso se deve principalmente a uma falta de conhecimento de como os delineamentos amostrais são construídos.
No caso de planos amostrais vale a máxima:
"É melhor qualidade do que quantidade."
Ou seja, o tamanho amostral é importante mas não é mais importante do que a qualidade desse plano amostral. E a qualidade é medida pela variabilidade dos estimadores construídos, quanto menor a variabilidade maior a eficiência do plano amostral.
Essa variabilidade é alterada pelo tipo de delineamento amostral. Exemplos de desenhos amostrais são: amostragem aleatória simples, amostragem sistemática, amostragem por conglomerados, amostragem de Poisson, etc.
Entretanto, apesar da estimação da variância em planos amostrais e a construção de delineamentos sofisticados serem fundamentais, esses não serão escopo desse post.
Falarei aqui sobre como calcular o tamanho amostral para estimadores de proporção em amostras aleatórias simples.
Para outros tipos de estimadores, como: parâmetros de regressão, variância e correlações ou ainda estimadores em planos amostrais diferentes da amostra aleatória simples, outros textos são necessários (veja por exemplo: Cochran (1977); Schaeffer, et. al (2011), Särndal, et.al (2003)).
Cálculo do tamanho amostral para estimadores de proporção.
Para o cálculo do tamanho amostral necessário para estimar proporções alguns ingredientes são importantes:
- Tamanho da população: é o tamanho da população alvo. Representado usualmente por $N$
- Erro permissível: é o erro admitido para o estimador de proporção. Por exemplo, quando você assisti o Jornal Nacional e o William Bonner diz que o percentual de pessoas que aprovam o governo Dilma é de 68.4% com uma margem de erro de dois pontos percentuais para mais ou para menos (±2%), essa margem é o erro permissível. O tamanho amostral para a estimação de proporções leva em consideração o quanto você "aceita errar" na estimativa do parâmetro populacional. Para proporções esse erro deve estar entre 0 e 1 (varia entre 0% a 100%).
- Confiabilidade: como amostragem é um processo probabilístico, existe uma probabilidade desse erro permissível (ou seja o erro máximo aceitável) não ser satisfeito. Definimos como nível de confiança (confiabilidade) a probabilidade do erro máximo permissível ser satisfeito. Usualmente, trabalha-se com probabilidades como 90%, 95%, 99% ou ainda 99.9% dependendo do tipo de estudo. O nível de confiança (representado por $1-\alpha$ onde $\alpha$ é o nível crítico.) varia entre 0 e 1 (varia entre 0% a 100%)
- Proporção:o último ingrediente para o cálculo do tamanho amostral necessário é o valor da proporção representado por $\hat{p}$, esse valor varia entre 0 e 1 (varia entre 0% a 100%). Você deve ter pensado: "Mas pera aí... Como eu vou fornecer o valor da proporção para o cálculo do tamanho amostral se é JUSTAMENTE ISSO QUE EU QUERO ENCONTRAR ???". Você está certo em se indignar... Esse é o componente mais complicado de ser encontrado. Há no entanto algumas sugestões:
- Utilize $\hat{p}=0.5$. Nesse caso, o "pior dos casos" é construído e o tamanho amostral máximo é obtido. (Cochran (1977) página 72.)
- Encontre o valor de $\hat{p}$ utilizando outro estudo. Por exemplo, procure alguma estatística ou algum artigo que indique "mais ou menos" qual deve ser o valor da proporção. Suponha que o objetivo seja calcular a proporção de computadores quebrados na UnB, podemos usar algum texto ou artigo que estime a proporção de computadores em outra instituição de pesquisa e então essa proporção é utilizada como proxy.
- Faça uma amostra piloto utilizando um tamanho amostral arbitrário. Com base nessa amostra piloto calcule o valor da proporção e então estime o tamanho amostral necessário. Por exemplo, suponha que o objetivo seja, novamente, calcular a proporção de computadores quebrados na UnB. Podemos amostrar dez computadores e calcular o valor da proporção. Então utilizamos esse valor para estimar o tamanho da amostra. Suponha que encontremos o valor de 234 para o tamanho amostral. Isso significa que temos que amostrar 234 computadores... Mas, como dez computadores já foram amostrados, o tamanho da amostra deverá ser 224=234-10.
Podemos definir o erro permissível como 0.05, ou seja, adimite-se que a proporção de alunos que aprovam o uso de cotas no vestibular pode variar 5 pontos percentuais para mais ou para menos, o nível de confiança mais utilizado é de 95% isso significa que se o processo amostral for repetido muitas vezes espera-se que a margem de erro ±5% seja satisfeita em 95% das vezes. Por fim, como não conhecemos a priori nenhuma informação sobre o percentual de alunos que aprovam o uso de cotas, podemos fazer $\hat{p}=0.5$ como abordagem conservadora.
Abaixo segue o programa para o cálculo do tamanho amostral:
Note que ao executar o programa o tamanho da amostra estimado foi de 380. Esse valor poderia ser reduzido se fizéssemos uma amostra piloto ou se tivéssemos uma estimativa menos rígida para a proporção de alunos que aprovam o uso de cotas.
Maiores detalhes sobre esse processo, incluindo a fórmula para o cálculo do tamanho amostral você encontra em (Cochran (1977) página 75.)
Professor, bom dia!
ResponderExcluirEsse cálculo serviria para definir uma amostra da quantidade de documentos de um sistema a serem verificados?
Ex: No sistema X tenho 1000 casos de uso e no sistema Y tenho 10 casos de uso. A amostragem adequada para ambos seria qual?
Você teria essa fórmula no excel? Poderia me passar? (glennamb@yahoo.com.br ou glenna.balthar@gmail.com)
Obrigada!
Se essa é somente a informação que você tem, o melhor é usar a abordagem de proporção. Mude apenas o tamanho da população para a população que você quer 1000 e 10, respectivamente o que fornece tamanhos amostrais iguais a 278 e 10.
ExcluirOi professor!
ExcluirMuito obrigada pela resposta!!!
Você sabe se o tamanho da amostra para o exemplo 1 (1000) seria o produto de todas as variáveis?
Tamanho da população:
30757
Erro permissível:
0.05
Proporção:
0.5
Confiabilidade:
0.95
Tamanho da amostra: 278
Não é simplesmente o produto. A fórmula você encontra aqui: (Cochran (1977) página 75.)
ExcluirOk, muito obrigada!!!
ExcluirBoa noite professor. Saberia me explicar como eu faço a seguinte questão?
ResponderExcluirUm estudo será feito numa população pra se estimar a proporção de mulheres possuidoras de veiculos. Qual o tamanho da amostra se desejarmos estar confiantes em 99% de que a estimativa não difira da verdadeira proporção em mais do que 1%. Estou travada nessa questão há dias
Olá.. Essa é uma questão de amostragem em populações infinitas de curso de estatística básica. Dê uma olhada no livro Introdução à Estatística do Triola na parte de Proporções e lá deve ter alguns exemplos de como proceder.
ExcluirBoa noite professor. Saberia me explicar como eu faço a seguinte questão?
ResponderExcluirUm estudo será feito numa população pra se estimar a proporção de mulheres possuidoras de veiculos. Qual o tamanho da amostra se desejarmos estar confiantes em 99% de que a estimativa não difira da verdadeira proporção em mais do que 1%. Estou travada nessa questão há dias
Boa noite professor. Saberia me explicar como eu faço a seguinte questão?
ResponderExcluirUm estudo será feito numa população pra se estimar a proporção de mulheres possuidoras de veiculos. Qual o tamanho da amostra se desejarmos estar confiantes em 99% de que a estimativa não difira da verdadeira proporção em mais do que 1%. Estou travada nessa questão há dias
Olá professor Pedro. Obrigado pela postagem, me ajudou a entender algumas coisas que eu não sabia a respeito da amostragem.
ResponderExcluirEu tenho uma dúvida, se o senhor puder me ajudar eu te agradeço.
Sou acadêmico e estou desenvolvendo um estudo transversal em uma instituição de saúde e estamos com dificuldade de calcular a amostra, uma vez que a população que vai até a instituição é, como posso dizer... não-fixa... há dias em que diversas pessoas vão e em outros dias não. Estamos aplicando questionários com as pessoas presentes. Existe uma lista de quantas pessoas deveriam estar presentes lá naquele dia, no entanto, são poucas as que vão.
Nós devemos estimar a quantidade de pessoas atendidas durante o período em que estamos lá coletando os dados com os clientes ( estabelecemos que seria de agosto até dezembro deste ano - assim devemos estimar quantas pessoas estiveram presentes durante esse período?)? Se sim, como fazer isso, uma vez que há uma lista um pouco "defasada" de quantas pessoas deveriam estar lá?
Abs,
Felipe.
Felipe,
ExcluirNo seu caso a abordagem é outra... Chama abordagem de populações infinitas. Existe um software que te ajuda a calcular. Chama PASS.. A última versão dele acho que é a 14. Grande abraço.
Pedro
Cara, preciso da sua ajuda. Não consigo descobrir o resultado:
ResponderExcluir2- Suponha que um total de 789.654 famílias residia em um bairro em São Paulo Capital e 563.282 delas possuem casas próprias. Uma amostra de 240 famílias é selecionada a partir desse bairro e 158 delas possuem casa própria. Encontre a proporção de famílias na amostra, que possuem casa própria.
Grato.
R- A proporção de famílias na amostra que possuem casa própria: 158/240
Excluirn = Z2 x [ P x (1-P) ] / E2
onde n=tamanho da amostra,
Z=nivel de confiança (=1,96 p/ =5% e ic=95%),
P=proporção,
E=erro amostral
E2 = 1/240 = 0,004 (aproximadamente.)
158 = 1,962 x [ P x (1-P) ] / 0,004
0,6583 = 3,8416 x [ P x (1-P) ]
[ P x (1-P) ] = 0,1714
P = 0,22 ou 22% aproximadamente
Resposta: Proporção de famílias que possuem casa própria é de 22% aproximadamente
a) E se a amostra fosse 560 famílias selecionadas e 270 com casa própria.
n = Z2 x [ P x (1-P) ] / E2 onde n=tamanho da amostra,
Z=nivel de confiança (=1,96 p/ =5% e ic=95%),
P=proporção,
E=erro amostral
E2 = 1/560 = 0,002 (aproximadamente.)
270 = 1,962 x [ P x (1-P) ] / 0,002
0,4821 = 3,8416 x [ P x (1-P) ]
[ P x (1-P) ] = 0,1255
P = 0,15 ou 15% (aproximadamente.)
Resposta: Proporção de famílias que possuem casa própria é de 15% aproximadamente
a) E se a amostra fosse 1.423 famílias selecionadas e 861 com casa
n = Z2 x [ P x (1-P) ] / E2 onde n=tamanho da amostra,
Z=nivel de confiança (=1,96 p/ =5% e ic=95%),
P=proporção,
E=erro amostral
E2 = 1/1423 = 0,0007 (aproximadamente.)
861 = 1,962 x [ P x (1-P) ] / 0,0007
0,6027 = 3,8416 x [ P x (1-P) ]
[ P x (1-P) ] = 0,1569
P = 0,195 ou 19,5% (aproximadamente.)
Resposta: Proporção de famílias que possuem casa própria é de 19,5% aproximadamente
tenho 10000 amostras e quero o menor numero de amostragem para verificação, qual seria o melhor valor para proporção???
ResponderExcluirBoa tarde professor, eu pretendo avaliar o nível de satisfação dos turistas que visitam a um determinado atractivo turistico. Segundo a Direcção, aquele local tem recibido entre 750 a 800 turistas por semana e 2500 a 3000 por mês. Agora qual deve ser a amostra? anselmosamo@gmail.com
ResponderExcluirOla Professor, tudo bem? Estou realizando uma pesquisa junto à uma fan page de uma prefeitura. Minha pesquisa se estende por todo o ano de 2015, porém como estou analisando às postagens sobre vários aspectos, precisa encontrar uma amostra eficiente. Por exemplo nesta página tem em torno de 2400 postagens (2015), fiz os cálculos e me forneceu um número de 66 postagens, tendo como erro permissível 0,10 - confiabilidade de 0,90. Posso utilizar a proporção de 0,5? Esta é a fórmula de Cochran?
ResponderExcluirOi professor, gostaria de saber como poderia calcular uma amostra, tenho informações do ano 2000 até o ano de 2015, porém só consigo acessar os valores de 2011 a 2015. Gostaria de saber se a amostra que eu pegar entre 2011 e 2015 pode ser relacionada ao todo. Por exemplo. quero fazer uma pesquisa nos prontuarios dos pacientes que foram submetidos a extração dentária, e quero ver dentro dessas extrações quais que tiveram alveolite no pós operatório, os atendimentos começaram no ano de 2000 porém o sistema de cadastro de pacientes foi emplementado no ano de 2011, seria inviável buscar estes prontuarios antes de 2011. Como poderia resolver essa situação, e conseguir uma amostragem significativa que representasse essa "população". Desde já agradeço!
ResponderExcluirBom dia, professor!!
ResponderExcluirEstou elaborando uma pesquisa e fiquei preso na amostragem.
A população da cidade x corresponde a 100.000, e o meu público representa 12.400. Como extrair a amostra do meu público alvo com a margem de confiança em torno dos 95%?
Boa tarde, professor!
ResponderExcluirQuando se trata de amostra estratificada proporcional e os números possuem valores muito distantes, como devo calcular? Lembro que eu fazia o calculo para amostra proporcional estratificada e depois multiplicava cada resultado por um número (acho que era 4,alguma coisa). Eu me esqueci e não consigo encontra na internet. Eu estava fazendo uma pesquisa em clinicas e o número dos atendimentos variava entre 15 numa clinica, 300 em outra e 600 em outra diferente, por exemplo. Nesse casos como calcular a proporção?
Selecionei 200 peças de um dia de produção. Dessas verifiquei que 60 são para um único cliente, dessas 10 tinha defeito sendo que 6 foram corrigidas e 4 passaram. Gostaria de saber como calcular uma amostra para comprovar o % defeito desse cliente.
ResponderExcluirOla, então. o meu estudo experimental será composto de 3 grupos. Para a variável escolhida eu quero uma diferença de 20%. Como faço esse calculo amostral para saber quantos indivíduos preciso em cada grupo para obter essa diferença de 20%?
ResponderExcluir