Como podemos saber da média de uma população mesmo sem ter acesso aos dados individuais de cada amostra? Ou melhor, o quanto podemos confiar nessa média? Para responder essa pergunta surge o intervalo de confiança.
Sendo de fundamental importância para inferências estatísticas, ou seja, para conseguir fazer afirmações sobre uma população conhecendo apenas uma amostra, o intervalo de confiançaé um conceito muitas vezes interpretado equivocadamente.
Se você quer finalmente entender o que significa um nível ou intervalo de confiança de uma estimativa, e não ficar mais perdido ao encontrar esses termos, você está no lugar certo.
Entenda de uma vez por todas, de forma simples, mas matematicamente correta, como interpretar o significado de um "nível de confiança de 95%” ou “uma margem de erro de 2%”.
Se ficou interessado, não deixe de acompanhar os tópicos abaixo para finalmente entender os intervalos de confiança:
Intervalo de confiança é um intervalo numérico (de um parâmetro populacional, como a média ou o desvio-padrão), associado a uma probabilidade (o nível de confiança), que representa a confiança de que o intervalo contém o parâmetro.
Ou seja, baseado na distribuição amostral,queremos obter uma faixa de valores (intervalo de confiança) com uma determinada probabilidade (nível de confiança) de conter o parâmetro populacional em questão.
Não entendeu? Calma que vamos simplificar. Imagine que queremos descobrir a média da quantidade de erros técnicos por pessoa em uma empresa. Porém, essa empresa possui muitos funcionários, e, por isso, só temos acesso a uma amostra do todo.
Se a média encontrada na amostra foi de 6 erros, com um nível de confiança de 95% no intervalo de confiança[5;7], que vai de 5 até 7, podemos afirmar que:
● Temos 95% de confiança de que o intervalo de confiança[5;7] contém a média populacional verdadeira (aquela que seria encontrada se tivéssemos acesso a todos os funcionários);
● Ao obter uma nova amostra, em 95% delas o valor verdadeiro do parâmetro vai estar no intervalo de confiançaestabelecido.
Seria mais fácil falar que temos 95% de confiança de que a média se encontra no intervalo, mas o primeiro jeito ressalta o fato que os intervalos são aleatórios e o parâmetro é fixo (o intervalo contém a média e não o contrário).
Ou seja, para cada amostra nova que tomarmos, o intervalo de confiançaprovavelmente diferirá, mas haverá 95% de chance de encontrar a média de erros de todos os funcionários dentro de um dado intervalo.
Podemos interpretar ainda:
● Se obtivéssemos 100 amostras aleatórias dos funcionários da empresa (de forma análoga à nossa primeira), esperamos que em 5 delas o intervalo de confiança nãocontenha a média verdadeira!
Assim, embora não saibamos o valor real do parâmetro (média), agora sabemos um intervalo de confiançapara a média com uma probabilidade associada!
Podemos aumentar a nossa confiançao quanto quisermos (até para 99%, por exemplo), mas quanto maior o nível de confiança desejado, maior será a margem de erro (e isso está relacionado com a própria fórmula do intervalo de confiança).
Com tudo isso, conseguimos passar de uma estimativa pontual, a nossa média amostral, que não considerava a incerteza em relação ao resto da população, e estabelecer um intervalo de confiança!
Entendido esse conceito tão importante, como calcular de fato o intervalo de confiança? Antes de explicar, vale ressaltar que, com todas as ferramentas atuais que facilitam esse processo, é muito mais importante entender o que ele é.
Para calcular, precisamos entender 3 conceitos: média, desvio padrão e distribuição estatística (principalmente a distribuição normal, mas vale a pena entender outras, como a distribuição binomial ou a distribuição de Poisson).
Antes de calcular um intervalo de confiança, vamos definir o valor crítico Z.a/2. Ele é o valor z que produz uma área a/2 debaixo da cauda superior da distribuição de nossa amostra (dividimos por 2 por considerarmos que a distribuição é normal e simétrica). Sendo o quanto aceitamos de erro (5% no nosso exemplo anterior, com 2,5% de “erro” para cada lado).
Podemos encontrar o valor Z.a/2 para cada intervalo de confiança utilizando tabelas para consulta (na prática, softwares calculam sozinho, e ainda entregam a margem de erro).
Assim, a nossa margem de erro pode ser calculada por:
Em que a parcela que contém o sigma é o desvio padrão da nossa amostra.
Com isso, o nosso intervalo de confiança é composto simplesmente dos números que variam entre ± e, ou seja:
Se na linguagem matemática está muito confuso para você, calma que com um exemplo prático tudo vai ficar mais claro!
Vamos supor que pegamos outra amostra da quantidade de erros por pessoa da empresa fictícia citada anteriormente, considerando que a distribuição dos erros é normal podemos imaginar o seguinte exemplo:
Com o novo estudo, descobrimos que temos 95% de chance de que o intervalo [5.4;7.4] contém a nossa média. Percebemos também que o intervalo de confiançaé sensível aos valores do parâmetro.
Para calcular a margem de erro de uma distribuição normal no Excel basta digitar:
Em que “dp” é o desvio padrão amostral e “n” é o tamanho amostral.
Conseguimos com este método preparar ações concretas conforme o objetivo do indivíduo ou empresa com base em números mais assertivos devido à noção da margem de erro.
Afinal, com o cálculo do intervalo de confiança conseguimos decifrar a margem de incerteza em relação a um cálculo realizado, assim é possível estimar o tamanho real do resultado.
Com todos os conceitos bem entendidos, qual seria então a diferença entre o nível e o intervalo de confiança?
Matematicamente, o nível de confiança pode ser dado por:
No nosso exemplo em que a=0,05, o nível de confiança é de 1 - 0,05 = 0,95, ou seja, 95%.
Muitas vezes o intervalo e o nível de confiança são tratados como sinônimos, porém, como o nome explicita, enquanto o primeiro trata de um intervalo numérico, o outro trata de um número (entre 0 e 1, que pode ser visto como uma probabilidade).
Diante disso, é possível utilizar diversos níveis distintos, dependendo da necessidade de cada situação, sendo os mais utilizados os níveis de confiança de 90%, de 95% e o de 99%.
Ou seja, o nível de confiança indica a porcentagem da confiança do intervalopossuir o parâmetro a ser estudado.
Para visualizar melhor a importância do intervalo de confiança, pense em como ele é aplicado no mundo real. Suponha que você está realizando uma pesquisa de mercado para um novo produto e deseja saber a média de satisfação dos consumidores.
Com uma amostra representativa e o cálculo do intervalo de confiança, você pode fornecer uma faixa realista dentro da qual a média de satisfação verdadeira provavelmente se encontra.
Esse intervalo ajuda a tomar decisões informadas, como ajustar o produto ou melhorar o serviço, com base na margem de erro aceita. Compreender e utilizar intervalos de confiança permite que você faça previsões mais precisas e confiáveis, minimizando riscos e maximizando oportunidades.
Você provavelmente sabe que nos dias de hoje uma das habilidades mais pedidas são as do Excel, certo? Sabemos que aprender sobre todas as suas funções requer um certo tempo e disposição.
Mas para te ajudar e te guiar nesse começo de aprendizado, criamos um e-book do Guia do Excel para iniciantes, comece agora mesmo a se desenvolver de forma gratuita!
Thiago é engenheiro de produção, pós-graduado em estatística e mestre em administração pela UFJF. Especialista Black Belt em Lean Six Sigma, trabalhou na Votorantim Metais e MRS Logística, onde foi gestor e especialista em melhoria contínua. Com certificações MOS® e Auditor Lead Assessor ISO 9001, atuou em projetos de consultoria e ministrou treinamentos e palestras em congressos como ENEGEP e Six Sigma Brasil. Professor nas áreas de Gestão e Empreendedorismo, é fundador do Grupo Voitto e mentor de empresas, dedicando-se à liderança executiva da Voitto, com a visão de torná-la a maior escola online de gestão do Brasil.
Entre para nossa lista e receba conteúdos exclusivos e com prioridade.
Respeitamos sua privacidade e nunca enviaremos spam!