graph TD
A["População (Parâmetro Desconhecido)"] --> B["Extrair Amostra"];
B --> C["Calcular Estatística Amostral"];
C --> D["Estimativa Pontual (Valor Único)"];
D --> E["Estimador"];
style A fill:#f8bbd0,stroke:#e91e63,stroke-width:2px;
style B fill:#ffe0b3,stroke:#ffc107;
style C fill:#e6f3ff,stroke:#007bff;
style D fill:#d4edda,stroke:#28a745,stroke-width:2px;
style E fill:#fff8e1,stroke:#ffa000;
Estimação: Ponto e Intervalo de Confiança
Estimando Parâmetros Populacionais e Construindo Intervalos de Confiança
Introdução e Objetivos
Nas aulas anteriores, aprendemos sobre amostragem e a importância de coletar dados de um subconjunto da população. O objetivo final da amostragem é usar as informações da amostra para fazer inferências sobre a população da qual ela foi retirada. É aqui que entramos no campo da Estimação.
A estimação é o processo de utilizar dados amostrais para calcular ou prever valores desconhecidos de parâmetros populacionais. Raramente temos acesso a toda a população, então a estatística nos fornece ferramentas para fazer as melhores “apostas” sobre esses parâmetros. Abordaremos duas formas principais de estimação: a estimação pontual, que fornece um único valor como a melhor estimativa, e a estimação por intervalo, que oferece um alcance de valores dentro do qual o parâmetro populacional provavelmente se encontra, acompanhado de um nível de confiança.
Este é um pilar fundamental da inferência estatística, permitindo-nos ir além da descrição dos dados amostrais para fazer generalizações sobre o universo de interesse.
Objetivos de Aprendizagem
Ao final desta aula, você será capaz de:
- Distinguir entre estimação pontual e estimação por intervalo.
- Compreender os conceitos de estimador, estimativa, erro padrão, nível de confiança e margem de erro.
- Construir e interpretar intervalos de confiança para a média populacional (com variância conhecida e desconhecida).
- Construir e interpretar intervalos de confiança para a proporção populacional.
- Reconhecer os fatores que influenciam a largura de um intervalo de confiança.
- Utilizar Python e R para calcular estimações pontuais e construir intervalos de confiança.
Estimação Pontual
A estimação pontual envolve o uso de uma estatística amostral (calculada a partir da amostra) para estimar um parâmetro populacional desconhecido com um único valor. Este valor é chamado de estimativa pontual.
- Estimador: É a regra ou fórmula usada para calcular a estimativa (por exemplo, a média amostral \(\bar{X}\)).
- Estimativa: É o valor numérico específico obtido pelo estimador a partir de uma amostra particular (por exemplo, \(\bar{x} = 15.7\)).
Exemplos Comuns de Estimativas Pontuais:
- A média amostral (\(\bar{x}\)) é a estimativa pontual mais comum para a média populacional (\(\mu\)).
- A proporção amostral (\(\hat{p}\)) é a estimativa pontual para a proporção populacional (\(P\)).
- O desvio padrão amostral (\(s\)) é a estimativa pontual para o desvio padrão populacional (\(\sigma\)).
Vantagens: Simples e fácil de entender.
Desvantagens: Não nos diz quão “boa” é a estimativa, ou seja, não há nenhuma indicação da precisão ou da variabilidade associada a ela. É improvável que a estimativa pontual seja exatamente igual ao parâmetro populacional.
Diagrama: Estimação Pontual
Estimação por Intervalo (Intervalos de Confiança)
A estimação por intervalo fornece um alcance de valores, chamado de intervalo de confiança (IC), dentro do qual o parâmetro populacional provavelmente se encontra. Ela é acompanhada por um nível de confiança, que expressa a probabilidade de que este intervalo contenha o verdadeiro parâmetro populacional.
Conceitos Chave
Nível de Confiança (\(1-\alpha\)): É a probabilidade de que o intervalo de confiança contenha o verdadeiro parâmetro populacional. Geralmente expresso como uma porcentagem (ex: 90%, 95%, 99%). Um nível de confiança de 95% significa que, se repetíssemos o processo de amostragem e construção de intervalos muitas vezes, esperaríamos que 95% desses intervalos contivessem o verdadeiro parâmetro populacional.
Margem de Erro (ME): É a metade da largura do intervalo de confiança. Ela representa a quantidade máxima em que a estimativa pontual pode diferir do verdadeiro parâmetro populacional com o nível de confiança especificado.
Erro Padrão (EP): É o desvio padrão da distribuição amostral de uma estatística (ex: erro padrão da média, erro padrão da proporção). Ele mede a variabilidade das estatísticas amostrais de amostra para amostra.
A forma geral de um intervalo de confiança é: (Bussab; Morettin, 2017, p. 195) \[\text{Estimativa Pontual} \pm \text{Margem de Erro}\]
A Margem de Erro é calculada como: \[\text{Margem de Erro} = \text{Valor Crítico} \times \text{Erro Padrão do Estimador}\]
O Valor Crítico é um valor da distribuição de probabilidade (normal ou t-student) que corresponde ao nível de confiança desejado.
Intervalo de Confiança para a Média Populacional (\(\mu\))
Com Desvio Padrão Populacional (\(\sigma\)) Conhecido (Distribuição Z)
Quando o desvio padrão populacional (\(\sigma\)) é conhecido (situação rara na prática, mas importante para a teoria ou quando \(n\) é grande e \(s\) é usado como \(\sigma\)).
Requisito: A população é normalmente distribuída ou o tamanho da amostra é grande (\(n \ge 30\), pelo Teorema do Limite Central).
Fórmula: (Bussab; Morettin, 2017, p. 195)
\[IC = \bar{x} \pm Z_{\alpha/2} \frac{\sigma}{\sqrt{n}}\]
Onde:
- \(\bar{x}\): média amostral.
- \(Z_{\alpha/2}\): valor crítico da distribuição normal padrão para o nível de confiança \(1-\alpha\).
- \(\sigma\): desvio padrão populacional.
- \(n\): tamanho da amostra.
- \(\frac{\sigma}{\sqrt{n}}\): erro padrão da média.
Valores comuns de \(Z_{\alpha/2}\):
- 90% de confiança: \(Z_{0.05} = 1.645\)
- 95% de confiança: \(Z_{0.025} = 1.96\)
- 99% de confiança: \(Z_{0.005} = 2.576\)
Exemplo: Uma amostra de 50 alunos tem média de altura de 170 cm. Suponha que o desvio padrão populacional conhecido seja de 10 cm. Construa um IC de 95% para a altura média da população.
- \(\bar{x} = 170\), \(\sigma = 10\), \(n = 50\), \(Z_{0.025} = 1.96\).
- \(IC = 170 \pm 1.96 \frac{10}{\sqrt{50}} = 170 \pm 1.96 \frac{10}{7.071} = 170 \pm 1.96 \times 1.414 = 170 \pm 2.77\)
- \(IC = [167.23, 172.77]\)
Com Desvio Padrão Populacional (\(\sigma\)) Desconhecido (Distribuição t de Student)
Esta é a situação mais comum na prática, onde o desvio padrão populacional é desconhecido e é estimado pelo desvio padrão amostral (\(s\)).
Requisito: A população é normalmente distribuída ou o tamanho da amostra é grande (\(n \ge 30\), pelo Teorema do Limite Central, onde a distribuição t se aproxima da normal).
Fórmula: (Bussab; Morettin, 2017, p. 198)
\[IC = \bar{x} \pm t_{\alpha/2, n-1} \frac{s}{\sqrt{n}}\]
Onde:
- \(\bar{x}\): média amostral.
- \(t_{\alpha/2, n-1}\): valor crítico da distribuição t de Student com \(n-1\) graus de liberdade para o nível de confiança \(1-\alpha\).
- \(s\): desvio padrão amostral.
- \(n\): tamanho da amostra.
- \(\frac{s}{\sqrt{n}}\): erro padrão da média (estimado).
A distribuição t de Student é mais “gorda” nas caudas que a distribuição normal, refletindo a incerteza adicional de estimar \(\sigma\) a partir de \(s\). À medida que os graus de liberdade (\(n-1\)) aumentam, a distribuição t se aproxima da distribuição normal.
Exemplo: Uma amostra de 25 estudantes de uma turma tem uma média de peso de 68 kg e um desvio padrão amostral de 5 kg. Construa um IC de 95% para o peso médio da população de estudantes.
- \(\bar{x} = 68\), \(s = 5\), \(n = 25\). Graus de liberdade \(df = n-1 = 24\).
- Para um IC de 95%, \(\alpha/2 = 0.025\).
- Valor crítico \(t_{0.025, 24} \approx 2.064\) (obtido de tabelas t ou software).
- \(IC = 68 \pm 2.064 \frac{5}{\sqrt{25}} = 68 \pm 2.064 \frac{5}{5} = 68 \pm 2.064 \times 1 = 68 \pm 2.064\)
- \(IC = [65.936, 70.064]\)
Código para Intervalo de Confiança para a Média
import numpy as np
from scipy import stats
# Exemplo 1: Sigma conhecido (Z-test)
data_z = np.array() # Média amostral
sigma_pop = 10 # Desvio padrão populacional conhecido
n_z = 50
conf_level_z = 0.95
# Erro Padrão
se_z = sigma_pop / np.sqrt(n_z)
# Valor Crítico Z
z_critical = stats.norm.ppf(1 - (1 - conf_level_z) / 2) # ppf é a função inversa da CDF
margin_error_z = z_critical * se_z
ic_lower_z = data_z - margin_error_z
ic_upper_z = data_z + margin_error_z
print("--- IC para Média (Sigma Conhecido) ---")
print(f"Média amostral: {data_z:.2f}")
print(f"Erro Padrão: {se_z:.3f}")
print(f"Valor Crítico Z: {z_critical:.3f}")
print(f"Margem de Erro: {margin_error_z:.3f}")
print(f"Intervalo de Confiança ({conf_level_z*100:.0f}%): [{ic_lower_z:.3f}, {ic_upper_z:.3f}]")
# Exemplo 2: Sigma desconhecido (t-test)
data_t = np.array()
n_t = len(data_t)
mean_t = np.mean(data_t)
std_dev_t = np.std(data_t, ddof=1) # ddof=1 para desvio padrão amostral
conf_level_t = 0.95
# Erro Padrão
se_t = std_dev_t / np.sqrt(n_t)
# Graus de Liberdade
df_t = n_t - 1
# Valor Crítico t
t_critical = stats.t.ppf(1 - (1 - conf_level_t) / 2, df_t)
margin_error_t = t_critical * se_t
ic_lower_t = mean_t - margin_error_t
ic_upper_t = mean_t + margin_error_t
print("\n--- IC para Média (Sigma Desconhecido) ---")
print(f"Média amostral: {mean_t:.2f}")
print(f"Desvio Padrão amostral: {std_dev_t:.2f}")
print(f"Erro Padrão: {se_t:.3f}")
print(f"Graus de Liberdade: {df_t}")
print(f"Valor Crítico t: {t_critical:.3f}")
print(f"Margem de Erro: {margin_error_t:.3f}")
print(f"Intervalo de Confiança ({conf_level_t*100:.0f}%): [{ic_lower_t:.3f}, {ic_upper_t:.3f}]")
# O pacote statsmodels oferece uma forma mais direta
# import statsmodels.stats.api as sm
# ci_sm = sm.DescrStatsW(data_t).tconfint_mean(alpha=1-conf_level_t)
# print(f"IC (statsmodels): [{ci_sm:.3f}, {ci_sm:.3f}]")# Exemplo 1: Sigma conhecido (Z-test) - Usando a fórmula manual
mean_z <- 170
sigma_pop <- 10 # Desvio padrão populacional conhecido
n_z <- 50
conf_level_z <- 0.95
# Erro Padrão
se_z <- sigma_pop / sqrt(n_z)
# Valor Crítico Z
z_critical <- qnorm(1 - (1 - conf_level_z) / 2) # qnorm é a função inversa da CDF
margin_error_z <- z_critical * se_z
ic_lower_z <- mean_z - margin_error_z
ic_upper_z <- mean_z + margin_error_z
cat("--- IC para Média (Sigma Conhecido) ---\n")
cat(sprintf("Média amostral: %.2f\n", mean_z))
cat(sprintf("Erro Padrão: %.3f\n", se_z))
cat(sprintf("Valor Crítico Z: %.3f\n", z_critical))
cat(sprintf("Margem de Erro: %.3f\n", margin_error_z))
cat(sprintf("Intervalo de Confiança (%.0f%%): [%.3f, %.3f]\n", conf_level_z * 100, ic_lower_z, ic_upper_z))
# Exemplo 2: Sigma desconhecido (t-test) - Usando a função t.test()
data_t <- c(68, 65, 72, 70, 63, 75, 69, 66, 71, 67, 68, 64, 73, 70, 66, 68, 69, 72, 65, 67, 70, 68, 66, 71, 69)
n_t <- length(data_t)
mean_t <- mean(data_t)
std_dev_t <- sd(data_t) # sd() em R calcula o desvio padrão amostral (n-1 no denominador)
conf_level_t <- 0.95
# Erro Padrão
se_t <- std_dev_t / sqrt(n_t)
# Graus de Liberdade
df_t <- n_t - 1
# Valor Crítico t
t_critical <- qt(1 - (1 - conf_level_t) / 2, df_t)
margin_error_t <- t_critical * se_t
ic_lower_t <- mean_t - margin_error_t
ic_upper_t <- mean_t + margin_error_t
cat("\n--- IC para Média (Sigma Desconhecido) ---\n")
cat(sprintf("Média amostral: %.2f\n", mean_t))
cat(sprintf("Desvio Padrão amostral: %.2f\n", std_dev_t))
cat(sprintf("Erro Padrão: %.3f\n", se_t))
cat(sprintf("Graus de Liberdade: %d\n", df_t))
cat(sprintf("Valor Crítico t: %.3f\n", t_critical))
cat(sprintf("Margem de Erro: %.3f\n", margin_error_t))
cat(sprintf("Intervalo de Confiança (%.0f%%): [%.3f, %.3f]\n", conf_level_t * 100, ic_lower_t, ic_upper_t))
# Usando a função t.test() que já calcula o IC
test_result <- t.test(data_t, conf.level = conf_level_t)
cat("\nIC (t.test()):\n")
print(test_result$conf.int)Intervalo de Confiança para a Proporção Populacional (\(P\))
Usado para estimar a proporção de elementos na população que possuem uma determinada característica.
Requisitos:
- A amostra é aleatória simples.
- As condições para a aproximação normal da distribuição amostral da proporção são satisfeitas (geralmente \(n\hat{p} \ge 5\) e \(n(1-\hat{p}) \ge 5\), onde alguns autores usam 10).
Fórmula: (Bussab; Morettin, 2017, p. 200)
\[IC = \hat{p} \pm Z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\]
Onde:
- \(\hat{p}\): proporção amostral (número de sucessos / \(n\)).
- \(Z_{\alpha/2}\): valor crítico da distribuição normal padrão.
- \(n\): tamanho da amostra.
- \(\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\): erro padrão da proporção.
Exemplo: Em uma pesquisa com 400 eleitores, 220 disseram que votariam no Candidato X. Construa um IC de 99% para a proporção de eleitores que votariam no Candidato X.
- \(\hat{p} = 220/400 = 0.55\). \(n = 400\).
- Para um IC de 99%, \(Z_{0.005} = 2.576\).
- Erro Padrão: \(\sqrt{\frac{0.55(1-0.55)}{400}} = \sqrt{\frac{0.55 \times 0.45}{400}} = \sqrt{\frac{0.2475}{400}} = \sqrt{0.00061875} \approx 0.02487\)
- \(IC = 0.55 \pm 2.576 \times 0.02487 = 0.55 \pm 0.0641\)
- \(IC = [0.4859, 0.6141]\)
Código para Intervalo de Confiança para a Proporção
import numpy as np
from scipy import stats
import statsmodels.stats.api as sm
# Dados do problema
n_sucessos = 220 # Número de eleitores que votariam no Candidato X
n_total = 400 # Tamanho total da amostra
conf_level_prop = 0.99
# Proporção amostral
p_hat = n_sucessos / n_total
# Erro Padrão da proporção
se_prop = np.sqrt((p_hat * (1 - p_hat)) / n_total)
# Valor Crítico Z
z_critical_prop = stats.norm.ppf(1 - (1 - conf_level_prop) / 2)
# Margem de Erro
margin_error_prop = z_critical_prop * se_prop
ic_lower_prop = p_hat - margin_error_prop
ic_upper_prop = p_hat + margin_error_prop
print("--- IC para Proporção Populacional ---")
print(f"Proporção amostral (p_hat): {p_hat:.3f}")
print(f"Erro Padrão: {se_prop:.4f}")
print(f"Valor Crítico Z: {z_critical_prop:.3f}")
print(f"Margem de Erro: {margin_error_prop:.4f}")
print(f"Intervalo de Confiança ({conf_level_prop*100:.0f}%): [{ic_lower_prop:.4f}, {ic_upper_prop:.4f}]")
# Usando o pacote statsmodels para verificação (função confint_proportion)
# Note: statsmodels tem algumas opções para o método, "normal" é o mais comum
ci_sm_prop = sm.proportion_confint(count=n_sucessos, nobs=n_total, alpha=1-conf_level_prop, method='normal')
print(f"IC (statsmodels): [{ci_sm_prop:.4f}, {ci_sm_prop:.4f}]")# Dados do problema
n_sucessos <- 220 # Número de eleitores que votariam no Candidato X
n_total <- 400 # Tamanho total da amostra
conf_level_prop <- 0.99
# Proporção amostral
p_hat <- n_sucessos / n_total
# Erro Padrão da proporção
se_prop <- sqrt((p_hat * (1 - p_hat)) / n_total)
# Valor Crítico Z
z_critical_prop <- qnorm(1 - (1 - conf_level_prop) / 2)
# Margem de Erro
margin_error_prop <- z_critical_prop * se_prop
ic_lower_prop <- p_hat - margin_error_prop
ic_upper_prop <- p_hat + margin_error_prop
cat("--- IC para Proporção Populacional ---\n")
cat(sprintf("Proporção amostral (p_hat): %.3f\n", p_hat))
cat(sprintf("Erro Padrão: %.4f\n", se_prop))
cat(sprintf("Valor Crítico Z: %.3f\n", z_critical_prop))
cat(sprintf("Margem de Erro: %.4f\n", margin_error_prop))
cat(sprintf("Intervalo de Confiança (%.0f%%): [%.4f, %.4f]\n", conf_level_prop * 100, ic_lower_prop, ic_upper_prop))
# O pacote `stats` do R tem uma função para testes de proporção que também pode gerar ICs
# prop.test(x, n, conf.level = 0.99)$conf.int
# ou binom.test(x, n, conf.level = 0.99)$conf.int
test_prop_result <- prop.test(n_sucessos, n_total, conf.level = conf_level_prop)
cat("\nIC (prop.test()):\n")
print(test_prop_result$conf.int)Interpretando um Intervalo de Confiança
A interpretação correta é crucial e frequentemente mal compreendida:
“Podemos ter \(X\%\) de confiança de que o verdadeiro parâmetro populacional (média, proporção, etc.) está contido neste intervalo [Limite Inferior, Limite Superior].”
O que NÃO significa:
NÃO significa que há \(X\%\) de chance de o parâmetro populacional estar no intervalo. O parâmetro populacional é um valor fixo (embora desconhecido); ele está ou não está no intervalo.
NÃO significa que há \(X\%\) de chance de a próxima amostra ter sua estimativa pontual dentro deste intervalo.
NÃO significa que \(X\%\) dos dados da amostra estão dentro do intervalo.
O que significa (corretamente): Se repetirmos o processo de amostragem e construirmos um intervalo de confiança para cada amostra, espera-se que \(X\%\) desses intervalos construídos contenham o verdadeiro parâmetro populacional.
Fatores que Afetam a Largura do Intervalo de Confiança
A largura da Margem de Erro (e, consequentemente, do intervalo de confiança) é influenciada por:
- Nível de Confiança: Um nível de confiança maior (ex: 99% vs. 95%) requer um intervalo mais amplo (maior Margem de Erro) para ter maior certeza.
- Tamanho da Amostra (\(n\)): Um tamanho de amostra maior resulta em um erro padrão menor e, portanto, um intervalo mais estreito e preciso. (Quanto maior \(n\), menor a variabilidade amostral).
- Desvio Padrão (\(\sigma\) ou \(s\)): Um desvio padrão maior na população/amostra indica maior variabilidade nos dados e, consequentemente, um erro padrão maior e um intervalo mais amplo.
graph TD
A["Intervalo de Confiança"] --> B("Nível de Confiança");
B -- Aumenta --> BW1("Largura Aumenta");
B -- Diminui --> NW1("Largura Diminui");
A --> C("Tamanho da Amostra (n)");
C -- Aumenta --> NW2("Largura Diminui");
C -- Diminui --> BW2("Largura Aumenta");
A --> D("Variabilidade (σ/s)");
D -- Aumenta --> BW3("Largura Aumenta");
D -- Diminui --> NW3("Largura Diminui");
style A fill:#a7e9ff,stroke:#3b82f6,stroke-width:2px;
style B fill:#ffe0b3,stroke:#ffc107;
style C fill:#ffe0b3,stroke:#ffc107;
style D fill:#ffe0b3,stroke:#ffc107;
style BW1 fill:#f8bbd0,stroke:#e91e63;
style BW2 fill:#f8bbd0,stroke:#e91e63;
style BW3 fill:#f8bbd0,stroke:#e91e63;
style NW1 fill:#d4edda,stroke:#28a745;
style NW2 fill:#d4edda,stroke:#28a745;
style NW3 fill:#d4edda,stroke:#28a745;
Relação com Outros Conceitos
A estimação é a próxima etapa lógica após a amostragem e a estatística descritiva.
- Amostragem: Sem uma amostra representativa, as estimativas (pontual ou por intervalo) seriam viesadas e não poderiam ser generalizadas.
- Estatística Descritiva: As estimativas pontuais (média, desvio padrão, proporção amostrais) são medidas descritivas da amostra, que servem como base para a construção dos intervalos de confiança.
- Distribuições de Probabilidade: A construção de ICs depende da compreensão de distribuições como a normal (para Z) e a t de Student (para t), bem como do Teorema do Limite Central.
- Inferência Estatística: A estimação por intervalo é uma das principais formas de inferência, permitindo-nos tirar conclusões sobre a população com um grau quantificável de incerteza.
Verificação de Aprendizagem
Resolva os problemas abaixo, construindo e interpretando os intervalos de confiança solicitados. Utilize Python ou R para auxiliar nos cálculos.
Problema 1 (Média de Gasto - \(\sigma\) Conhecido):
Uma empresa de varejo sabe, por estudos anteriores, que o desvio padrão do gasto semanal de seus clientes é de R$ 30. Uma amostra aleatória de 100 clientes revelou um gasto médio semanal de R$ 120.
- Qual é a estimativa pontual para o gasto médio semanal de todos os clientes?
- Construa um intervalo de confiança de 95% para o gasto médio semanal populacional.
- Interprete o intervalo de confiança calculado no contexto do problema.
Problema 2 (Tempo de Entrega - \(\sigma\) Desconhecido):
Uma amostra de 30 entregas de um serviço de delivery registrou os seguintes tempos (em minutos):
[28, 35, 32, 29, 40, 31, 33, 27, 36, 30, 29, 34, 38, 30, 31, 35, 32, 28, 30, 34, 37, 29, 32, 30, 31, 36, 28, 33, 30, 35]- Calcule a estimativa pontual para o tempo médio de entrega populacional e o desvio padrão amostral.
- Construa um intervalo de confiança de 90% para o tempo médio de entrega populacional.
- Interprete o intervalo de confiança.
Problema 3 (Aprovação de Recurso - Proporção):
Em uma amostra de 200 pedidos de recurso analisados, 130 foram aprovados.
- Qual é a estimativa pontual para a proporção de pedidos de recurso aprovados na população?
- Construa um intervalo de confiança de 99% para a proporção populacional de pedidos de recurso aprovados.
- Interprete o intervalo de confiança.
Problema 4 (Fatores da Largura do IC):
Considere o intervalo de confiança para a média. Como a largura deste intervalo mudaria (aumentaria, diminuiria, permaneceria a mesma) em cada uma das seguintes situações, mantendo os outros fatores constantes?
- O nível de confiança é aumentado de 95% para 99%.
- O tamanho da amostra é aumentado de 50 para 200.
- O desvio padrão da amostra é reduzido.
Soluções da Atividade
Problema 1 (Média de Gasto - \(\sigma\) Conhecido):
Dados: \(\sigma = 30\), \(n = 100\), \(\bar{x} = 120\). Nível de confiança = 95%.
Estimativa pontual para o gasto médio semanal de todos os clientes: A estimativa pontual é a média amostral: \(\bar{x} = \textbf{R\$ 120,00}\).
Intervalo de confiança de 95% para o gasto médio semanal populacional:
- \(Z_{\alpha/2}\) para 95% de confiança é \(Z_{0.025} = 1.96\).
- Erro Padrão (EP) = \(\frac{\sigma}{\sqrt{n}} = \frac{30}{\sqrt{100}} = \frac{30}{10} = 3\).
- Margem de Erro (ME) = \(Z_{\alpha/2} \times EP = 1.96 \times 3 = 5.88\).
- \(IC = \bar{x} \pm ME = 120 \pm 5.88\).
- \(\textbf{IC = [114.12, 125.88]}\).
import numpy as np
from scipy import stats
sigma = 30
n = 100
x_bar = 120
conf_level = 0.95
# a) Estimativa Pontual
print(f"a) Estimativa pontual para o gasto médio semanal: R$ {x_bar:.2f}")
# b) IC de 95%
se = sigma / np.sqrt(n)
z_critical = stats.norm.ppf(1 - (1 - conf_level) / 2)
margin_error = z_critical * se
ic_lower = x_bar - margin_error
ic_upper = x_bar + margin_error
print(f"b) Intervalo de Confiança ({conf_level*100:.0f}%): [R$ {ic_lower:.2f}, R$ {ic_upper:.2f}]")sigma <- 30
n <- 100
x_bar <- 120
conf_level <- 0.95
# a) Estimativa Pontual
cat(sprintf("a) Estimativa pontual para o gasto médio semanal: R$ %.2f\n", x_bar))
# b) IC de 95%
se <- sigma / sqrt(n)
z_critical <- qnorm(1 - (1 - conf_level) / 2)
margin_error <- z_critical * se
ic_lower <- x_bar - margin_error
ic_upper <- x_bar + margin_error
cat(sprintf("b) Intervalo de Confiança (%.0f%%): [R$ %.2f, R$ %.2f]\n", conf_level * 100, ic_lower, ic_upper))- Interpretação: Com 95% de confiança, o verdadeiro gasto médio semanal de todos os clientes desta empresa está entre R$ 114,12 e R$ 125,88. Isso significa que se repetíssemos este estudo muitas vezes, 95% dos intervalos construídos dessa forma conteriam o verdadeiro gasto médio.
Problema 2 (Tempo de Entrega - \(\sigma\) Desconhecido):
Dados: [28, 35, 32, 29, 40, 31, 33, 27, 36, 30, 29, 34, 38, 30, 31, 35, 32, 28, 30, 34, 37, 29, 32, 30, 31, 36, 28, 33, 30, 35] Nível de confiança = 90%.
Estimativa pontual para o tempo médio de entrega populacional e desvio padrão amostral:
- Média amostral (\(\bar{x}\)) = 32.07 minutos.
- Desvio padrão amostral (\(s\)) = 3.65 minutos.
tempos <- c(28, 35, 32, 29, 40, 31, 33, 27, 36, 30, 29, 34, 38, 30, 31, 35, 32, 28, 30, 34, 37, 29, 32, 30, 31, 36, 28, 33, 30, 35)
n <- length(tempos)
x_bar <- mean(tempos)
s <- sd(tempos) # sd() em R calcula o desvio padrão amostral
cat(sprintf("a) Estimativa pontual para o tempo médio de entrega: %.2f minutos\n", x_bar))
cat(sprintf("Desvio Padrão amostral: %.2f minutos\n", s))Intervalo de confiança de 90% para o tempo médio de entrega populacional:
- Graus de liberdade (\(df\)) = \(n-1 = 30-1 = 29\).
- \(t_{\alpha/2, df}\) para 90% de confiança (0.05 em cada cauda) com 29 graus de liberdade é \(t_{0.05, 29} \approx 1.699\).
- Erro Padrão (EP) = \(\frac{s}{\sqrt{n}} = \frac{3.65}{\sqrt{30}} \approx \frac{3.65}{5.477} \approx 0.666\).
- Margem de Erro (ME) = \(t_{\alpha/2, df} \times EP = 1.699 \times 0.666 \approx 1.13\).
- \(IC = \bar{x} \pm ME = 32.07 \pm 1.13\).
- \(\textbf{IC = [30.94, 33.20]}\).
import numpy as np
from scipy import stats
tempos = np.array()
n = len(tempos)
x_bar = np.mean(tempos)
s = np.std(tempos, ddof=1)
conf_level = 0.90
# b) IC de 90%
se = s / np.sqrt(n)
df = n - 1
t_critical = stats.t.ppf(1 - (1 - conf_level) / 2, df)
margin_error = t_critical * se
ic_lower = x_bar - margin_error
ic_upper = x_bar + margin_error
print(f"\nb) Intervalo de Confiança ({conf_level*100:.0f}%): [{ic_lower:.2f}, {ic_upper:.2f}] minutos")tempos <- c(28, 35, 32, 29, 40, 31, 33, 27, 36, 30, 29, 34, 38, 30, 31, 35, 32, 28, 30, 34, 37, 29, 32, 30, 31, 36, 28, 33, 30, 35)
n <- length(tempos)
x_bar <- mean(tempos)
s <- sd(tempos)
conf_level <- 0.90
# b) IC de 90%
se <- s / sqrt(n)
df <- n - 1
t_critical <- qt(1 - (1 - conf_level) / 2, df)
margin_error <- t_critical * se
ic_lower <- x_bar - margin_error
ic_upper <- x_bar + margin_error
cat(sprintf("\nb) Intervalo de Confiança (%.0f%%): [%.2f, %.2f] minutos\n", conf_level * 100, ic_lower, ic_upper))- Interpretação: Com 90% de confiança, o verdadeiro tempo médio de entrega para este serviço de delivery está entre 30.94 e 33.20 minutos.
Problema 3 (Aprovação de Recurso - Proporção):
Dados: \(n = 200\), número de sucessos = 130. Nível de confiança = 99%.
Estimativa pontual para a proporção de pedidos de recurso aprovados na população:
Proporção amostral (\(\hat{p}\)) = \(130/200 = \textbf{0.65}\).
Intervalo de confiança de 99% para a proporção populacional:
- \(Z_{\alpha/2}\) para 99% de confiança é \(Z_{0.005} = 2.576\).
- Erro Padrão (EP) = \(\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} = \sqrt{\frac{0.65(1-0.65)}{200}} = \sqrt{\frac{0.65 \times 0.35}{200}} = \sqrt{\frac{0.2275}{200}} = \sqrt{0.0011375} \approx 0.0337\).
- Margem de Erro (ME) = \(Z_{\alpha/2} \times EP = 2.576 \times 0.0337 \approx 0.0869\).
- \(IC = \hat{p} \pm ME = 0.65 \pm 0.0869\).
- \(\textbf{IC = [0.5631, 0.7369]}\).
import numpy as np
from scipy import stats
import statsmodels.stats.api as sm
n_sucessos = 130
n_total = 200
conf_level = 0.99
# a) Estimativa Pontual
p_hat = n_sucessos / n_total
print(f"a) Estimativa pontual para a proporção de pedidos aprovados: {p_hat:.2f}")
# b) IC de 99%
se = np.sqrt((p_hat * (1 - p_hat)) / n_total)
z_critical = stats.norm.ppf(1 - (1 - conf_level) / 2)
margin_error = z_critical * se
ic_lower = p_hat - margin_error
ic_upper = p_hat + margin_error
print(f"b) Intervalo de Confiança ({conf_level*100:.0f}%): [{ic_lower:.4f}, {ic_upper:.4f}]")n_sucessos <- 130
n_total <- 200
conf_level <- 0.99
# a) Estimativa Pontual
p_hat <- n_sucessos / n_total
cat(sprintf("a) Estimativa pontual para a proporção de pedidos aprovados: %.2f\n", p_hat))
# b) IC de 99%
se <- sqrt((p_hat * (1 - p_hat)) / n_total)
z_critical <- qnorm(1 - (1 - conf_level) / 2)
margin_error <- z_critical * se
ic_lower <- p_hat - margin_error
ic_upper <- p_hat + margin_error
cat(sprintf("b) Intervalo de Confiança (%.0f%%): [%.4f, %.4f]\n", conf_level * 100, ic_lower, ic_upper))- Interpretação: Com 99% de confiança, a verdadeira proporção de pedidos de recurso aprovados na população está entre 56.31% e 73.69%.
Problema 4 (Fatores da Largura do IC):
O nível de confiança é aumentado de 95% para 99%.
- A largura do intervalo AUMENTARÁ. Um nível de confiança maior exige que o intervalo seja mais amplo para “capturar” o parâmetro populacional com maior certeza.
O tamanho da amostra é aumentado de 50 para 200.
- A largura do intervalo DIMINUIRÁ. Um tamanho de amostra maior reduz o erro padrão (a variabilidade amostral), levando a uma estimativa mais precisa e, consequentemente, a um intervalo mais estreito.
O desvio padrão da amostra é reduzido.
- A largura do intervalo DIMINUIRÁ. Um desvio padrão menor indica que os dados são mais homogêneos e menos dispersos, resultando em um erro padrão menor e um intervalo mais estreito.