Estimação: Ponto e Intervalo de Confiança

Estimando Parâmetros Populacionais e Construindo Intervalos de Confiança

Autor

Márcio Nicolau

Data de Publicação

8 de outubro de 2025

Introdução e Objetivos

Nas aulas anteriores, aprendemos sobre amostragem e a importância de coletar dados de um subconjunto da população. O objetivo final da amostragem é usar as informações da amostra para fazer inferências sobre a população da qual ela foi retirada. É aqui que entramos no campo da Estimação.

A estimação é o processo de utilizar dados amostrais para calcular ou prever valores desconhecidos de parâmetros populacionais. Raramente temos acesso a toda a população, então a estatística nos fornece ferramentas para fazer as melhores “apostas” sobre esses parâmetros. Abordaremos duas formas principais de estimação: a estimação pontual, que fornece um único valor como a melhor estimativa, e a estimação por intervalo, que oferece um alcance de valores dentro do qual o parâmetro populacional provavelmente se encontra, acompanhado de um nível de confiança.

Este é um pilar fundamental da inferência estatística, permitindo-nos ir além da descrição dos dados amostrais para fazer generalizações sobre o universo de interesse.

Objetivos de Aprendizagem

Ao final desta aula, você será capaz de:

Distinguir entre estimação pontual e estimação por intervalo.
Compreender os conceitos de estimador, estimativa, erro padrão, nível de confiança e margem de erro.
Construir e interpretar intervalos de confiança para a média populacional (com variância conhecida e desconhecida).
Construir e interpretar intervalos de confiança para a proporção populacional.
Reconhecer os fatores que influenciam a largura de um intervalo de confiança.
Utilizar Python e R para calcular estimações pontuais e construir intervalos de confiança.

Estimação Pontual

A estimação pontual envolve o uso de uma estatística amostral (calculada a partir da amostra) para estimar um parâmetro populacional desconhecido com um único valor. Este valor é chamado de estimativa pontual.

Estimador: É a regra ou fórmula usada para calcular a estimativa (por exemplo, a média amostral $\bar{X}$).
Estimativa: É o valor numérico específico obtido pelo estimador a partir de uma amostra particular (por exemplo, $\bar{x} = 15.7$).

Exemplos Comuns de Estimativas Pontuais:

A média amostral ($\bar{x}$) é a estimativa pontual mais comum para a média populacional ($\mu$).
A proporção amostral ($\hat{p}$) é a estimativa pontual para a proporção populacional ($P$).
O desvio padrão amostral ($s$) é a estimativa pontual para o desvio padrão populacional ($\sigma$).

Vantagens: Simples e fácil de entender.

Desvantagens: Não nos diz quão “boa” é a estimativa, ou seja, não há nenhuma indicação da precisão ou da variabilidade associada a ela. É improvável que a estimativa pontual seja exatamente igual ao parâmetro populacional.

Diagrama: Estimação Pontual

graph TD
    A["População (Parâmetro Desconhecido)"] --> B["Extrair Amostra"];
    B --> C["Calcular Estatística Amostral"];
    C --> D["Estimativa Pontual (Valor Único)"];
    D --> E["Estimador"];

    style A fill:#f8bbd0,stroke:#e91e63,stroke-width:2px;
    style B fill:#ffe0b3,stroke:#ffc107;
    style C fill:#e6f3ff,stroke:#007bff;
    style D fill:#d4edda,stroke:#28a745,stroke-width:2px;
    style E fill:#fff8e1,stroke:#ffa000;

Figura 1: Diagrama da Estimação Pontual

Estimação por Intervalo (Intervalos de Confiança)

A estimação por intervalo fornece um alcance de valores, chamado de intervalo de confiança (IC), dentro do qual o parâmetro populacional provavelmente se encontra. Ela é acompanhada por um nível de confiança, que expressa a probabilidade de que este intervalo contenha o verdadeiro parâmetro populacional.

Conceitos Chave

Nível de Confiança ($1-\alpha$): É a probabilidade de que o intervalo de confiança contenha o verdadeiro parâmetro populacional. Geralmente expresso como uma porcentagem (ex: 90%, 95%, 99%). Um nível de confiança de 95% significa que, se repetíssemos o processo de amostragem e construção de intervalos muitas vezes, esperaríamos que 95% desses intervalos contivessem o verdadeiro parâmetro populacional.
Margem de Erro (ME): É a metade da largura do intervalo de confiança. Ela representa a quantidade máxima em que a estimativa pontual pode diferir do verdadeiro parâmetro populacional com o nível de confiança especificado.
Erro Padrão (EP): É o desvio padrão da distribuição amostral de uma estatística (ex: erro padrão da média, erro padrão da proporção). Ele mede a variabilidade das estatísticas amostrais de amostra para amostra.

A forma geral de um intervalo de confiança é: (Bussab; Morettin, 2017, p. 195) \[\text{Estimativa Pontual} \pm \text{Margem de Erro}\]

A Margem de Erro é calculada como: \[\text{Margem de Erro} = \text{Valor Crítico} \times \text{Erro Padrão do Estimador}\]

O Valor Crítico é um valor da distribuição de probabilidade (normal ou t-student) que corresponde ao nível de confiança desejado.

Intervalo de Confiança para a Média Populacional ($\mu$)

Com Desvio Padrão Populacional ($\sigma$) Conhecido (Distribuição Z)

Quando o desvio padrão populacional ($\sigma$) é conhecido (situação rara na prática, mas importante para a teoria ou quando $n$ é grande e $s$ é usado como $\sigma$).

Requisito: A população é normalmente distribuída ou o tamanho da amostra é grande ($n \ge 30$, pelo Teorema do Limite Central).

Fórmula: (Bussab; Morettin, 2017, p. 195)

\[IC = \bar{x} \pm Z_{\alpha/2} \frac{\sigma}{\sqrt{n}}\]

Onde:

$\bar{x}$: média amostral.
$Z_{\alpha/2}$: valor crítico da distribuição normal padrão para o nível de confiança $1-\alpha$.
$\sigma$: desvio padrão populacional.
$n$: tamanho da amostra.
$\frac{\sigma}{\sqrt{n}}$: erro padrão da média.

Valores comuns de $Z_{\alpha/2}$:

90% de confiança: $Z_{0.05} = 1.645$
95% de confiança: $Z_{0.025} = 1.96$
99% de confiança: $Z_{0.005} = 2.576$

Exemplo: Uma amostra de 50 alunos tem média de altura de 170 cm. Suponha que o desvio padrão populacional conhecido seja de 10 cm. Construa um IC de 95% para a altura média da população.

$\bar{x} = 170$, $\sigma = 10$, $n = 50$, $Z_{0.025} = 1.96$.
$IC = 170 \pm 1.96 \frac{10}{\sqrt{50}} = 170 \pm 1.96 \frac{10}{7.071} = 170 \pm 1.96 \times 1.414 = 170 \pm 2.77$
$IC = [167.23, 172.77]$

Com Desvio Padrão Populacional ($\sigma$) Desconhecido (Distribuição t de Student)

Esta é a situação mais comum na prática, onde o desvio padrão populacional é desconhecido e é estimado pelo desvio padrão amostral ($s$).

Requisito: A população é normalmente distribuída ou o tamanho da amostra é grande ($n \ge 30$, pelo Teorema do Limite Central, onde a distribuição t se aproxima da normal).

Fórmula: (Bussab; Morettin, 2017, p. 198)

\[IC = \bar{x} \pm t_{\alpha/2, n-1} \frac{s}{\sqrt{n}}\]

Onde:

$\bar{x}$: média amostral.
$t_{\alpha/2, n-1}$: valor crítico da distribuição t de Student com $n-1$ graus de liberdade para o nível de confiança $1-\alpha$.
$s$: desvio padrão amostral.
$n$: tamanho da amostra.
$\frac{s}{\sqrt{n}}$: erro padrão da média (estimado).

A distribuição t de Student é mais “gorda” nas caudas que a distribuição normal, refletindo a incerteza adicional de estimar $\sigma$ a partir de $s$. À medida que os graus de liberdade ($n-1$) aumentam, a distribuição t se aproxima da distribuição normal.

Exemplo: Uma amostra de 25 estudantes de uma turma tem uma média de peso de 68 kg e um desvio padrão amostral de 5 kg. Construa um IC de 95% para o peso médio da população de estudantes.

$\bar{x} = 68$, $s = 5$, $n = 25$. Graus de liberdade $df = n-1 = 24$.
Para um IC de 95%, $\alpha/2 = 0.025$.
Valor crítico $t_{0.025, 24} \approx 2.064$ (obtido de tabelas t ou software).
$IC = 68 \pm 2.064 \frac{5}{\sqrt{25}} = 68 \pm 2.064 \frac{5}{5} = 68 \pm 2.064 \times 1 = 68 \pm 2.064$
$IC = [65.936, 70.064]$

Código para Intervalo de Confiança para a Média

import numpy as np
from scipy import stats

# Exemplo 1: Sigma conhecido (Z-test)
data_z = np.array() # Média amostral
sigma_pop = 10 # Desvio padrão populacional conhecido
n_z = 50
conf_level_z = 0.95

# Erro Padrão
se_z = sigma_pop / np.sqrt(n_z)

# Valor Crítico Z
z_critical = stats.norm.ppf(1 - (1 - conf_level_z) / 2) # ppf é a função inversa da CDF
margin_error_z = z_critical * se_z

ic_lower_z = data_z - margin_error_z
ic_upper_z = data_z + margin_error_z

print("--- IC para Média (Sigma Conhecido) ---")
print(f"Média amostral: {data_z:.2f}")
print(f"Erro Padrão: {se_z:.3f}")
print(f"Valor Crítico Z: {z_critical:.3f}")
print(f"Margem de Erro: {margin_error_z:.3f}")
print(f"Intervalo de Confiança ({conf_level_z*100:.0f}%): [{ic_lower_z:.3f}, {ic_upper_z:.3f}]")

# Exemplo 2: Sigma desconhecido (t-test)
data_t = np.array()
n_t = len(data_t)
mean_t = np.mean(data_t)
std_dev_t = np.std(data_t, ddof=1) # ddof=1 para desvio padrão amostral
conf_level_t = 0.95

# Erro Padrão
se_t = std_dev_t / np.sqrt(n_t)

# Graus de Liberdade
df_t = n_t - 1

# Valor Crítico t
t_critical = stats.t.ppf(1 - (1 - conf_level_t) / 2, df_t)
margin_error_t = t_critical * se_t

ic_lower_t = mean_t - margin_error_t
ic_upper_t = mean_t + margin_error_t

print("\n--- IC para Média (Sigma Desconhecido) ---")
print(f"Média amostral: {mean_t:.2f}")
print(f"Desvio Padrão amostral: {std_dev_t:.2f}")
print(f"Erro Padrão: {se_t:.3f}")
print(f"Graus de Liberdade: {df_t}")
print(f"Valor Crítico t: {t_critical:.3f}")
print(f"Margem de Erro: {margin_error_t:.3f}")
print(f"Intervalo de Confiança ({conf_level_t*100:.0f}%): [{ic_lower_t:.3f}, {ic_upper_t:.3f}]")

# O pacote statsmodels oferece uma forma mais direta
# import statsmodels.stats.api as sm
# ci_sm = sm.DescrStatsW(data_t).tconfint_mean(alpha=1-conf_level_t)
# print(f"IC (statsmodels): [{ci_sm:.3f}, {ci_sm:.3f}]")

# Exemplo 1: Sigma conhecido (Z-test) - Usando a fórmula manual
mean_z <- 170
sigma_pop <- 10 # Desvio padrão populacional conhecido
n_z <- 50
conf_level_z <- 0.95

# Erro Padrão
se_z <- sigma_pop / sqrt(n_z)

# Valor Crítico Z
z_critical <- qnorm(1 - (1 - conf_level_z) / 2) # qnorm é a função inversa da CDF
margin_error_z <- z_critical * se_z

ic_lower_z <- mean_z - margin_error_z
ic_upper_z <- mean_z + margin_error_z

cat("--- IC para Média (Sigma Conhecido) ---\n")
cat(sprintf("Média amostral: %.2f\n", mean_z))
cat(sprintf("Erro Padrão: %.3f\n", se_z))
cat(sprintf("Valor Crítico Z: %.3f\n", z_critical))
cat(sprintf("Margem de Erro: %.3f\n", margin_error_z))
cat(sprintf("Intervalo de Confiança (%.0f%%): [%.3f, %.3f]\n", conf_level_z * 100, ic_lower_z, ic_upper_z))

# Exemplo 2: Sigma desconhecido (t-test) - Usando a função t.test()
data_t <- c(68, 65, 72, 70, 63, 75, 69, 66, 71, 67, 68, 64, 73, 70, 66, 68, 69, 72, 65, 67, 70, 68, 66, 71, 69)
n_t <- length(data_t)
mean_t <- mean(data_t)
std_dev_t <- sd(data_t) # sd() em R calcula o desvio padrão amostral (n-1 no denominador)
conf_level_t <- 0.95

# Erro Padrão
se_t <- std_dev_t / sqrt(n_t)

# Graus de Liberdade
df_t <- n_t - 1

# Valor Crítico t
t_critical <- qt(1 - (1 - conf_level_t) / 2, df_t)
margin_error_t <- t_critical * se_t

ic_lower_t <- mean_t - margin_error_t
ic_upper_t <- mean_t + margin_error_t

cat("\n--- IC para Média (Sigma Desconhecido) ---\n")
cat(sprintf("Média amostral: %.2f\n", mean_t))
cat(sprintf("Desvio Padrão amostral: %.2f\n", std_dev_t))
cat(sprintf("Erro Padrão: %.3f\n", se_t))
cat(sprintf("Graus de Liberdade: %d\n", df_t))
cat(sprintf("Valor Crítico t: %.3f\n", t_critical))
cat(sprintf("Margem de Erro: %.3f\n", margin_error_t))
cat(sprintf("Intervalo de Confiança (%.0f%%): [%.3f, %.3f]\n", conf_level_t * 100, ic_lower_t, ic_upper_t))

# Usando a função t.test() que já calcula o IC
test_result <- t.test(data_t, conf.level = conf_level_t)
cat("\nIC (t.test()):\n")
print(test_result$conf.int)

Intervalo de Confiança para a Proporção Populacional ($P$)

Usado para estimar a proporção de elementos na população que possuem uma determinada característica.

Requisitos:

A amostra é aleatória simples.
As condições para a aproximação normal da distribuição amostral da proporção são satisfeitas (geralmente $n\hat{p} \ge 5$ e $n(1-\hat{p}) \ge 5$, onde alguns autores usam 10).

Fórmula: (Bussab; Morettin, 2017, p. 200)

\[IC = \hat{p} \pm Z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\]

Onde:

$\hat{p}$: proporção amostral (número de sucessos / $n$).
$Z_{\alpha/2}$: valor crítico da distribuição normal padrão.
$n$: tamanho da amostra.
$\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$: erro padrão da proporção.

Exemplo: Em uma pesquisa com 400 eleitores, 220 disseram que votariam no Candidato X. Construa um IC de 99% para a proporção de eleitores que votariam no Candidato X.

$\hat{p} = 220/400 = 0.55$. $n = 400$.
Para um IC de 99%, $Z_{0.005} = 2.576$.
Erro Padrão: $\sqrt{\frac{0.55(1-0.55)}{400}} = \sqrt{\frac{0.55 \times 0.45}{400}} = \sqrt{\frac{0.2475}{400}} = \sqrt{0.00061875} \approx 0.02487$
$IC = 0.55 \pm 2.576 \times 0.02487 = 0.55 \pm 0.0641$
$IC = [0.4859, 0.6141]$

Código para Intervalo de Confiança para a Proporção

import numpy as np
from scipy import stats
import statsmodels.stats.api as sm

# Dados do problema
n_sucessos = 220 # Número de eleitores que votariam no Candidato X
n_total = 400 # Tamanho total da amostra
conf_level_prop = 0.99

# Proporção amostral
p_hat = n_sucessos / n_total

# Erro Padrão da proporção
se_prop = np.sqrt((p_hat * (1 - p_hat)) / n_total)

# Valor Crítico Z
z_critical_prop = stats.norm.ppf(1 - (1 - conf_level_prop) / 2)

# Margem de Erro
margin_error_prop = z_critical_prop * se_prop

ic_lower_prop = p_hat - margin_error_prop
ic_upper_prop = p_hat + margin_error_prop

print("--- IC para Proporção Populacional ---")
print(f"Proporção amostral (p_hat): {p_hat:.3f}")
print(f"Erro Padrão: {se_prop:.4f}")
print(f"Valor Crítico Z: {z_critical_prop:.3f}")
print(f"Margem de Erro: {margin_error_prop:.4f}")
print(f"Intervalo de Confiança ({conf_level_prop*100:.0f}%): [{ic_lower_prop:.4f}, {ic_upper_prop:.4f}]")

# Usando o pacote statsmodels para verificação (função confint_proportion)
# Note: statsmodels tem algumas opções para o método, "normal" é o mais comum
ci_sm_prop = sm.proportion_confint(count=n_sucessos, nobs=n_total, alpha=1-conf_level_prop, method='normal')
print(f"IC (statsmodels): [{ci_sm_prop:.4f}, {ci_sm_prop:.4f}]")

# Dados do problema
n_sucessos <- 220 # Número de eleitores que votariam no Candidato X
n_total <- 400 # Tamanho total da amostra
conf_level_prop <- 0.99

# Proporção amostral
p_hat <- n_sucessos / n_total

# Erro Padrão da proporção
se_prop <- sqrt((p_hat * (1 - p_hat)) / n_total)

# Valor Crítico Z
z_critical_prop <- qnorm(1 - (1 - conf_level_prop) / 2)

# Margem de Erro
margin_error_prop <- z_critical_prop * se_prop

ic_lower_prop <- p_hat - margin_error_prop
ic_upper_prop <- p_hat + margin_error_prop

cat("--- IC para Proporção Populacional ---\n")
cat(sprintf("Proporção amostral (p_hat): %.3f\n", p_hat))
cat(sprintf("Erro Padrão: %.4f\n", se_prop))
cat(sprintf("Valor Crítico Z: %.3f\n", z_critical_prop))
cat(sprintf("Margem de Erro: %.4f\n", margin_error_prop))
cat(sprintf("Intervalo de Confiança (%.0f%%): [%.4f, %.4f]\n", conf_level_prop * 100, ic_lower_prop, ic_upper_prop))

# O pacote `stats` do R tem uma função para testes de proporção que também pode gerar ICs
# prop.test(x, n, conf.level = 0.99)$conf.int
# ou binom.test(x, n, conf.level = 0.99)$conf.int
test_prop_result <- prop.test(n_sucessos, n_total, conf.level = conf_level_prop)
cat("\nIC (prop.test()):\n")
print(test_prop_result$conf.int)

Interpretando um Intervalo de Confiança

A interpretação correta é crucial e frequentemente mal compreendida:

“Podemos ter $X\%$ de confiança de que o verdadeiro parâmetro populacional (média, proporção, etc.) está contido neste intervalo [Limite Inferior, Limite Superior].”

O que NÃO significa:

NÃO significa que há $X\%$ de chance de o parâmetro populacional estar no intervalo. O parâmetro populacional é um valor fixo (embora desconhecido); ele está ou não está no intervalo.
NÃO significa que há $X\%$ de chance de a próxima amostra ter sua estimativa pontual dentro deste intervalo.
NÃO significa que $X\%$ dos dados da amostra estão dentro do intervalo.

O que significa (corretamente): Se repetirmos o processo de amostragem e construirmos um intervalo de confiança para cada amostra, espera-se que $X\%$ desses intervalos construídos contenham o verdadeiro parâmetro populacional.

Fatores que Afetam a Largura do Intervalo de Confiança

A largura da Margem de Erro (e, consequentemente, do intervalo de confiança) é influenciada por:

Nível de Confiança: Um nível de confiança maior (ex: 99% vs. 95%) requer um intervalo mais amplo (maior Margem de Erro) para ter maior certeza.
Tamanho da Amostra ($n$): Um tamanho de amostra maior resulta em um erro padrão menor e, portanto, um intervalo mais estreito e preciso. (Quanto maior $n$, menor a variabilidade amostral).
Desvio Padrão ($\sigma$ ou $s$): Um desvio padrão maior na população/amostra indica maior variabilidade nos dados e, consequentemente, um erro padrão maior e um intervalo mais amplo.

graph TD
    A["Intervalo de Confiança"] --> B("Nível de Confiança");
    B -- Aumenta --> BW1("Largura Aumenta");
    B -- Diminui --> NW1("Largura Diminui");

    A --> C("Tamanho da Amostra (n)");
    C -- Aumenta --> NW2("Largura Diminui");
    C -- Diminui --> BW2("Largura Aumenta");

    A --> D("Variabilidade (σ/s)");
    D -- Aumenta --> BW3("Largura Aumenta");
    D -- Diminui --> NW3("Largura Diminui");

    style A fill:#a7e9ff,stroke:#3b82f6,stroke-width:2px;
    style B fill:#ffe0b3,stroke:#ffc107;
    style C fill:#ffe0b3,stroke:#ffc107;
    style D fill:#ffe0b3,stroke:#ffc107;
    style BW1 fill:#f8bbd0,stroke:#e91e63;
    style BW2 fill:#f8bbd0,stroke:#e91e63;
    style BW3 fill:#f8bbd0,stroke:#e91e63;
    style NW1 fill:#d4edda,stroke:#28a745;
    style NW2 fill:#d4edda,stroke:#28a745;
    style NW3 fill:#d4edda,stroke:#28a745;

Figura 2: Fatores que Afetam a Largura do Intervalo de Confiança

Relação com Outros Conceitos

A estimação é a próxima etapa lógica após a amostragem e a estatística descritiva.

Amostragem: Sem uma amostra representativa, as estimativas (pontual ou por intervalo) seriam viesadas e não poderiam ser generalizadas.
Estatística Descritiva: As estimativas pontuais (média, desvio padrão, proporção amostrais) são medidas descritivas da amostra, que servem como base para a construção dos intervalos de confiança.
Distribuições de Probabilidade: A construção de ICs depende da compreensão de distribuições como a normal (para Z) e a t de Student (para t), bem como do Teorema do Limite Central.
Inferência Estatística: A estimação por intervalo é uma das principais formas de inferência, permitindo-nos tirar conclusões sobre a população com um grau quantificável de incerteza.

Verificação de Aprendizagem

Resolva os problemas abaixo, construindo e interpretando os intervalos de confiança solicitados. Utilize Python ou R para auxiliar nos cálculos.

Problema 1 (Média de Gasto - $\sigma$ Conhecido):

Uma empresa de varejo sabe, por estudos anteriores, que o desvio padrão do gasto semanal de seus clientes é de R$ 30. Uma amostra aleatória de 100 clientes revelou um gasto médio semanal de R$ 120.
1. Qual é a estimativa pontual para o gasto médio semanal de todos os clientes?
2. Construa um intervalo de confiança de 95% para o gasto médio semanal populacional.
3. Interprete o intervalo de confiança calculado no contexto do problema.
Problema 2 (Tempo de Entrega - $\sigma$ Desconhecido):

Uma amostra de 30 entregas de um serviço de delivery registrou os seguintes tempos (em minutos): [28, 35, 32, 29, 40, 31, 33, 27, 36, 30, 29, 34, 38, 30, 31, 35, 32, 28, 30, 34, 37, 29, 32, 30, 31, 36, 28, 33, 30, 35]
1. Calcule a estimativa pontual para o tempo médio de entrega populacional e o desvio padrão amostral.
2. Construa um intervalo de confiança de 90% para o tempo médio de entrega populacional.
3. Interprete o intervalo de confiança.
Problema 3 (Aprovação de Recurso - Proporção):

Em uma amostra de 200 pedidos de recurso analisados, 130 foram aprovados.
1. Qual é a estimativa pontual para a proporção de pedidos de recurso aprovados na população?
2. Construa um intervalo de confiança de 99% para a proporção populacional de pedidos de recurso aprovados.
3. Interprete o intervalo de confiança.
Problema 4 (Fatores da Largura do IC):

Considere o intervalo de confiança para a média. Como a largura deste intervalo mudaria (aumentaria, diminuiria, permaneceria a mesma) em cada uma das seguintes situações, mantendo os outros fatores constantes?
1. O nível de confiança é aumentado de 95% para 99%.
2. O tamanho da amostra é aumentado de 50 para 200.
3. O desvio padrão da amostra é reduzido.

Soluções da Atividade

Solução

Problema 1 (Média de Gasto - $\sigma$ Conhecido):

Dados: $\sigma = 30$, $n = 100$, $\bar{x} = 120$. Nível de confiança = 95%.

Estimativa pontual para o gasto médio semanal de todos os clientes: A estimativa pontual é a média amostral: $\bar{x} = \textbf{R\$ 120,00}$.
Intervalo de confiança de 95% para o gasto médio semanal populacional:
- $Z_{\alpha/2}$ para 95% de confiança é $Z_{0.025} = 1.96$.
- Erro Padrão (EP) = $\frac{\sigma}{\sqrt{n}} = \frac{30}{\sqrt{100}} = \frac{30}{10} = 3$.
- Margem de Erro (ME) = $Z_{\alpha/2} \times EP = 1.96 \times 3 = 5.88$.
- $IC = \bar{x} \pm ME = 120 \pm 5.88$.
- $\textbf{IC = [114.12, 125.88]}$.

import numpy as np
from scipy import stats

sigma = 30
n = 100
x_bar = 120
conf_level = 0.95

# a) Estimativa Pontual
print(f"a) Estimativa pontual para o gasto médio semanal: R$ {x_bar:.2f}")

# b) IC de 95%
se = sigma / np.sqrt(n)
z_critical = stats.norm.ppf(1 - (1 - conf_level) / 2)
margin_error = z_critical * se
ic_lower = x_bar - margin_error
ic_upper = x_bar + margin_error

print(f"b) Intervalo de Confiança ({conf_level*100:.0f}%): [R$ {ic_lower:.2f}, R$ {ic_upper:.2f}]")

sigma <- 30
n <- 100
x_bar <- 120
conf_level <- 0.95

# a) Estimativa Pontual
cat(sprintf("a) Estimativa pontual para o gasto médio semanal: R$ %.2f\n", x_bar))

# b) IC de 95%
se <- sigma / sqrt(n)
z_critical <- qnorm(1 - (1 - conf_level) / 2)
margin_error <- z_critical * se
ic_lower <- x_bar - margin_error
ic_upper <- x_bar + margin_error

cat(sprintf("b) Intervalo de Confiança (%.0f%%): [R$ %.2f, R$ %.2f]\n", conf_level * 100, ic_lower, ic_upper))

Interpretação: Com 95% de confiança, o verdadeiro gasto médio semanal de todos os clientes desta empresa está entre R$ 114,12 e R$ 125,88. Isso significa que se repetíssemos este estudo muitas vezes, 95% dos intervalos construídos dessa forma conteriam o verdadeiro gasto médio.

Problema 2 (Tempo de Entrega - $\sigma$ Desconhecido):

Dados: [28, 35, 32, 29, 40, 31, 33, 27, 36, 30, 29, 34, 38, 30, 31, 35, 32, 28, 30, 34, 37, 29, 32, 30, 31, 36, 28, 33, 30, 35] Nível de confiança = 90%.

Estimativa pontual para o tempo médio de entrega populacional e desvio padrão amostral:
- Média amostral ($\bar{x}$) = 32.07 minutos.
- Desvio padrão amostral ($s$) = 3.65 minutos.

import numpy as np
from scipy import stats

tempos = np.array()
n = len(tempos)

x_bar = np.mean(tempos)
s = np.std(tempos, ddof=1) # ddof=1 para desvio padrão amostral

print(f"a) Estimativa pontual para o tempo médio de entrega: {x_bar:.2f} minutos")
print(f"Desvio Padrão amostral: {s:.2f} minutos")

tempos <- c(28, 35, 32, 29, 40, 31, 33, 27, 36, 30, 29, 34, 38, 30, 31, 35, 32, 28, 30, 34, 37, 29, 32, 30, 31, 36, 28, 33, 30, 35)
n <- length(tempos)

x_bar <- mean(tempos)
s <- sd(tempos) # sd() em R calcula o desvio padrão amostral

cat(sprintf("a) Estimativa pontual para o tempo médio de entrega: %.2f minutos\n", x_bar))
cat(sprintf("Desvio Padrão amostral: %.2f minutos\n", s))

Intervalo de confiança de 90% para o tempo médio de entrega populacional:
- Graus de liberdade ($df$) = $n-1 = 30-1 = 29$.
- $t_{\alpha/2, df}$ para 90% de confiança (0.05 em cada cauda) com 29 graus de liberdade é $t_{0.05, 29} \approx 1.699$.
- Erro Padrão (EP) = $\frac{s}{\sqrt{n}} = \frac{3.65}{\sqrt{30}} \approx \frac{3.65}{5.477} \approx 0.666$.
- Margem de Erro (ME) = $t_{\alpha/2, df} \times EP = 1.699 \times 0.666 \approx 1.13$.
- $IC = \bar{x} \pm ME = 32.07 \pm 1.13$.
- $\textbf{IC = [30.94, 33.20]}$.

import numpy as np
from scipy import stats

tempos = np.array()
n = len(tempos)
x_bar = np.mean(tempos)
s = np.std(tempos, ddof=1)
conf_level = 0.90

# b) IC de 90%
se = s / np.sqrt(n)
df = n - 1
t_critical = stats.t.ppf(1 - (1 - conf_level) / 2, df)
margin_error = t_critical * se
ic_lower = x_bar - margin_error
ic_upper = x_bar + margin_error

print(f"\nb) Intervalo de Confiança ({conf_level*100:.0f}%): [{ic_lower:.2f}, {ic_upper:.2f}] minutos")

tempos <- c(28, 35, 32, 29, 40, 31, 33, 27, 36, 30, 29, 34, 38, 30, 31, 35, 32, 28, 30, 34, 37, 29, 32, 30, 31, 36, 28, 33, 30, 35)
n <- length(tempos)
x_bar <- mean(tempos)
s <- sd(tempos)
conf_level <- 0.90

# b) IC de 90%
se <- s / sqrt(n)
df <- n - 1
t_critical <- qt(1 - (1 - conf_level) / 2, df)
margin_error <- t_critical * se
ic_lower <- x_bar - margin_error
ic_upper <- x_bar + margin_error

cat(sprintf("\nb) Intervalo de Confiança (%.0f%%): [%.2f, %.2f] minutos\n", conf_level * 100, ic_lower, ic_upper))

Interpretação: Com 90% de confiança, o verdadeiro tempo médio de entrega para este serviço de delivery está entre 30.94 e 33.20 minutos.

Problema 3 (Aprovação de Recurso - Proporção):

Dados: $n = 200$, número de sucessos = 130. Nível de confiança = 99%.

Estimativa pontual para a proporção de pedidos de recurso aprovados na população:

Proporção amostral ($\hat{p}$) = $130/200 = \textbf{0.65}$.
Intervalo de confiança de 99% para a proporção populacional:
- $Z_{\alpha/2}$ para 99% de confiança é $Z_{0.005} = 2.576$.
- Erro Padrão (EP) = $\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} = \sqrt{\frac{0.65(1-0.65)}{200}} = \sqrt{\frac{0.65 \times 0.35}{200}} = \sqrt{\frac{0.2275}{200}} = \sqrt{0.0011375} \approx 0.0337$.
- Margem de Erro (ME) = $Z_{\alpha/2} \times EP = 2.576 \times 0.0337 \approx 0.0869$.
- $IC = \hat{p} \pm ME = 0.65 \pm 0.0869$.
- $\textbf{IC = [0.5631, 0.7369]}$.

import numpy as np
from scipy import stats
import statsmodels.stats.api as sm

n_sucessos = 130
n_total = 200
conf_level = 0.99

# a) Estimativa Pontual
p_hat = n_sucessos / n_total
print(f"a) Estimativa pontual para a proporção de pedidos aprovados: {p_hat:.2f}")

# b) IC de 99%
se = np.sqrt((p_hat * (1 - p_hat)) / n_total)
z_critical = stats.norm.ppf(1 - (1 - conf_level) / 2)
margin_error = z_critical * se
ic_lower = p_hat - margin_error
ic_upper = p_hat + margin_error

print(f"b) Intervalo de Confiança ({conf_level*100:.0f}%): [{ic_lower:.4f}, {ic_upper:.4f}]")

n_sucessos <- 130
n_total <- 200
conf_level <- 0.99

# a) Estimativa Pontual
p_hat <- n_sucessos / n_total
cat(sprintf("a) Estimativa pontual para a proporção de pedidos aprovados: %.2f\n", p_hat))

# b) IC de 99%
se <- sqrt((p_hat * (1 - p_hat)) / n_total)
z_critical <- qnorm(1 - (1 - conf_level) / 2)
margin_error <- z_critical * se
ic_lower <- p_hat - margin_error
ic_upper <- p_hat + margin_error

cat(sprintf("b) Intervalo de Confiança (%.0f%%): [%.4f, %.4f]\n", conf_level * 100, ic_lower, ic_upper))

Interpretação: Com 99% de confiança, a verdadeira proporção de pedidos de recurso aprovados na população está entre 56.31% e 73.69%.

Problema 4 (Fatores da Largura do IC):

O nível de confiança é aumentado de 95% para 99%.
- A largura do intervalo AUMENTARÁ. Um nível de confiança maior exige que o intervalo seja mais amplo para “capturar” o parâmetro populacional com maior certeza.
O tamanho da amostra é aumentado de 50 para 200.
- A largura do intervalo DIMINUIRÁ. Um tamanho de amostra maior reduz o erro padrão (a variabilidade amostral), levando a uma estimativa mais precisa e, consequentemente, a um intervalo mais estreito.
O desvio padrão da amostra é reduzido.
- A largura do intervalo DIMINUIRÁ. Um desvio padrão menor indica que os dados são mais homogêneos e menos dispersos, resultando em um erro padrão menor e um intervalo mais estreito.

Referências Bibliográficas

BUSSAB, Luiz O. de M.; MORETTIN, Pedro A. Estatı́stica Básica. 9. ed. São Paulo: Saraiva, 2017.

Estimação: Ponto e Intervalo de Confiança

Introdução e Objetivos

Objetivos de Aprendizagem

Estimação Pontual

Diagrama: Estimação Pontual

Estimação por Intervalo (Intervalos de Confiança)

Conceitos Chave

Intervalo de Confiança para a Média Populacional (\(\mu\))

Com Desvio Padrão Populacional (\(\sigma\)) Conhecido (Distribuição Z)

Com Desvio Padrão Populacional (\(\sigma\)) Desconhecido (Distribuição t de Student)

Código para Intervalo de Confiança para a Média

Intervalo de Confiança para a Proporção Populacional (\(P\))

Código para Intervalo de Confiança para a Proporção

Interpretando um Intervalo de Confiança

Fatores que Afetam a Largura do Intervalo de Confiança

Relação com Outros Conceitos

Verificação de Aprendizagem

Soluções da Atividade

Referências Bibliográficas