Оценка параметров и доверительный интервал
По выборке мы оцениваем неизвестный параметр всей совокупности. Честная оценка приходит не одним числом, а с интервалом неопределённости.
Доверительный интервал — диапазон значений, в котором, с заданной уверенностью (обычно 95%), находится истинный параметр совокупности.
Точечная оценка и её проблема
Опросили 100 человек, получили среднее 75 — это точечная оценка среднего всей совокупности. Но другая случайная сотня дала бы чуть другое число. Точечная оценка не говорит, насколько ей можно верить. Поэтому к ней добавляют меру неопределённости — интервал.
Стандартная ошибка среднего
Ключевая величина — стандартная ошибка (SE): насколько «гуляет» выборочное среднее от выборки к выборке. Из ЦПТ мы знаем: SE = σ/√n. Чем больше выборка, тем меньше ошибка и точнее оценка.
from statistics import mean, stdev
import math
sample = [72, 80, 68, 90, 75, 77, 83, 65, 88, 79,
74, 81, 69, 85, 78, 73, 82, 70, 86, 76]
m = mean(sample)
s = stdev(sample)
n = len(sample)
se = s / math.sqrt(n)
print("Выборочное среднее:", round(m, 2))
print("Стандартное отклонение:", round(s, 2))
print("Размер выборки:", n)
print("Стандартная ошибка SE:", round(se, 3))
Вывод:
Выборочное среднее: 77.55 Стандартное отклонение: 6.93 Размер выборки: 20 Стандартная ошибка SE: 1.55
Строим 95%-й доверительный интервал
Для 95%-го интервала берут среднее ± примерно 1.96·SE (число 1.96 — из нормального распределения: между −1.96σ и +1.96σ лежит 95%). Формула простыми словами: оценка плюс-минус запас, равный 1.96 стандартных ошибок.
from statistics import mean, stdev
import math
sample = [72, 80, 68, 90, 75, 77, 83, 65, 88, 79,
74, 81, 69, 85, 78, 73, 82, 70, 86, 76]
m = mean(sample)
se = stdev(sample) / math.sqrt(len(sample))
margin = 1.96 * se
low = m - margin
high = m + margin
print("Точечная оценка:", round(m, 2))
print("Запас (margin):", round(margin, 3))
print(f"95% доверительный интервал: [{low:.2f}; {high:.2f}]")
Вывод:
Точечная оценка: 77.55 Запас (margin): 3.038 95% доверительный интервал: [74.51; 80.59]
Итог: «среднее ≈ 77.6, с 95% уверенностью истинное среднее лежит между 74.5 и 80.6». Это куда честнее, чем просто «77.55».
Что доверительный интервал значит и чего НЕ значит
Тонкое место, где ошибаются почти все. 95%-й интервал не значит «вероятность 95%, что параметр в этом интервале» — параметр это фиксированное (хоть и неизвестное) число, он либо внутри, либо нет. Правильная трактовка: если повторять опрос много раз и каждый раз строить такой интервал, примерно 95% из них накроют истинный параметр. Уверенность относится к методу, а не к конкретному интервалу.
Шире выборка — уже интервал
Поскольку SE = σ/√n, увеличение выборки сужает интервал. Учетверение выборки уменьшает запас вдвое (√4 = 2).
import math
sigma = 7 # допустим, разброс известен
for n in [25, 100, 400, 1600]:
se = sigma / math.sqrt(n)
margin = 1.96 * se
print(f"n={n:4} -> SE={se:.3f}, запас 95% = ±{margin:.3f}")
Вывод:
n= 25 -> SE=1.400, запас 95% = ±2.744 n= 100 -> SE=0.700, запас 95% = ±1.372 n= 400 -> SE=0.350, запас 95% = ±0.686 n=1600 -> SE=0.175, запас 95% = ±0.343
Чтобы вдвое повысить точность, нужно вчетверо больше данных — это фундаментальная «цена точности» в статистике. Отсюда и практический вывод: бесконечно сужать интервал дорого.
Итог
- Точечная оценка (одно число) не показывает свою надёжность.
- Стандартная ошибка SE = σ/√n измеряет разброс выборочного среднего.
- 95% доверительный интервал ≈ среднее ± 1.96·SE.
- Уверенность относится к методу: 95% таких интервалов накрывают истинный параметр, а не «параметр с вероятностью 95% внутри».