Оценка параметров и доверительный интервал

По выборке мы оцениваем неизвестный параметр всей совокупности. Честная оценка приходит не одним числом, а с интервалом неопределённости.

Доверительный интервал — диапазон значений, в котором, с заданной уверенностью (обычно 95%), находится истинный параметр совокупности.

Точечная оценка и её проблема

Опросили 100 человек, получили среднее 75 — это точечная оценка среднего всей совокупности. Но другая случайная сотня дала бы чуть другое число. Точечная оценка не говорит, насколько ей можно верить. Поэтому к ней добавляют меру неопределённости — интервал.

Стандартная ошибка среднего

Ключевая величина — стандартная ошибка (SE): насколько «гуляет» выборочное среднее от выборки к выборке. Из ЦПТ мы знаем: SE = σ/√n. Чем больше выборка, тем меньше ошибка и точнее оценка.

from statistics import mean, stdev
import math

sample = [72, 80, 68, 90, 75, 77, 83, 65, 88, 79,
          74, 81, 69, 85, 78, 73, 82, 70, 86, 76]

m = mean(sample)
s = stdev(sample)
n = len(sample)
se = s / math.sqrt(n)

print("Выборочное среднее:", round(m, 2))
print("Стандартное отклонение:", round(s, 2))
print("Размер выборки:", n)
print("Стандартная ошибка SE:", round(se, 3))

Вывод:

Выборочное среднее: 77.55
Стандартное отклонение: 6.93
Размер выборки: 20
Стандартная ошибка SE: 1.55

Строим 95%-й доверительный интервал

Для 95%-го интервала берут среднее ± примерно 1.96·SE (число 1.96 — из нормального распределения: между −1.96σ и +1.96σ лежит 95%). Формула простыми словами: оценка плюс-минус запас, равный 1.96 стандартных ошибок.

from statistics import mean, stdev
import math

sample = [72, 80, 68, 90, 75, 77, 83, 65, 88, 79,
          74, 81, 69, 85, 78, 73, 82, 70, 86, 76]

m = mean(sample)
se = stdev(sample) / math.sqrt(len(sample))
margin = 1.96 * se

low = m - margin
high = m + margin
print("Точечная оценка:", round(m, 2))
print("Запас (margin):", round(margin, 3))
print(f"95% доверительный интервал: [{low:.2f}; {high:.2f}]")

Вывод:

Точечная оценка: 77.55
Запас (margin): 3.038
95% доверительный интервал: [74.51; 80.59]

Итог: «среднее ≈ 77.6, с 95% уверенностью истинное среднее лежит между 74.5 и 80.6». Это куда честнее, чем просто «77.55».

Что доверительный интервал значит и чего НЕ значит

Тонкое место, где ошибаются почти все. 95%-й интервал не значит «вероятность 95%, что параметр в этом интервале» — параметр это фиксированное (хоть и неизвестное) число, он либо внутри, либо нет. Правильная трактовка: если повторять опрос много раз и каждый раз строить такой интервал, примерно 95% из них накроют истинный параметр. Уверенность относится к методу, а не к конкретному интервалу.

Шире выборка — уже интервал

Поскольку SE = σ/√n, увеличение выборки сужает интервал. Учетверение выборки уменьшает запас вдвое (√4 = 2).

import math

sigma = 7        # допустим, разброс известен
for n in [25, 100, 400, 1600]:
    se = sigma / math.sqrt(n)
    margin = 1.96 * se
    print(f"n={n:4} -> SE={se:.3f}, запас 95% = ±{margin:.3f}")

Вывод:

n=  25 -> SE=1.400, запас 95% = ±2.744
n= 100 -> SE=0.700, запас 95% = ±1.372
n= 400 -> SE=0.350, запас 95% = ±0.686
n=1600 -> SE=0.175, запас 95% = ±0.343

Чтобы вдвое повысить точность, нужно вчетверо больше данных — это фундаментальная «цена точности» в статистике. Отсюда и практический вывод: бесконечно сужать интервал дорого.

Итог

Точечная оценка (одно число) не показывает свою надёжность.
Стандартная ошибка SE = σ/√n измеряет разброс выборочного среднего.
95% доверительный интервал ≈ среднее ± 1.96·SE.
Уверенность относится к методу: 95% таких интервалов накрывают истинный параметр, а не «параметр с вероятностью 95% внутри».