Что такое доверительный интервал

Урок о том, что на самом деле означает фраза «истинное значение лежит в интервале с вероятностью 95%».

Доверительный интервал — интервал вокруг оценки, который с заданной доверительной вероятностью $P$ накрывает истинное значение измеряемой величины.

Указать просто среднее — мало. Нужно сказать, насколько мы в нём уверены и в каких границах. Доверительный интервал и есть такое честное признание: «истина почти наверняка где-то здесь».

Структура интервала

Интервал строится симметрично вокруг среднего:

$$\bar x - \Delta \;\le\; x_{\text{ист}} \;\le\; \bar x + \Delta, \qquad \Delta = t \cdot s_{\bar x}$$

Здесь $\Delta$ — полуширина интервала, $t$ — коэффициент (Стьюдента), зависящий от доверительной вероятности и числа измерений, $s_{\bar x} = s/\sqrt n$ — погрешность среднего. Чем выше требуемая надёжность $P$, тем больше $t$ и шире интервал.

Правильная интерпретация

Тонкость, на которой спотыкаются почти все. Фраза «95% доверительный интервал» не означает, что истина с вероятностью 95% лежит внутри этого конкретного интервала (истина — фиксированное число, она либо внутри, либо нет). Правильно так: если повторять весь эксперимент много раз, то 95% построенных интервалов накроют истину. Доверие относится к процедуре, а не к одному интервалу.

Как работает под капотом

Проверим интерпретацию буквально. Построим тысячу 95%-интервалов для известной истины и посчитаем, какая доля их накрыла. Должно получиться около 95%. Используем приближённый множитель $t \approx 2{,}26$ для $n = 10$.

import random, statistics
random.seed(11)

istina = 100.0
sigma = 5.0
n = 10
t = 2.262  # коэффициент Стьюдента, P=0.95, n-1=9

nakryli = 0
opytov = 1000
for _ in range(opytov):
    vyb = [random.gauss(istina, sigma) for _ in range(n)]
    sr = statistics.mean(vyb)
    s = statistics.stdev(vyb)
    delta = t * s / (n ** 0.5)
    if sr - delta <= istina <= sr + delta:
        nakryli += 1

print("Доля интервалов, накрывших истину:", round(nakryli / opytov * 100, 1), "%")

Вывод:

Доля интервалов, накрывших истину: 95.1 %

Ровно 95% построенных интервалов накрыли истинное значение — в точности доверительная вероятность. Это и есть правильный смысл доверительного интервала.

Частые ошибки

  • Говорить «истина в этом интервале с вероятностью 95%» — истина не случайна, случайны интервалы.
  • Строить интервал, забыв про $\sqrt n$ и используя $s$ вместо $s/\sqrt n$.
  • Брать множитель для нормального распределения (1,96) при малых выборках вместо коэффициента Стьюдента — об этом следующий урок.

Итог

  • Доверительный интервал накрывает истину с заданной вероятностью $P$.
  • Полуширина $\Delta = t \cdot s/\sqrt n$ зависит от $P$ и числа измерений.
  • Корректная трактовка: доля накрывающих интервалов при повторении эксперимента равна $P$.
  • Чем выше требуемая надёжность, тем шире интервал.
Проверьте себя
1. Как правильно трактовать 95% доверительный интервал?
AИстина в этом интервале с вероятностью ровно 95%
BПри повторении эксперимента 95% таких интервалов накроют истину
C95% измерений попадают в интервал
DИнтервал содержит 95% данных
2. От чего НЕ зависит ширина доверительного интервала?
AОт доверительной вероятности
BОт числа измерений
CОт разброса данных
DОт порядкового номера первого измерения