Коэффициент Стьюдента

Урок о том, почему при пяти измерениях нельзя брать «1,96», и откуда берутся коэффициенты из таблицы Стьюдента.

Коэффициент Стьюдента $t_{P, f}$ — множитель, расширяющий доверительный интервал при малом числе измерений; зависит от доверительной вероятности $P$ и числа степеней свободы $f = n - 1$.

Когда измерений много, разброс среднего хорошо описывается нормальным распределением и для 95% берут множитель 1,96. Но при малом $n$ мы плохо знаем настоящее СКО — мы оценили его по тем же скудным данным. Эта дополнительная неопределённость требует более широкого интервала. Уильям Госсет под псевдонимом «Стьюдент» вывел нужное распределение.

Как меняется коэффициент

Коэффициент $t$ всегда больше нормального множителя и тем больше, чем меньше выборка. С ростом $n$ он стремится к нормальному значению:

$n$$f = n-1$$t$ для $P = 0{,}95$
2112,71
324,30
542,78
1092,26
$\infty$$\infty$1,96

При двух измерениях множитель огромен — 12,71: по двум точкам мы почти ничего не знаем о разбросе, и честность требует широченного интервала.

Полная процедура

Итак, обработка серии измерений сводится к шагам: найти $\bar x$, найти $s$, найти $s_{\bar x} = s/\sqrt n$, взять $t_{P,f}$ из таблицы, вычислить $\Delta = t \cdot s_{\bar x}$, записать результат $\bar x \pm \Delta$.

Как работает под капотом

Проведём полную обработку реальной серии измерений длины. Коэффициент Стьюдента возьмём из встроенной мини-таблицы.

import statistics

t_tab = {2: 4.30, 4: 2.78, 9: 2.26}  # f -> t для P=0.95

izmereniya = [50.2, 49.8, 50.5, 50.1, 49.9]
n = len(izmereniya)
sr = statistics.mean(izmereniya)
s = statistics.stdev(izmereniya)
s_sr = s / (n ** 0.5)
t = t_tab[n - 1]
delta = t * s_sr

print("Среднее:", round(sr, 3))
print("СКО s:", round(s, 3))
print("Погрешность среднего s/√n:", round(s_sr, 3))
print("t (P=0.95, f=4):", t)
print(f"Результат: L = {round(sr,2)} ± {round(delta,2)} мм")

Вывод:

Среднее: 50.1
СКО s: 0.274
Погрешность среднего s/√n: 0.122
t (P=0.95, f=4): 2.78
Результат: L = 50.1 ± 0.34 мм

Полный цикл обработки дал готовый результат с доверительным интервалом 95%. Если бы мы по ошибке взяли 1,96 вместо 2,78, интервал был бы занижен примерно на 30%.

Частые ошибки

  • Брать 1,96 при малых выборках вместо коэффициента Стьюдента — занижение интервала.
  • Путать число измерений $n$ и число степеней свободы $f = n-1$ при выборе $t$ из таблицы.
  • Применять Стьюдента к данным с непойманным промахом или сильной систематикой — статистика учитывает только случайную составляющую.

Итог

  • При малых выборках интервал расширяют коэффициентом Стьюдента $t_{P,f}$.
  • Коэффициент тем больше, чем меньше выборка; с ростом $n$ он стремится к нормальному (1,96 для 95%).
  • Степеней свободы $f = n - 1$.
  • Полная обработка: $\bar x$, $s$, $s/\sqrt n$, $t$, $\Delta = t s/\sqrt n$, запись $\bar x \pm \Delta$.
Проверьте себя
1. Почему при малом числе измерений коэффициент Стьюдента больше нормального множителя 1,96?
AТак принято в ГОСТ
BСКО оценено неточно по скудным данным, что требует более широкого интервала
CЧтобы интервал был красивее
DИз-за систематической погрешности
2. Сколько степеней свободы при n = 5 измерениях?
A5
B4
C6
D1