Коэффициент Стьюдента

Урок о том, почему при пяти измерениях нельзя брать «1,96», и откуда берутся коэффициенты из таблицы Стьюдента.

Коэффициент Стьюдента $t_{P, f}$ — множитель, расширяющий доверительный интервал при малом числе измерений; зависит от доверительной вероятности $P$ и числа степеней свободы $f = n - 1$.

Когда измерений много, разброс среднего хорошо описывается нормальным распределением и для 95% берут множитель 1,96. Но при малом $n$ мы плохо знаем настоящее СКО — мы оценили его по тем же скудным данным. Эта дополнительная неопределённость требует более широкого интервала. Уильям Госсет под псевдонимом «Стьюдент» вывел нужное распределение.

Как меняется коэффициент

Коэффициент $t$ всегда больше нормального множителя и тем больше, чем меньше выборка. С ростом $n$ он стремится к нормальному значению:

$n$	$f = n-1$	$t$ для $P = 0{,}95$
2	1	12,71
3	2	4,30
5	4	2,78
10	9	2,26
$\infty$	$\infty$	1,96

При двух измерениях множитель огромен — 12,71: по двум точкам мы почти ничего не знаем о разбросе, и честность требует широченного интервала.

Полная процедура

Итак, обработка серии измерений сводится к шагам: найти $\bar x$, найти $s$, найти $s_{\bar x} = s/\sqrt n$, взять $t_{P,f}$ из таблицы, вычислить $\Delta = t \cdot s_{\bar x}$, записать результат $\bar x \pm \Delta$.

Как работает под капотом

Проведём полную обработку реальной серии измерений длины. Коэффициент Стьюдента возьмём из встроенной мини-таблицы.

import statistics

t_tab = {2: 4.30, 4: 2.78, 9: 2.26}  # f -> t для P=0.95

izmereniya = [50.2, 49.8, 50.5, 50.1, 49.9]
n = len(izmereniya)
sr = statistics.mean(izmereniya)
s = statistics.stdev(izmereniya)
s_sr = s / (n ** 0.5)
t = t_tab[n - 1]
delta = t * s_sr

print("Среднее:", round(sr, 3))
print("СКО s:", round(s, 3))
print("Погрешность среднего s/√n:", round(s_sr, 3))
print("t (P=0.95, f=4):", t)
print(f"Результат: L = {round(sr,2)} ± {round(delta,2)} мм")

Вывод:

Среднее: 50.1
СКО s: 0.274
Погрешность среднего s/√n: 0.122
t (P=0.95, f=4): 2.78
Результат: L = 50.1 ± 0.34 мм

Полный цикл обработки дал готовый результат с доверительным интервалом 95%. Если бы мы по ошибке взяли 1,96 вместо 2,78, интервал был бы занижен примерно на 30%.

Частые ошибки

Брать 1,96 при малых выборках вместо коэффициента Стьюдента — занижение интервала.
Путать число измерений $n$ и число степеней свободы $f = n-1$ при выборе $t$ из таблицы.
Применять Стьюдента к данным с непойманным промахом или сильной систематикой — статистика учитывает только случайную составляющую.

Итог

При малых выборках интервал расширяют коэффициентом Стьюдента $t_{P,f}$.
Коэффициент тем больше, чем меньше выборка; с ростом $n$ он стремится к нормальному (1,96 для 95%).
Степеней свободы $f = n - 1$.
Полная обработка: $\bar x$, $s$, $s/\sqrt n$, $t$, $\Delta = t s/\sqrt n$, запись $\bar x \pm \Delta$.