Коэффициент Стьюдента
Урок о том, почему при пяти измерениях нельзя брать «1,96», и откуда берутся коэффициенты из таблицы Стьюдента.
Коэффициент Стьюдента $t_{P, f}$ — множитель, расширяющий доверительный интервал при малом числе измерений; зависит от доверительной вероятности $P$ и числа степеней свободы $f = n - 1$.
Когда измерений много, разброс среднего хорошо описывается нормальным распределением и для 95% берут множитель 1,96. Но при малом $n$ мы плохо знаем настоящее СКО — мы оценили его по тем же скудным данным. Эта дополнительная неопределённость требует более широкого интервала. Уильям Госсет под псевдонимом «Стьюдент» вывел нужное распределение.
Как меняется коэффициент
Коэффициент $t$ всегда больше нормального множителя и тем больше, чем меньше выборка. С ростом $n$ он стремится к нормальному значению:
| $n$ | $f = n-1$ | $t$ для $P = 0{,}95$ |
| 2 | 1 | 12,71 |
| 3 | 2 | 4,30 |
| 5 | 4 | 2,78 |
| 10 | 9 | 2,26 |
| $\infty$ | $\infty$ | 1,96 |
При двух измерениях множитель огромен — 12,71: по двум точкам мы почти ничего не знаем о разбросе, и честность требует широченного интервала.
Полная процедура
Итак, обработка серии измерений сводится к шагам: найти $\bar x$, найти $s$, найти $s_{\bar x} = s/\sqrt n$, взять $t_{P,f}$ из таблицы, вычислить $\Delta = t \cdot s_{\bar x}$, записать результат $\bar x \pm \Delta$.
Как работает под капотом
Проведём полную обработку реальной серии измерений длины. Коэффициент Стьюдента возьмём из встроенной мини-таблицы.
import statistics
t_tab = {2: 4.30, 4: 2.78, 9: 2.26} # f -> t для P=0.95
izmereniya = [50.2, 49.8, 50.5, 50.1, 49.9]
n = len(izmereniya)
sr = statistics.mean(izmereniya)
s = statistics.stdev(izmereniya)
s_sr = s / (n ** 0.5)
t = t_tab[n - 1]
delta = t * s_sr
print("Среднее:", round(sr, 3))
print("СКО s:", round(s, 3))
print("Погрешность среднего s/√n:", round(s_sr, 3))
print("t (P=0.95, f=4):", t)
print(f"Результат: L = {round(sr,2)} ± {round(delta,2)} мм")Вывод:
Среднее: 50.1 СКО s: 0.274 Погрешность среднего s/√n: 0.122 t (P=0.95, f=4): 2.78 Результат: L = 50.1 ± 0.34 мм
Полный цикл обработки дал готовый результат с доверительным интервалом 95%. Если бы мы по ошибке взяли 1,96 вместо 2,78, интервал был бы занижен примерно на 30%.
Частые ошибки
- Брать 1,96 при малых выборках вместо коэффициента Стьюдента — занижение интервала.
- Путать число измерений $n$ и число степеней свободы $f = n-1$ при выборе $t$ из таблицы.
- Применять Стьюдента к данным с непойманным промахом или сильной систематикой — статистика учитывает только случайную составляющую.
Итог
- При малых выборках интервал расширяют коэффициентом Стьюдента $t_{P,f}$.
- Коэффициент тем больше, чем меньше выборка; с ростом $n$ он стремится к нормальному (1,96 для 95%).
- Степеней свободы $f = n - 1$.
- Полная обработка: $\bar x$, $s$, $s/\sqrt n$, $t$, $\Delta = t s/\sqrt n$, запись $\bar x \pm \Delta$.