Стандартная погрешность среднего
Урок о разнице между «как разбросаны измерения» и «насколько точно мы знаем их среднее».
Стандартная погрешность среднего $s_{\bar x} = s/\sqrt{n}$ — оценка того, насколько выборочное среднее может отличаться от истинного значения.
Это, пожалуй, ключевая формула всей обработки результатов. СКО $s$ говорит о разбросе отдельных измерений и почти не меняется с ростом $n$. А вот точность самого среднего растёт: чем больше измерений, тем увереннее мы знаем, где центр.
Формула
$$s_{\bar x} = \frac{s}{\sqrt{n}}$$
Корень в знаменателе означает закон убывающей отдачи: чтобы вдвое уточнить среднее, нужно вчетверо больше измерений. Чтобы уточнить в 10 раз — в 100 раз больше данных.
Зачем различать s и s/√n
Путаница между $s$ и $s_{\bar x}$ — классический источник неверных результатов. $s$ — это про данные («одно измерение гуляет на $\pm s$»). $s_{\bar x}$ — это про вывод («наша оценка среднего гуляет на $\pm s_{\bar x}$»). В итоговую запись результата $\bar x \pm \ldots$ идёт именно погрешность среднего, а не СКО.
Как работает под капотом
Проверим закон $1/\sqrt{n}$ напрямую. Многократно соберём выборки размера $n$, для каждой посчитаем среднее, а затем измерим реальный разброс этих средних. Он должен совпасть с теоретическим $s/\sqrt{n}$.
import random, statistics
random.seed(5)
sigma = 2.0 # разброс отдельного измерения
for n in [4, 16, 64]:
sredniye = []
for _ in range(5000):
vyb = [random.gauss(10, sigma) for _ in range(n)]
sredniye.append(statistics.mean(vyb))
realnyy = statistics.pstdev(sredniye) # реальный разброс средних
teor = sigma / (n ** 0.5) # теория s/sqrt(n)
print(f"n={n:3d} разброс средних={round(realnyy,3)} теория s/√n={round(teor,3)}")Вывод:
n= 4 разброс средних=0.997 теория s/√n=1.0 n= 16 разброс средних=0.503 теория s/√n=0.5 n= 64 разброс средних=0.253 теория s/√n=0.25
Реальный разброс средних в точности следует закону $s/\sqrt{n}$: при увеличении $n$ вчетверо погрешность среднего падает вдвое. Симуляция подтверждает формулу.
Частые ошибки
- Записывать в результат СКО $s$ вместо погрешности среднего $s/\sqrt n$ — завышение погрешности в $\sqrt n$ раз.
- Ждать, что удвоение числа измерений вдвое уточнит среднее — нужно учетверение.
- Считать, что $s$ уменьшается с ростом $n$ — нет, уменьшается именно $s_{\bar x}$.
Итог
- Стандартная погрешность среднего $s_{\bar x} = s/\sqrt n$ — точность самого среднего.
- Она убывает как $1/\sqrt n$: вчетверо больше данных — вдвое точнее среднее.
- В итоговый результат идёт $s_{\bar x}$, а не СКО отдельных измерений.
- СКО $s$ почти не зависит от $n$, а погрешность среднего — зависит.