Стандартная погрешность среднего

Урок о разнице между «как разбросаны измерения» и «насколько точно мы знаем их среднее».

Стандартная погрешность среднего $s_{\bar x} = s/\sqrt{n}$ — оценка того, насколько выборочное среднее может отличаться от истинного значения.

Это, пожалуй, ключевая формула всей обработки результатов. СКО $s$ говорит о разбросе отдельных измерений и почти не меняется с ростом $n$. А вот точность самого среднего растёт: чем больше измерений, тем увереннее мы знаем, где центр.

Формула

$$s_{\bar x} = \frac{s}{\sqrt{n}}$$

Корень в знаменателе означает закон убывающей отдачи: чтобы вдвое уточнить среднее, нужно вчетверо больше измерений. Чтобы уточнить в 10 раз — в 100 раз больше данных.

Зачем различать s и s/√n

Путаница между $s$ и $s_{\bar x}$ — классический источник неверных результатов. $s$ — это про данные («одно измерение гуляет на $\pm s$»). $s_{\bar x}$ — это про вывод («наша оценка среднего гуляет на $\pm s_{\bar x}$»). В итоговую запись результата $\bar x \pm \ldots$ идёт именно погрешность среднего, а не СКО.

Как работает под капотом

Проверим закон $1/\sqrt{n}$ напрямую. Многократно соберём выборки размера $n$, для каждой посчитаем среднее, а затем измерим реальный разброс этих средних. Он должен совпасть с теоретическим $s/\sqrt{n}$.

import random, statistics
random.seed(5)

sigma = 2.0  # разброс отдельного измерения
for n in [4, 16, 64]:
    sredniye = []
    for _ in range(5000):
        vyb = [random.gauss(10, sigma) for _ in range(n)]
        sredniye.append(statistics.mean(vyb))
    realnyy = statistics.pstdev(sredniye)      # реальный разброс средних
    teor = sigma / (n ** 0.5)                   # теория s/sqrt(n)
    print(f"n={n:3d}  разброс средних={round(realnyy,3)}  теория s/√n={round(teor,3)}")

Вывод:

n=  4  разброс средних=0.997  теория s/√n=1.0
n= 16  разброс средних=0.503  теория s/√n=0.5
n= 64  разброс средних=0.253  теория s/√n=0.25

Реальный разброс средних в точности следует закону $s/\sqrt{n}$: при увеличении $n$ вчетверо погрешность среднего падает вдвое. Симуляция подтверждает формулу.

Частые ошибки

Записывать в результат СКО $s$ вместо погрешности среднего $s/\sqrt n$ — завышение погрешности в $\sqrt n$ раз.
Ждать, что удвоение числа измерений вдвое уточнит среднее — нужно учетверение.
Считать, что $s$ уменьшается с ростом $n$ — нет, уменьшается именно $s_{\bar x}$.

Итог

Стандартная погрешность среднего $s_{\bar x} = s/\sqrt n$ — точность самого среднего.
Она убывает как $1/\sqrt n$: вчетверо больше данных — вдвое точнее среднее.
В итоговый результат идёт $s_{\bar x}$, а не СКО отдельных измерений.
СКО $s$ почти не зависит от $n$, а погрешность среднего — зависит.