Как растёт точность с числом измерений

Урок о том, почему сотое измерение полезно куда меньше десятого, и когда пора остановиться.

Закон убывающей отдачи в измерениях: полуширина доверительного интервала падает как $1/\sqrt n$, поэтому каждое следующее измерение приносит всё меньше уточнения.

Интуитивно хочется думать, что в сто раз больше измерений дадут в сто раз более точный результат. Это не так. Из-за корня выигрыш растёт куда медленнее, и в какой-то момент дальнейшие измерения почти бесполезны — дешевле побороть систематику.

Зависимость ширины интервала от n

Полуширина интервала $\Delta = t \cdot s/\sqrt n$. Здесь работают два фактора: множитель $t$ уменьшается с ростом $n$ (приближаясь к 1,96), и знаменатель $\sqrt n$ растёт. Оба сужают интервал, но эффект $\sqrt n$ доминирует и быстро выходит на закон убывающей отдачи.

$$\frac{\Delta(4n)}{\Delta(n)} \approx \frac{1}{\sqrt{4}} = \frac{1}{2}$$

Учетверение измерений сужает интервал лишь вдвое.

Как работает под капотом

Смоделируем рост точности. Для каждого $n$ построим много интервалов и усредним их полуширину. Посмотрим, как падает ширина и как растёт «цена» одного процента точности.

import random, statistics
random.seed(21)

sigma = 4.0
t_tab = {4: 2.78, 9: 2.26, 24: 2.06, 99: 1.98}

for n in [5, 10, 25, 100]:
    shiriny = []
    for _ in range(2000):
        vyb = [random.gauss(0, sigma) for _ in range(n)]
        s = statistics.stdev(vyb)
        shiriny.append(t_tab[n - 1] * s / (n ** 0.5))
    sredn = statistics.mean(shiriny)
    print(f"n={n:3d}  средняя полуширина Δ = {round(sredn, 3)}")

Вывод:

n=  5  средняя полуширина Δ = 4.745
n= 10  средняя полуширина Δ = 2.811
n= 25  средняя полуширина Δ = 1.642
n=100  средняя полуширина Δ = 0.793

От 5 к 10 измерениям интервал сузился почти вдвое. А вот от 25 к 100 (вчетверо больше работы!) — снова лишь примерно вдвое. Сотое измерение приносит несравнимо меньше пользы, чем десятое. Это и есть закон убывающей отдачи в действии.

Практический вывод

Обычно 5–15 измерений дают разумный компромисс между трудозатратами и точностью случайной составляющей. Если после этого интервал всё ещё широк, чаще выгоднее не наращивать $n$, а уменьшить разброс $s$ — взять более стабильный прибор или устранить источник шума. И всегда помните: статистика бьётся только со случайной погрешностью; систематику никаким числом измерений не победить.

Частые ошибки

Наращивать число измерений до бесконечности, борясь на деле с систематической погрешностью.
Ожидать линейного роста точности с числом измерений вместо корневого.
Игнорировать стоимость измерений: иногда дешевле улучшить прибор, чем удваивать серию.

Итог

Полуширина интервала падает как $1/\sqrt n$ — закон убывающей отдачи.
Учетверение числа измерений сужает интервал примерно вдвое.
Разумная серия — обычно 5–15 измерений; дальше выгоднее снижать сам разброс.
Никакое $n$ не побеждает систематическую погрешность.