Как объяснить формулу Байеса простыми словами?
Формула Байеса выглядит пугающе. Можете объяснить её простыми словами и показать на примере с медицинским тестом, почему она важна?
2 ответа
Формула Байеса помогает обновить вероятность, когда появилась новая информация. Она «переворачивает» условную вероятность:
P(A|B) = P(B|A) · P(A) / P(B)
Простыми словами: «насколько вероятна причина A, если мы наблюдаем результат B».
Знаменитый пример с тестом. Болезнь есть у 1% людей. Тест точен на 99% (и для больных, и для здоровых). У человека тест положительный. Какова вероятность, что он реально болен?
Интуиция кричит «99%», но это неверно. Возьмём 10 000 человек:
- больных 100, из них тест найдёт ≈ 99;
- здоровых 9900, но 1% (99 человек) дадут ложноположительный результат.
Итого положительных тестов: 99 + 99 = 198. Из них реально больны 99.
P(болен | тест+) = 99 / 198 = 0.5 — всего 50%!
Почему так: здоровых людей огромное большинство, и даже редкие ошибки теста дают много ложных тревог. Поэтому при редких болезнях положительный тест перепроверяют. Формула Байеса спасает от этой ловушки интуиции.
Ключевая идея Байеса — учитывать априорную вероятность (как часто событие вообще встречается). Если игнорировать редкость болезни (1%), получишь неверный ответ. Та же логика работает в спам-фильтрах: они обновляют «вероятность спама» по каждому слову в письме. На codechick есть разбор Байеса в учебнике по теорверу.