Что такое корреляция и значит ли она причинность?
Часто слышу слово «корреляция» в новостях про исследования. Что оно означает простыми словами и правда ли, что корреляция не равна причинно-следственной связи?
2 ответа
Корреляция показывает, насколько две величины меняются «вместе». Её измеряют коэффициентом от −1 до +1:
- +1 — идеальная прямая связь (растёт одно — растёт другое: рост и вес);
- −1 — идеальная обратная связь (растёт одно — падает другое: цена и спрос);
- 0 — связи нет (величины не зависят друг от друга).
Чем ближе значение к ±1, тем сильнее связь; около 0 — слабая или отсутствует.
Главное предупреждение: корреляция ≠ причинность. То, что величины движутся вместе, НЕ значит, что одна вызывает другую.
Пример. Продажи мороженого коррелируют с числом утоплений. Но мороженое не топит людей! Просто есть третий, скрытый фактор — жара: в жару и едят мороженое, и идут купаться. Это называется «ложная корреляция» из-за общей причины.
Поэтому из «A коррелирует с B» нельзя делать вывод «A вызывает B». Чтобы доказать причинность, нужны эксперименты (например, контролируемые испытания), а не просто наблюдаемая связь.
Забавный факт: можно найти корреляцию между вещами вообще без связи — например, потребление сыра и число утонувших в бассейне за год коррелируют почти идеально, но это чистое совпадение. На больших данных таких случайных «связей» полно. Поэтому учёные требуют и теорию, и эксперимент, прежде чем говорить о причине.