Как графиками врут: обрезанная ось и искажённые пропорции

Самый частый обман — не подделка данных, а честные данные на нечестной оси.

График может вводить в заблуждение, не искажая ни одного числа: достаточно обрезать ось Y, исказить пропорции, наложить две оси или выбрать удобный отрезок данных. Учёный обязан узнавать эти приёмы — и не применять их.

Обрезанная ось Y

Главный приём. Если столбчатую диаграмму начать не с нуля, а, скажем, с 95, то рост с 96 до 98 (на 2 %) растянется на всю высоту и будет выглядеть как взлёт. Для столбцов это прямая ложь: длина столбца обязана быть пропорциональна значению, а обрезанная ось рвёт эту пропорцию. Правило: у столбчатых диаграмм ось Y всегда от нуля. (Для линейных графиков обрезка иногда допустима, чтобы показать мелкие колебания, но тогда обрыв надо явно отметить и быть честным.)

Обрезанная ось (ложь):     Честная ось от нуля:
100|    __                  100|
 98|  __||                   75|
 96| |  ||                   50|   __ __ __
 95|_|__||_                  25|  |  |  |  |
    A   B                     0|__|__|__|__|
 "огромный" рост 2%               A   B   реальная разница мала

Измеряем обман: lie factor ещё раз

Вспомним lie factor из урока про Тафти и применим к обрезанной оси. Данные выросли на 2 %, а высота столбца — втрое.

def lie_factor(h1, h2, v1, v2):
    return (abs(h2-h1)/h1) / (abs(v2-v1)/v1)

# значения 96 -> 98 (рост ~2%)
# на обрезанной оси (от 95) высоты столбцов 1 и 3
lf = lie_factor(1, 3, 96, 98)
print("рост данных:", round((98-96)/96*100, 1), "%")
print("рост столбца на картинке:", round((3-1)/1*100, 1), "%")
print("lie factor =", round(lf, 1), "(честно ~1)")

Вывод:

рост данных: 2.1 %
рост столбца на картинке: 200.0 %
lie factor = 96.0 (честно ~1)

Lie factor 96 — обрезанная ось преувеличила эффект в десятки раз при абсолютно честных числах.

Двойные оси Y

График с двумя разными осями Y (слева и справа) позволяет «подогнать» две кривые так, чтобы они казались связанными, хотя связи нет: масштаб второй оси подбирают, пока кривые не «совпадут». Это создаёт иллюзию корреляции. В науке двойных осей избегают; если очень нужно — честно нормируют обе величины и кладут на одну ось, либо делают две панели.

Прочие приёмы

  • Искажённые пропорции — широкая короткая или узкая высокая фигура меняет воспринимаемый наклон тренда (aspect ratio как инструмент обмана).
  • Инверсия оси — перевёрнутая ось Y (рост вниз) обманывает беглый взгляд.
  • Cherry-picking — показан только удобный отрезок данных; тренд «исчезает» или «появляется» в зависимости от окна.
  • Площадь вместо длины — пиктограмма вдвое больше по высоте и ширине = вчетверо по площади, преувеличение.

Как распознавать

Чек-лист скептика: с нуля ли ось Y у столбцов? есть ли вторая ось и не подогнан ли её масштаб? показан ли весь диапазон данных или удобный кусок? пропорциональна ли площадь пиктограмм значению? отмечены ли единицы и разрыв оси? Если что-то из этого настораживает — пересчитайте эффект в исходных числах.

Как работает под капотом

Все эти приёмы эксплуатируют то, что глаз считывает относительные визуальные величины (длину, наклон, площадь), а не абсолютные числа. Обрезанная ось рвёт связь «длина ↔ значение»; искажённая пропорция меняет наклон; двойная ось разрывает общую систему отсчёта. Защита одна — возвращаться к числам и к честным правилам кодирования (длина от нуля, единая ось, полный диапазон).

Этика и непреднамеренный обман

Важно понимать: большинство искажающих графиков создаются не злодеями, а добросовестными людьми, которые не задумались о восприятии. Обрезанную ось Y инструменты часто ставят по умолчанию — «чтобы лучше было видно колебания», — и автор, не проверив, публикует преувеличенный эффект, искренне веря в него. Двойную ось рисуют, потому что «так помещаются обе кривые». Поэтому защита от визуальной лжи — это в первую очередь дисциплина по отношению к себе: каждую свою фигуру стоит проверять теми же скептическими вопросами, что и чужую.

Знаменитая книга Даррела Хаффа «Как лгать с помощью статистики» (1954) на самом деле учит не лгать, а распознавать ложь — и тот же подход верен для графиков. Зная приёмы (обрезанная ось, искажённые пропорции, двойные оси, cherry-picking, площадь вместо длины), вы и сами перестаёте их невольно применять, и не поддаётесь на них, читая чужие работы и СМИ. В науке, где график — часть доказательства, это вопрос исследовательской честности, а не только эстетики.

Частые ошибки

  • Обрезанная ось Y у столбцов — прямое искажение пропорций.
  • Двойные оси «доказывают» связь — подогнанный масштаб создаёт ложную корреляцию.
  • Показ удобного окна данных — cherry-picking тренда.
  • Считать, что это «только у других» — авторы невольно врут себе той же обрезанной осью.

Итог

  • Чаще всего обманывает не подделка данных, а нечестная ось/пропорция.
  • У столбчатых диаграмм ось Y — всегда от нуля.
  • Двойные оси создают ложную корреляцию; избегайте их.
  • Распознавайте приёмы и пересчитывайте эффект в исходных числах.
Проверьте себя
1. Почему у столбчатой диаграммы ось Y должна начинаться с нуля?
AТак красивее
BДлина столбца обязана быть пропорциональна значению; обрезанная ось рвёт эту пропорцию и преувеличивает различия
CИначе график не построится
DЧтобы было больше места
2. Чем опасны двойные оси Y на одном графике?
AОни занимают много места
BМасштаб второй оси можно подогнать так, что несвязанные кривые покажутся коррелирующими
CИх нельзя подписать
DОни всегда логарифмические
3. Что такое cherry-picking в визуализации?
AВыбор цвета
BПоказ только удобного отрезка данных, где тренд выглядит нужным образом
CСглаживание линии
DДобавление легенды