Дипфейк: как подделывают лица и как поймать обман

Дипфейк не «вырезает и вставляет» лицо — он заново синтезирует его на чужой голове кадр за кадром.

Главная опасность дипфейка не в качестве картинки, а в том, что мы привыкли верить видео по умолчанию.

Откуда слово и в чём суть

«Дипфейк» — это deep learning плюс fake: подделка с помощью глубоких нейросетей. Технология подменяет в видео лицо или голос так, чтобы человек делал и говорил то, чего не было. Ключевое слово — синтез: алгоритм не копирует готовые кадры, а заново рисует лицо в нужном выражении и ракурсе.

Как это устроено внутри

Чтобы подменить лицо, систему кормят сотнями фотографий человека под всеми углами и со всеми эмоциями. Нейросеть учится двум вещам: сжимать любое лицо в компактное описание (улыбка, поворот, прищур) и восстанавливать по такому описанию лицо конкретного человека.

Дальше фокус. Берут кадр актёра-донора, считывают: «голова повёрнута влево, рот приоткрыт, бровь поднята». А восстанавливают по этому описанию уже другое лицо — то, что подделывают. Мимика и ракурс берутся от донора, а черты — от жертвы. Кадр за кадром получается чужое лицо, идеально повторяющее движения актёра.

Голос — отдельная история

Звук клонируют похоже: модель слушает записи речи и учится её тембру, интонациям, манере тянуть гласные. Потом ей дают текст — и она проговаривает его голосом, которого в этой фразе никогда не звучало. Иногда хватает минуты исходной записи.

Приметы подделки

Хорошие дипфейки обманчивы, но физику и мелочи подделать трудно. На что смотреть:

Глаза и моргание. Неестественный ритм морганий, остекленевший взгляд, блики в зрачках, которые не совпадают между глазами.
Границы лица. Мерцание и размытие по краю лица, у линии волос, под подбородком — там, где синтез стыкуется с настоящим кадром.
Зубы и язык. Часто превращаются в размытое белое пятно — мелкие детали даются моделям тяжело.
Свет и тени. Тени на лице не сходятся с освещением фона.
Губы и звук. Артикуляция чуть расходится со словами, особенно на взрывных согласных.

Гонка щита и меча

Тут есть отрезвляющая мысль: дипфейки и детекторы учатся на одном принципе. Часто их связывают в пару — генератор подделывает, детектор ловит, и они тренируются друг против друга. Стоит детектору найти примету фальшивки, как генератор учится её убирать. Поэтому любой признак из списка выше — временный: завтра его залатают. Универсального и вечного детектора по картинке не существует в принципе.

Что реально защищает

Раз технике нельзя доверять на сто процентов, спасает не глаз, а голова:

Источник. Откуда видео? Официальный канал или пересланный «другом друга» ролик без концов?
Проверка по второму каналу. «Начальник» в видеозвонке просит срочно перевести деньги — перезвони ему по известному номеру.
Контекст. Стал бы этот человек реально такое говорить? Слишком удобная сенсация — повод усомниться.

Главный вывод

Дипфейк ломает старое правило «видел — значит, было». Бороться попиксельно бесполезно — детекторы всегда на полшага позади. Настоящая защита — критическое мышление: проверять источник, перепроверять по другому каналу и помнить, что убедительное видео больше не доказательство.