Дипфейк: как подделывают лица и как поймать обман
Видео, где известный человек говорит то, чего никогда не говорил, делается на домашнем компьютере. Разберём, как нейросети сшивают фальшивку и какие приметы её выдают.
Дипфейк не «вырезает и вставляет» лицо — он заново синтезирует его на чужой голове кадр за кадром.
Главная опасность дипфейка не в качестве картинки, а в том, что мы привыкли верить видео по умолчанию.
Откуда слово и в чём суть
«Дипфейк» — это deep learning плюс fake: подделка с помощью глубоких нейросетей. Технология подменяет в видео лицо или голос так, чтобы человек делал и говорил то, чего не было. Ключевое слово — синтез: алгоритм не копирует готовые кадры, а заново рисует лицо в нужном выражении и ракурсе.
Как это устроено внутри
Чтобы подменить лицо, систему кормят сотнями фотографий человека под всеми углами и со всеми эмоциями. Нейросеть учится двум вещам: сжимать любое лицо в компактное описание (улыбка, поворот, прищур) и восстанавливать по такому описанию лицо конкретного человека.
Дальше фокус. Берут кадр актёра-донора, считывают: «голова повёрнута влево, рот приоткрыт, бровь поднята». А восстанавливают по этому описанию уже другое лицо — то, что подделывают. Мимика и ракурс берутся от донора, а черты — от жертвы. Кадр за кадром получается чужое лицо, идеально повторяющее движения актёра.
Голос — отдельная история
Звук клонируют похоже: модель слушает записи речи и учится её тембру, интонациям, манере тянуть гласные. Потом ей дают текст — и она проговаривает его голосом, которого в этой фразе никогда не звучало. Иногда хватает минуты исходной записи.
Приметы подделки
Хорошие дипфейки обманчивы, но физику и мелочи подделать трудно. На что смотреть:
- Глаза и моргание. Неестественный ритм морганий, остекленевший взгляд, блики в зрачках, которые не совпадают между глазами.
- Границы лица. Мерцание и размытие по краю лица, у линии волос, под подбородком — там, где синтез стыкуется с настоящим кадром.
- Зубы и язык. Часто превращаются в размытое белое пятно — мелкие детали даются моделям тяжело.
- Свет и тени. Тени на лице не сходятся с освещением фона.
- Губы и звук. Артикуляция чуть расходится со словами, особенно на взрывных согласных.
Гонка щита и меча
Тут есть отрезвляющая мысль: дипфейки и детекторы учатся на одном принципе. Часто их связывают в пару — генератор подделывает, детектор ловит, и они тренируются друг против друга. Стоит детектору найти примету фальшивки, как генератор учится её убирать. Поэтому любой признак из списка выше — временный: завтра его залатают. Универсального и вечного детектора по картинке не существует в принципе.
Что реально защищает
Раз технике нельзя доверять на сто процентов, спасает не глаз, а голова:
- Источник. Откуда видео? Официальный канал или пересланный «другом друга» ролик без концов?
- Проверка по второму каналу. «Начальник» в видеозвонке просит срочно перевести деньги — перезвони ему по известному номеру.
- Контекст. Стал бы этот человек реально такое говорить? Слишком удобная сенсация — повод усомниться.
Главный вывод
Дипфейк ломает старое правило «видел — значит, было». Бороться попиксельно бесполезно — детекторы всегда на полшага позади. Настоящая защита — критическое мышление: проверять источник, перепроверять по другому каналу и помнить, что убедительное видео больше не доказательство.