Когда серия пугающе убедительных дипфейков Тома Круза стала вирусной на TikTok, некоторые предположили, что это пугающий знак грядущего — предвестник эпохи, когда искусственный интеллект позволит любому делать фальшивые видео о ком-то еще. Однако автор видео, бельгийский специалист по VFX Крис Уме (Chris Ume), говорит, что это далеко не так. Рассказывая The Verge о своих вирусных клипах, он подчеркивает количество времени и усилий, которые были затрачены на создание каждого дипфейка, а также важность работы с подражателем Тома Круза, Майлзом Фишером (Miles Fisher).
“Вы не можете сделать это, просто нажав на кнопку, — объясняет Уме. — Это важно, это послание, которое я хочу передать людям”. Каждый клип занял недели работы с использованием алгоритма DeepFaceLab с открытым исходным кодом, а также установленных инструментов редактирования видео. «Сочетание традиционных CGI и VFX с дипфейком делает его лучше. Я позаботился, чтобы вы не заметили никаких сбоев.”
Крис работает с дипфейками в течение многих лет, в том числе создавая эффекты для серии South Park “Sassy Justice”, выполненной Треем Паркером и Мэттом Стоуном. Он начал работать над розыгрышем, когда увидел видео Фишера, объявляющего о фиктивном баллотировании в президенты голливудской звезды. Затем они вместе трудились над дальнейшим расследованием и решили поставить серию “безвредных” роликов на TikTok. Их аккаунт, @deeptomcruise, быстро собрал десятки тысяч подписчиков и лайков. Уме быстро стер видео, но затем восстановил их.
“Он выполнил свое предназначение, — говорит Крис о клипе. — Нам было весело. Я показал свое мастерство. Мы заставляли людей улыбаться. И все, проект завершен”. Пресс-секретарь TikTok сообщил The Verge, что этот аккаунт вполне соответствует правилам для пародийного использования дипфейков, и Умe отмечает, что Круз — настоящий Том Круз — с тех пор сделал свой собственный официальный аккаунт, возможно, в результате того, что его ИИ-двойник стал вирусным.
Технология дипфейков развивается уже много лет, и нет никаких сомнений в том, что результаты становятся все более реалистичными и более простыми в изготовлении. Хотя было много рассуждений о потенциальном вреде, который такая технология может причинить в политике, до сих пор эти эффекты были ничтожными. Где технология определенно наносит ущерб, так это в создании порно из мести или женской порнографии без согласия. В этих случаях поддельные видео или изображения не обязательно должны быть реалистичными, чтобы нанести огромный ущерб. Просто угрожая кому-то выпуском поддельных изображений или создавая слухи о существовании такого контента, можно разрушить репутацию и карьеру.
Подделки Тома Круза, однако, показывают гораздо более выгодное использование технологии: как еще одной части инструментария CGI. Умe говорит, что существует много применений для дипфейков, от дубляжа актеров в кино и на телевидении до восстановления старых кадров, до анимации персонажей CGI. Однако он подчеркивает неполноту технологии, действующей сама по себе.
/cdn.vox-cdn.com/uploads/chorus_asset/file/22347529/20.jpg)
Создание подделок заняло два месяца для обучения базовых моделей ИИ (с использованием пары графических процессоров NVIDIA RTX 8000) на фото Круза, а также дни дальнейшей обработки для каждого клипа. После этого Уме пришлось просматривать каждое видео, кадр за кадром, внося небольшие коррективы, чтобы усилить общий эффект; сглаживая линию здесь и скрывая сбой там. “Самое трудное — это заставить его выглядеть живым, — делится Крис. — Видно по глазам, когда что-то не так”.
Умe говорит, что огромная львиная доля заслуг принадлежит Фишеру; телевизионный и киноактер, который схватил преувеличенные манеры Круза, от его маниакального смеха до его интенсивной жестикуляции. ”Он действительно талантливый актер, — уверен создатель клипов. — А я просто занимаюсь визуальными вещами”. Но если вы посмотрите внимательно, вы все равно можете увидеть моменты, когда иллюзия терпит неудачу, как в клипе ниже, где глаза и рот Фишера мигают на секунду, когда он надевает солнцезащитные очки.
/cdn.vox-cdn.com/uploads/chorus_asset/file/22332191/NotCruiseHQ.gif)
Хотя точка зрения Умe заключается в том, что его дипфейки требуют много работы и профессионального пародиста, также ясно, что технология со временем улучшится. Трудно предсказать точно, насколько легко пойдет изготовление бесшовной подделки в будущем, но эксперты заняты разработкой инструментов, которые смогут автоматически идентифицировать подделки или проверять неотредактированные кадры.
Уме, однако, говорит, что он не слишком беспокоится. Мы уже разработали такую технологию раньше, и концепция истины в обществе более или менее сохранилась. «Это как Photoshop 20 лет назад: люди не знали, что такое редактирование фотографий, а теперь они знают об этих подделках», — напоминает он. Поскольку дипфейки становятся все более и более частым продуктом на телевидении и в кино, ожидания людей изменятся, как это было с изображениями в эпоху Photoshop. Одно можно сказать наверняка — джинна нельзя посадить обратно в бутылку. “Дипфейки здесь надолго, — говорит Крис Уме. — Все понимают это”.