Технологии искусственного интеллекта развиваются стремительно, и отличить настоящее видео от сгенерированного все сложнее. Однако даже самые продвинутые нейросети в 2025 году допускают характерные ошибки, которые может заметить внимательный зритель. Эксперт в области ИИ, основатель WMT Group и WMT AI Игорь Никитин поделился с «Петербург. Эксперт» ключевыми признаками, которые помогут определить реальность от генерации.
1.Руки и пальцы выдают ИИ
Игорь Никитин отметил, что нейросети до сих пор не идеально и не всегда справляются с генерацией рук, несмотря на прогресс в 2025 году. Руки занимают малую часть кадра, имеют сложную анатомию и появляются в десятках разных положений — ИИ путает кулак, ладонь и жесты. Чтобы определить реальность обратите внимание на:
- Неправильное количество пальцев (классические «шесть пальцев»).
- Слипшиеся или размытые пальцы.
- Неестественное сгибание.
- Руки разного размера в одном кадре.
- Моргание и движение глаз
Человек моргает 15–20 раз в минуту. Вычислить ИИ-видео не трудно, если:
На видео присутствует длительное отсутствие моргания.
Роботизированное, слишком ритмичное моргание.
«Плавающий», несфокусированный взгляд.
Слишком частое или слишком редкое моргание.
- Синхронизация губ и речи
На что смотреть:
- Микрозадержки между движением губ и звуком.
- Неподвижность щек и подбородка при «разговоре».
- Несоответствие формы рта произносимым звукам (например, для «м», «п», «ф»).
«Просмотр на скорости 0.5x делает несовпадения очевидными. Лайфхак: Посмотреть видео на скорости 0.5x — несовпадения становятся очевиднее», — посоветовал эксперт в области ИИ.
- Освещение и тени
Искусственный интеллект часто путается при построении света:
- Несогласованные тени, например, от носа и ушей, падают в разные стороны.
- Лицо и фон освещены разными источниками.
- Статичные блики на очках при движении головы или отсутствуют вовсе.
- Слишком «плоское», бестеневое освещение.
- Тени падают под неправильными углами или вовсе отсутствуют.
- Контуры и границы объектов
- Размытая или «дрожащая» граница лица и волос.
- Резкая разница в детализации лица и окружающей обстановки.
- Мерцание и артефакты по контуру при движении.
- «Дрожание» краев лица.
- Текстура кожи
- Слишком идеальная, «пластиковая» кожа без пор и мелких дефектов.
- Отсутствие естественных морщинок при мимике.
- Чрезмерная сглаженность (как после фильтра красоты).
- Работа с текстом и символами
По словам Никитина, ИИ плохо генерирует текст — буквы искажаются, а слова становятся бессмысленными. Это выдает:
- Надписи на одежде, вывесках, экранах.
- Логотипы и бренды.
- Любой читаемый текст в кадре.
- Детали: аксессуары и украшения
- Серьги, которые будто «вросли» в мочку уха.
- Непарные украшения, которые должны быть парными.
- Украшения, меняющие форму между кадрами.
- Очки с неправильными отражениями.
- Отражения и зеркала
Работа с отражениями требует понимания пространства, которым ИИ часто не обладает. Нужно обращать внимание на то, что при подделке:
- В зеркале может появиться случайный человек.
- Отражение в очках не соответствует окружению.
- Отражения статичны при движении объекта.
- Фон и окружение
- Объекты на заднем плане нелогично то исчезают, то появляются.
- Архитектура с невозможной перспективой или геометрией.
- Несоответствие контекста: время года, погода, место.
- Голос и звук (для дипфейков)
- Монотонность, отсутствие эмоциональных оттенков и естественных пауз.
- Нет звуков вдоха и выдоха между фразами.
- Слишком «стерильный» звук без фонового шума.
- Неестественные паузы и странный ритм речи.
- Отсутствие звуков дыхания между фразами.
- Плоская, монотонная интонация без эмоциональных нюансов.
- Роботизированное звучание.
- Странные щелчки, статика или эхо.
- Естественность движений и физики
- Скованные, роботоподобные жесты.
- Неправильная динамика волос или одежды (например, они могут двигаться не в ту сторону).
- Неестественная, скользящая походка.
- Покадровый анализ
- Наиболее техничный, но эффективный метод оценки подделки — это провести покадровый анализ. Он определит точность на 85%. Как делать:
- Сначала пролистайте видео покадрово в приложении VLC, нажав клавишу E. Затем ищите мерцания границ лица, артефакты на первых двух кадра, резкие изменения элементов.
Инструменты для проверки:
Resemble AI Detect: для анализа синтетического голоса (точность 94-98%).
Обратный поиск изображения Google, чтобы найти оригинал видео.
Анализ метаданных файла: ищите несовпадающие даты создания и редактирования.
«Реальная точность коммерческих детекторов дипфейков в боевых условиях: 65–85% (в лабораторных — заявляют до 96–98%). Средняя точность инструмента на базе InceptionV2 для обнаружения артефактов: 89%. Люди моргают 15–20 раз в минуту — это базовый ориентир», отметил основатель компании WMT Group и WMT AI.
Он также напомнил, что ни один признак не дает 100% гарантии, поэтому стоит использовать несколько методов проверки. Если под подозрение попадают три признака, то высока вероятность, что видео сгенерировано.