Google DeepMind представил Genie 3: ИИ, создающий реалистичные 3D‑миры из текста в реальном времени


Google DeepMind анонсировал новый прорыв в области искусственного интеллекта — Genie 3, world‑model, которая генерирует играбельные 3D‑миры из текстового описания и позволяет пользователю перемещаться и взаимодействовать в реальном времени.

Что такое Genie 3 и как работает

  • Genie 3 — третья версия семейства моделей «Genie», способная создавать динамичные и устойчивые миры, в которых можно находиться несколько минут, сохраняя последовательность визуальных элементов.
  • Это не видео, а настоящий игровой мир, где можно перемещаться и взаимодействовать, с физикой, погодными эффектами и «памятью» объектов.

Технические характеристики

  • Разрешение 720p и частота 24 к/с.
  • Устойчивость сцены порядка нескольких минут (у Genie 2 — 10–20 секунд).
  • Новый уровень визуальной памяти: объекты, например нарисованные стены, остаются на месте даже если пользователь отворачивается.

Возможности редактирования и динамика мира

  • Genie 3 поддерживает promptable world events — изменение мира по текстовым командам: погодные условия, появление персонажей и объектов.
  • Генерация атмосферы (реалистичная вода, освещение), техники и даже фантастических сюжетов.

Ограничения и текущий статус

  • Доступ ограничен: в тестовом режиме доступен лишь избранным исследователям и креаторам.
  • Ограниченный набор действий: сложные взаимодействия между агентами, географическая точность реальных локаций и генерирование читаемого текста пока недоступны.
  • Продолжительность сессии ограничена — всего несколько минут, а не часы.

Значение и перспективы

  • Genie 3 рассматривается как значительный шаг на пути к AGI — тренировочные среды для агентов, образовательные, игровыe и исследовательские применения.
  • В будущем ожидается расширение доступа и применение в обучении ИИ, виртуальной реальности и креативных инструментах.

Вывод

Genie 3 — это новый уровень в AI‑моделировании миров, где интерактивность сочетается с визуальной памятью и возможностью редактировать среду в режиме реального времени. На данный момент она доступна лишь ограниченной аудитории, но уже сегодня служит инструментом для исследований AGI, обучения агентов и создания уникальных виртуальных миров.