Google DeepMind анонсировал новый прорыв в области искусственного интеллекта — Genie 3, world‑model, которая генерирует играбельные 3D‑миры из текстового описания и позволяет пользователю перемещаться и взаимодействовать в реальном времени.
Что такое Genie 3 и как работает
- Genie 3 — третья версия семейства моделей «Genie», способная создавать динамичные и устойчивые миры, в которых можно находиться несколько минут, сохраняя последовательность визуальных элементов.
- Это не видео, а настоящий игровой мир, где можно перемещаться и взаимодействовать, с физикой, погодными эффектами и «памятью» объектов.
Технические характеристики
- Разрешение 720p и частота 24 к/с.
- Устойчивость сцены порядка нескольких минут (у Genie 2 — 10–20 секунд).
- Новый уровень визуальной памяти: объекты, например нарисованные стены, остаются на месте даже если пользователь отворачивается.
Возможности редактирования и динамика мира
- Genie 3 поддерживает promptable world events — изменение мира по текстовым командам: погодные условия, появление персонажей и объектов.
- Генерация атмосферы (реалистичная вода, освещение), техники и даже фантастических сюжетов.
Ограничения и текущий статус
- Доступ ограничен: в тестовом режиме доступен лишь избранным исследователям и креаторам.
- Ограниченный набор действий: сложные взаимодействия между агентами, географическая точность реальных локаций и генерирование читаемого текста пока недоступны.
- Продолжительность сессии ограничена — всего несколько минут, а не часы.
Значение и перспективы
- Genie 3 рассматривается как значительный шаг на пути к AGI — тренировочные среды для агентов, образовательные, игровыe и исследовательские применения.
- В будущем ожидается расширение доступа и применение в обучении ИИ, виртуальной реальности и креативных инструментах.
Вывод
Genie 3 — это новый уровень в AI‑моделировании миров, где интерактивность сочетается с визуальной памятью и возможностью редактировать среду в режиме реального времени. На данный момент она доступна лишь ограниченной аудитории, но уже сегодня служит инструментом для исследований AGI, обучения агентов и создания уникальных виртуальных миров.
