Genie 2 de DeepMind: Mundos 3D interactivos

DeepMind, el laboratorio de investigación en inteligencia artificial de Google, ha revelado su nuevo modelo llamado Genie 2, diseñado para crear una variedad interminable de mundos 3D jugables. Este modelo, sucesor del Genie lanzado anteriormente, es capaz de generar escenas interactivas en tiempo real a partir de una imagen o descripción textual, como “un robot humanoide en un bosque”.

A diferencia de otros desarrollos similares como los de World Labs y la startup israelí Decart, Genie 2 se destaca por la capacidad de simular entornos ricos y detallados, donde los usuarios pueden interactuar realizando acciones como saltar o nadar mediante teclado o mouse. Entrenado con videos, el modelo puede reproducir interacciones físicas, iluminación, reflejos, animaciones y comportamientos de NPCs (personajes no jugables).

¿Cómo funciona Genie 2?

DeepMind explica que este modelo genera mundos consistentes con perspectivas variadas, como vistas en primera persona o isométricas. Aunque las simulaciones duran entre 10 y 20 segundos (algunas hasta un minuto), Genie 2 conserva detalles de las partes no visibles del escenario, asegurando precisión al mostrarlas nuevamente.

Un detalle interesante es que Genie 2 parece haber sido entrenado con datos provenientes de videojuegos populares. Sin embargo, DeepMind no ha revelado detalles específicos sobre las fuentes de sus datos, lo que plantea interrogantes legales sobre la posible violación de derechos de autor, especialmente si ha utilizado contenido de plataformas como YouTube.

Usos y limitaciones del modelo

Aunque los mundos creados por Genie 2 no serían ideales para juegos largos, sí ofrecen un valor significativo como herramientas de investigación y prototipado. Según DeepMind, el modelo puede convertir bocetos o dibujos conceptuales en entornos completamente interactivos, permitiendo crear tareas para evaluar agentes de IA en escenarios diversos y novedosos.

A diferencia de otros modelos, como el simulador de Minecraft “Oasis” de Decart, Genie 2 supera problemas comunes como artefactos gráficos o inconsistencias en las simulaciones. Por ejemplo, puede recordar con precisión la disposición de un nivel incluso cuando partes del mismo no están visibles.

Implicaciones para la industria creativa

El impacto de Genie 2 en la industria del videojuego es incierto. Por un lado, representa un avance tecnológico que podría agilizar la creación de entornos interactivos. Por otro, genera inquietudes entre los desarrolladores, ya que grandes compañías como Activision Blizzard han recurrido al uso de IA para reducir costos y aumentar la productividad, en detrimento de los empleos tradicionales.

Google, no obstante, sigue apostando por la investigación en modelos de mundos 3D, contratando a expertos en simulación y generación de video para fortalecer su liderazgo en esta área.

Preguntas y Respuestas

¿Qué hace único a Genie 2 en comparación con otros modelos?

Genie 2 sobresale por su capacidad de generar mundos consistentes, recordar detalles no visibles y ofrecer perspectivas variadas sin errores significativos.

¿Cómo afecta Genie 2 a la industria de los videojuegos?

Podría agilizar procesos creativos, pero también plantea preocupaciones sobre el uso de IA para reemplazar trabajos en el sector.

¿Cuánto tiempo duran las simulaciones generadas por Genie 2?

Generalmente entre 10 y 20 segundos, aunque algunas pueden durar hasta un minuto.

¿Qué implicaciones legales tiene el entrenamiento de Genie 2?

Surgen dudas sobre derechos de autor si se han utilizado contenidos de plataformas como YouTube sin autorización.