Genie 2 de DeepMind: Mons 3D interactius

DeepMind, el laboratori de recerca en intel·ligència artificial de Google, ha revelat el seu nou model anomenat Genie 2, dissenyat per crear una varietat interminable de mons 3D jugables. Aquest model, successor del Genie llançat anteriorment, és capaç de generar escenes interactives en temps real a partir d’una imatge o descripció textual, com ara “un robot humanoide en un bosc”.

A diferència d’altres desenvolupaments similars com els de World Labs i la startup israeliana Decart, Genie 2 destaca per la capacitat de simular entorns rics i detallats, on els usuaris poden interactuar realitzant accions com saltar o nedar mitjançant teclat o ratolí. Entrenat amb vídeos, el model pot reproduir interaccions físiques, il·luminació, reflexos, animacions i comportaments de NPCs (personatges no jugables).

Com funciona Genie 2?

DeepMind explica que aquest model genera mons consistents amb perspectives variades, com vistes en primera persona o isomètriques. Tot i que les simulacions duren entre 10 i 20 segons (algunes fins a un minut), Genie 2 conserva detalls de les parts no visibles de l’escenari, assegurant precisió en mostrar-les de nou.

Un detall interessant és que Genie 2 sembla haver estat entrenat amb dades provinents de videojocs populars. No obstant això, DeepMind no ha revelat detalls específics sobre les fonts de les seves dades, fet que planteja interrogants legals sobre la possible violació de drets d’autor, especialment si ha utilitzat contingut de plataformes com YouTube.

Usos i limitacions del model

Tot i que els mons creats per Genie 2 no serien ideals per a jocs llargs, sí que ofereixen un valor significatiu com a eines de recerca i prototipat. Segons DeepMind, el model pot convertir esbossos o dibuixos conceptuals en entorns completament interactius, permetent crear tasques per avaluar agents d’IA en escenaris diversos i nous.

A diferència d’altres models, com el simulador de Minecraft “Oasis” de Decart, Genie 2 supera problemes comuns com artefactes gràfics o inconsistències en les simulacions. Per exemple, pot recordar amb precisió la disposició d’un nivell fins i tot quan parts del mateix no són visibles.

Implicacions per a la indústria creativa

L’impacte de Genie 2 en la indústria del videojoc és incert. D’una banda, representa un avenç tecnològic que podria agilitzar la creació d’entorns interactius. De l’altra, genera inquietuds entre els desenvolupadors, ja que grans companyies com Activision Blizzard han recorregut a l’ús d’IA per reduir costos i augmentar la productivitat, en detriment dels llocs de treball tradicionals.

Google, no obstant això, segueix apostant per la recerca en models de mons 3D, contractant experts en simulació i generació de vídeo per reforçar el seu lideratge en aquesta àrea.

Preguntes i Respostes

Què fa únic Genie 2 en comparació amb altres models?

Genie 2 sobresurt per la seva capacitat de generar mons consistents, recordar detalls no visibles i oferir perspectives variades sense errors significatius.

Com afecta Genie 2 la indústria dels videojocs?

Podria agilitzar processos creatius, però també planteja preocupacions sobre l’ús d’IA per substituir llocs de treball en el sector.

Quant duren les simulacions generades per Genie 2?

Generalment entre 10 i 20 segons, tot i que algunes poden durar fins a un minut.

Quines implicacions legals té l’entrenament de Genie 2?

Sorgeixen dubtes sobre drets d’autor si s’han utilitzat continguts de plataformes com YouTube sense autorització.