Google I/O 2024: Novetats Intel·ligència Artificial
El Google I/O 2024 ha presentat importants innovacions i actualitzacions, marcant l’inici del que es denomina l'”era Gemini”. En aquest esdeveniment, es van introduir les capacitats avançades del model Gemini, que és capaç d’entendre i processar múltiples modalitats de dades com a text, imatges, vídeo i codi. Aquest model promet revolucionar la forma en què interactuem amb la tecnologia, oferint respostes més precises i contextuals en diverses aplicacions.
Gemini 1.5 Pro es va destacar per la seva capacitat de manejar fins a un milió de tokens, la qual cosa facilita un enteniment més profund i extens de les consultes. Aquest avanç no sols és tècnic, sinó que s’ha integrat efectivament en productes populars de Google com el Cercador, Google Fotos i Android, fent que les interaccions diàries amb aquests serveis siguin més intuïtives i eficients.
Un dels llançaments més interessants va ser Ask Photos, una nova funció en Google Fotos que permet als usuaris fer preguntes específiques sobre les seves fotografies, com la data en què es va prendre una foto particular o detalls sobre esdeveniments capturats en imatges. Això és possible gràcies a la capacitat de Gemini per a analitzar i entendre el contingut visual i textual en conjunt.
Google també ha llançat Veo, un model de IA generativa que produeix vídeos en 1080p i amb diversos estils visuals. Aquest avanç permet una precisió detallada en la creació de vídeos basats en prompts extensos, capturant el to desitjat amb un control creatiu sense precedents. A més, Veo, desenvolupat en col·laboració amb cineastes com Donald Glover, és part d’un esforç continu de Google per millorar les seves tecnologies de vídeo generatiu, destacant entre el seu catàleg previ de models.
Imagen 3, un model avançat per a generar imatges a partir de text. Promet detalls foto realistes amb menys artefactes visuals i aplicacions variades com a missatges d’aniversaris i diapositives per a presentacions. Disponible per a creadors seleccionats i aviat a Vertex AI.
Projecte Astra, un assistent d’intel·ligència artificial que competeix amb GPT-4o de OpenAI. Com el GPT-4o, processa senyals auditius, visuals i escrites i serà accessible tant per a usuaris gratuïts com de pagament. Projecte Astra encara és un prototip, però promet interacció fluida i ràpida, mostrant l’ambició de Google de desenvolupar un assistent de IA complet.
L’esdeveniment també va abordar la integració d’aquestes capacitats avançades en el Google Workspace, on Gemini pot ajudar a sintetitzar informació complexa, com a emails sobre un tema particular, fent la gestió de la informació més accessible i menys tediosa.
En termes d’infraestructura, Google va anunciar Trillium, la sisena generació de les seves unitats de processament tensorial (TPU), que promet millorar significativament el rendiment de les aplicacions de IA a causa de la seva major eficiència i capacitat de processament.
A més, es va introduir una nova perspectiva en la cerca amb l’Experiència Generativa de Cerca (SGE), on els usuaris poden fer consultes més complexes i rebre respostes generades per IA que són més riques i detallades.
Aquest avanç en la IA, segons Google, no sols millorarà la funcionalitat dels seus productes sinó que també obrirà noves possibilitats en la interacció humana amb les màquines, destacant un compromís continu amb la innovació i la utilitat en la tecnologia d’intel·ligència artificial. Això reflecteix la visió de Google de fer que la tecnologia sigui útil per a tots, a través de l’accessibilitat i l’eficàcia millorada.