Google I/O 2024: Novedades Inteligencia Artificial
El Google I/O 2024 ha presentado importantes innovaciones y actualizaciones, marcando el inicio de lo que se denomina la «era Gemini». En este evento, se introdujeron las capacidades avanzadas del modelo Gemini, que es capaz de entender y procesar múltiples modalidades de datos como texto, imágenes, vídeo y código. Este modelo promete revolucionar la forma en que interactuamos con la tecnología, ofreciendo respuestas más precisas y contextuales en diversas aplicaciones.
Gemini 1.5 Pro se destacó por su capacidad de manejar hasta un millón de tokens, lo que facilita un entendimiento más profundo y extenso de las consultas. Este avance no solo es técnico, sino que se ha integrado efectivamente en productos populares de Google como el Buscador, Google Fotos y Android, haciendo que las interacciones diarias con estos servicios sean más intuitivas y eficientes.
Uno de los lanzamientos más interesantes fue Ask Photos, una nueva función en Google Fotos que permite a los usuarios hacer preguntas específicas sobre sus fotografías, como la fecha en que se tomó una foto particular o detalles sobre eventos capturados en imágenes. Esto es posible gracias a la capacidad de Gemini para analizar y entender el contenido visual y textual en conjunto.
Google también ha lanzado Veo, un modelo de IA generativa que produce videos en 1080p y con diversos estilos visuales. Este avance permite una precisión detallada en la creación de videos basados en prompts extensos, capturando el tono deseado con un control creativo sin precedentes. Además, Veo, desarrollado en colaboración con cineastas como Donald Glover, es parte de un esfuerzo continuo de Google por mejorar sus tecnologías de video generativo, destacando entre su catálogo previo de modelos.
Imagen 3, un modelo avanzado para generar imágenes a partir de texto. Promete detalles fotorrealistas con menos artefactos visuales y aplicaciones variadas como mensajes de cumpleaños y diapositivas para presentaciones. Disponible para creadores seleccionados y pronto en Vertex AI.
Proyecto Astra, un asistente de inteligencia artificial que compite con GPT-4o de OpenAI. Como el GPT-4o, procesa señales auditivas, visuales y escritas y será accesible tanto para usuarios gratuitos como de pago. Proyecto Astra aún es un prototipo, pero promete interacción fluida y rápida, mostrando la ambición de Google de desarrollar un asistente de IA completo.
El evento también abordó la integración de estas capacidades avanzadas en el Google Workspace, donde Gemini puede ayudar a sintetizar información compleja, como emails sobre un tema particular, haciendo la gestión de la información más accesible y menos tediosa.
En términos de infraestructura, Google anunció Trillium, la sexta generación de sus unidades de procesamiento tensorial (TPU), que promete mejorar significativamente el rendimiento de las aplicaciones de IA debido a su mayor eficiencia y capacidad de procesamiento.
Además, se introdujo una nueva perspectiva en la búsqueda con la Experiencia Generativa de Búsqueda (SGE), donde los usuarios pueden hacer consultas más complejas y recibir respuestas generadas por IA que son más ricas y detalladas.
Este avance en la IA, según Google, no solo mejorará la funcionalidad de sus productos sino que también abrirá nuevas posibilidades en la interacción humana con las máquinas, destacando un compromiso continuo con la innovación y la utilidad en la tecnología de inteligencia artificial. Esto refleja la visión de Google de hacer que la tecnología sea útil para todos, a través de la accesibilidad y la eficacia mejorada.