Google lanza Gemma 2

29 de junio de 20241239 Views

Google ha anunciado el lanzamiento de Gemma 2, la última iteración de sus modelos de inteligencia artificial abiertos, diseñados para desarrolladores e investigadores. Gemma 2 está disponible en dos tamaños de parámetros: 9 mil millones (9B) y 27 mil millones (27B), ofreciendo rendimiento de vanguardia y eficiencia en la inferencia, superando significativamente a su predecesor. Este modelo no solo es más potente, sino que también integra mejoras significativas en seguridad y es altamente eficiente, logrando un rendimiento competitivo con modelos que son más del doble de su tamaño. Además, puede funcionar en un solo GPU Tensor Core H100 de NVIDIA o en un host TPU, reduciendo considerablemente los costos de implementación.

Características destacadas de Gemma 2

Rendimiento excepcional:
- El modelo de 27B ofrece el mejor rendimiento en su clase de tamaño y opciones competitivas frente a modelos más grandes.
- El modelo de 9B también lidera en rendimiento dentro de su categoría, superando a otros modelos abiertos de tamaño similar.
Eficiencia y ahorro de costos:
- Diseñado para ejecutar inferencias a precisión completa en una variedad de hardware, incluido el GPU Tensor Core H100 de NVIDIA, optimizando costos sin sacrificar rendimiento.
Velocidad de inferencia:
- Gemma 2 está optimizado para correr a gran velocidad en diferentes configuraciones de hardware, desde laptops de juegos hasta configuraciones basadas en la nube.
Compatibilidad y accesibilidad:
- Compatible con principales marcos de IA como Hugging Face, JAX, PyTorch y TensorFlow, lo que facilita su integración en flujos de trabajo existentes.
- Disponible bajo una licencia comercialmente amigable, permitiendo a desarrolladores e investigadores compartir y comercializar sus innovaciones.

Recursos y herramientas adicionales

Gemma Cookbook: Una colección de ejemplos prácticos y recetas para guiar a los usuarios en la construcción de aplicaciones y ajuste fino de los modelos Gemma 2 para tareas específicas.
Google AI Studio: Permite probar las capacidades completas del modelo de 27B sin necesidad de hardware adicional.
Kaggle y Hugging Face Models: Ofrecen los pesos del modelo para descarga, facilitando el acceso y uso.

Desarrollo responsable de IA

Google se compromete a proporcionar recursos para el desarrollo y despliegue responsable de la IA, incluyendo el Responsible Generative AI Toolkit y el LLM Comparator, una herramienta de evaluación comparativa de modelos de lenguaje. Además, Google planea hacer open source su tecnología de marcas de agua de texto, SynthID, para los modelos Gemma, reforzando su compromiso con la seguridad y la mitigación de riesgos en IA.

Proyectos y aplicaciones con Gemma

El primer lanzamiento de Gemma resultó en más de 10 millones de descargas y numerosos proyectos innovadores. Con Gemma 2, Google espera impulsar aún más la creatividad y ambición de los desarrolladores en sus proyectos de IA, incluyendo futuros modelos diseñados para balancear accesibilidad y rendimiento.

Disponibilidad y próximos pasos

Gemma 2 está disponible en Google AI Studio, Kaggle, y pronto en Vertex AI Model Garden. Para fomentar el acceso a la investigación y desarrollo, Gemma 2 está disponible de forma gratuita en Kaggle y mediante un nivel gratuito para notebooks Colab. Los nuevos clientes de Google Cloud pueden ser elegibles para $300 en créditos. Además, los investigadores académicos pueden solicitar el Gemma 2 Academic Research Program para recibir créditos de Google Cloud que aceleren sus investigaciones.

Google sigue explorando nuevas arquitecturas y variantes especializadas de Gemma para abordar una gama más amplia de tareas y desafíos de IA, con la promesa de futuras actualizaciones y modelos.

Más información