Gemini 2.5 Flash: IA con razonamiento ajustable
Google ha presentado Pr, una versión avanzada de su modelo de inteligencia artificial que permite a desarrolladores y empresas controlar el nivel de razonamiento que la IA aplica en cada tarea. Esta funcionalidad, denominada «presupuesto de pensamiento», ofrece un equilibrio entre calidad, costo y velocidad en las respuestas generadas.
Control del razonamiento: el «presupuesto de pensamiento»
El «presupuesto de pensamiento» es una característica que permite ajustar la cantidad de recursos computacionales que la IA utiliza para razonar sobre una consulta antes de generar una respuesta. Este presupuesto puede configurarse entre 0 y 24,576 tokens, funcionando como un límite máximo que el modelo empleará según la complejidad de la tarea. Por ejemplo, para preguntas simples como «¿Cuántas provincias tiene Canadá?», el modelo utilizará un razonamiento mínimo, mientras que para problemas complejos, como cálculos de ingeniería, aplicará un razonamiento más profundo.
Modelo híbrido: razonamiento bajo demanda
Gemini 2.5 Flash se destaca por ser el primer modelo de Google con razonamiento híbrido, permitiendo activar o desactivar el proceso de pensamiento según las necesidades específicas. Esto es especialmente útil para aplicaciones empresariales donde se requiere un equilibrio entre eficiencia y profundidad en las respuestas.

Rendimiento competitivo y eficiencia de costos
En cuanto al rendimiento, Gemini 2.5 Flash ha demostrado ser competitivo en diversas pruebas de referencia. Por ejemplo, en el examen «Humanity’s Last Exam», obtuvo una puntuación del 12.1%, superando a modelos como Claude 3.7 Sonnet (8.9%) y DeepSeek R1 (8.6%), aunque por debajo de o4-mini de OpenAI (14.3%). Además, en evaluaciones técnicas como GPQA diamond y exámenes de matemáticas AIME, alcanzó puntuaciones destacadas del 78.3% y 88.0% respectivamente.
En términos de costos, el modelo ofrece tarifas diferenciadas según el nivel de razonamiento: $0.15 por millón de tokens de entrada, $0.60 por millón de tokens de salida sin razonamiento y $3.50 por millón de tokens de salida con razonamiento activado. Esta estructura permite a los desarrolladores optimizar el uso de recursos según las necesidades de cada aplicación.
Disponibilidad y aplicaciones prácticas
Gemini 2.5 Flash está disponible en vista previa a través de Google AI Studio y Vertex AI, y también se puede acceder mediante la aplicación Gemini como «2.5 Flash (Experimental)». Esta flexibilidad lo convierte en una opción atractiva para empresas que buscan implementar soluciones de IA personalizadas y eficientes en costos.
Preguntas y respuestas
¿Qué es el «presupuesto de pensamiento» en Gemini 2.5 Flash?
Es una función que permite definir cuántos recursos computacionales la IA utilizará para razonar sobre una consulta antes de generar una respuesta, ajustándose según la complejidad de la tarea.
¿Cómo afecta el «presupuesto de pensamiento» al costo?
Activar el razonamiento aumenta el costo por millón de tokens de salida de $0.60 a $3.50, reflejando el mayor uso de recursos computacionales.
¿Dónde se puede acceder a Gemini 2.5 Flash?
Está disponible en vista previa a través de Google AI Studio, Vertex AI y la aplicación Gemini como «2.5 Flash (Experimental)».
¿Qué ventajas ofrece Gemini 2.5 Flash frente a otros modelos?
Ofrece un equilibrio entre rendimiento y costo, permitiendo ajustar el nivel de razonamiento según las necesidades, lo que lo hace ideal para aplicaciones empresariales que requieren eficiencia y personalización.