Gemini 2.5 Flash: IA amb raonament ajustable

22 d'abril de 2025443 Views

Google ha presentat Pr, una versió avançada del seu model d’intel·ligència artificial que permet a desenvolupadors i empreses controlar el nivell de raonament que la IA aplica en cada tasca. Aquesta funcionalitat, denominada “pressupost de pensament”, ofereix un equilibri entre qualitat, cost i velocitat en les respostes generades.

Control del raonament: el “pressupost de pensament”

El “pressupost de pensament” és una característica que permet ajustar la quantitat de recursos computacionals que la IA utilitza per raonar sobre una consulta abans de generar una resposta. Aquest pressupost es pot configurar entre 0 i 24.576 tokens, funcionant com un límit màxim que el model emprarà segons la complexitat de la tasca. Per exemple, per a preguntes simples com “Quantes províncies té el Canadà?”, el model utilitzarà un raonament mínim, mentre que per a problemes complexos, com càlculs d’enginyeria, aplicarà un raonament més profund.

Model híbrid: raonament a demanda

Gemini 2.5 Flash es destaca per ser el primer model de Google amb raonament híbrid, permetent activar o desactivar el procés de pensament segons les necessitats específiques. Això és especialment útil per a aplicacions empresarials on es requereix un equilibri entre eficiència i profunditat en les respostes.

Rendiment competitiu i eficiència de costos

Pel que fa al rendiment, Gemini 2.5 Flash ha demostrat ser competitiu en diverses proves de referència. Per exemple, a l’examen “Humanity’s Last Exam”, va obtenir una puntuació del 12,1%, superant models com Claude 3.7 Sonnet (8,9%) i DeepSeek R1 (8,6%), tot i que per sota de l’o4-mini d’OpenAI (14,3%). A més, en avaluacions tècniques com GPQA diamond i exàmens de matemàtiques AIME, va aconseguir puntuacions destacades del 78,3% i 88,0% respectivament.

En termes de costos, el model ofereix tarifes diferenciades segons el nivell de raonament: $0,15 per milió de tokens d’entrada, $0,60 per milió de tokens de sortida sense raonament i $3,50 per milió de tokens de sortida amb raonament activat. Aquesta estructura permet als desenvolupadors optimitzar l’ús de recursos segons les necessitats de cada aplicació.

Disponibilitat i aplicacions pràctiques

Gemini 2.5 Flash està disponible en vista prèvia a través de Google AI Studio i Vertex AI, i també es pot accedir mitjançant l’aplicació Gemini com “2.5 Flash (Experimental)”. Aquesta flexibilitat el converteix en una opció atractiva per a empreses que busquen implementar solucions d’IA personalitzades i eficients en costos.

Preguntes i respostes

Què és el “pressupost de pensament” a Gemini 2.5 Flash?

És una funció que permet definir quants recursos computacionals la IA utilitzarà per raonar sobre una consulta abans de generar una resposta, ajustant-se segons la complexitat de la tasca.

Com afecta el “pressupost de pensament” al cost?

Activar el raonament incrementa el cost per milió de tokens de sortida de $0,60 a $3,50, reflectint un major ús de recursos computacionals.

On es pot accedir a Gemini 2.5 Flash?

Està disponible en vista prèvia a través de Google AI Studio, Vertex AI i l’aplicació Gemini com “2.5 Flash (Experimental)”.

Quins avantatges ofereix Gemini 2.5 Flash en comparació amb altres models?

Ofereix un equilibri entre rendiment i cost, permetent ajustar el nivell de raonament segons les necessitats, fet que el fa ideal per a aplicacions empresarials que requereixen eficiència i personalització.

Més informació