OpenAI revoluciona la IA amb o3

OpenAI va tancar el seu esdeveniment nadalenc de 12 dies amb el llançament del model d’intel·ligència artificial o3, una evolució significativa del seu predecessor, o1. Aquest nou model inclou o3-mini, una versió més compacta i optimitzada per a tasques específiques com la codificació. OpenAI assegura que o3 representa un avenç disruptiu en benchmarks complexos, acostant-se fins i tot al que alguns consideren intel·ligència artificial general (AGI).

Rendiment d’OpenAI o3 excel·lent en benchmarks

El model o3 ha demostrat la seva superioritat en diverses proves:

  • SWE-Bench Verified: o3 va assolir un 71,7 %, superant en més d’un 20 % el seu predecessor i models com GPT-4o i Claude 3.5 Sonnet.
  • Codeforces: Amb una puntuació ELO de 2727, o3 es posiciona entre els 200 millors programadors competitius del món.
  • Matemàtiques: A l’examen AIME 2024, va obtenir un 96,7 %, fallant només una pregunta. A més, en el desafiador benchmark FrontierMath, va resoldre un 25,2 % dels problemes, un salt del 1200 % respecte a altres models.
  • Ciències: En GPQA Diamond, un conjunt de preguntes a nivell doctoral, o3 va assolir un 87,7 %, superant àmpliament la mitjana humana.
  • ARC-AGI: Sorprenentment, va aconseguir un 87,5 % en aquest benchmark dissenyat per mesurar la capacitat de raonament i adaptació a noves tasques.

Per què o3 és revolucionari?

o3 no només ofereix millores en precisió i rendiment, sinó que introdueix un enfocament de “raonament deliberatiu”. Això permet que el model “pensi” abans de respondre, processant múltiples variables i explicant el seu raonament. A més, la seva capacitat per ajustar el temps de raonament segons la complexitat de la tasca és un salt qualitatiu respecte al seu predecessor.

Llançament i disponibilitat

Tot i que o3 i o3-mini encara no estan disponibles per al públic general, OpenAI planeja alliberar o3-mini a finals de gener de 2025, seguit poc després per o3. Aquests models estan sent sotmesos a rigoroses proves de seguretat i redisseny per garantir-ne la fiabilitat.

Reptes i consideracions ètiques

El llançament d’o3 planteja preguntes importants sobre la seguretat i l’alineació ètica de models tan avançats. Segons OpenAI, o3 utilitza un nou enfocament anomenat “alineació deliberativa” per minimitzar riscos. Tanmateix, crítics com François Chollet adverteixen que encara hi ha limitacions significatives per considerar o3 com una veritable AGI.

Impacte en la indústria de la IA

El llançament d’o3 marca un canvi en el panorama de la intel·ligència artificial, animant altres empreses a desenvolupar models de raonament. No obstant això, la complexitat i els costos associats generen dubtes sobre si aquest ritme de progrés es pot mantenir.

Preguntes i respostes

Què fa especial el model o3?

El model o3 incorpora raonament deliberatiu, superant benchmarks complexos i acostant-se al concepte d’intel·ligència artificial general.

Quan estarà disponible o3?

OpenAI planeja llançar o3-mini al gener de 2025, seguit d’o3 poc després.

Què significa que o3 s’acosti a l’AGI?

Significa que o3 pot adaptar-se a noves tasques amb un rendiment similar al humà en certs contextos, tot i que encara no compleix amb tots els criteris d’una AGI.