OpenAI llança o3 i o4-mini, els seus models més potents
OpenAI acaba de llançar dos nous models d’intel·ligència artificial que estan marcant un abans i un després: o3 i o4-mini. Aquests models no només pensen de manera més profunda, sinó que ara també utilitzen eines de forma autònoma dins de ChatGPT. Què vol dir això? Que poden cercar a la web, analitzar fitxers, interpretar imatges i fins i tot crear contingut visual… tot en menys d’un minut!
La clau? Han après quan i com utilitzar aquestes eines per resoldre tasques complexes. És un pas més cap a una IA que no només respon, sinó que actua com un veritable assistent estratègic.
Els models estan dissenyats per decidir quan i com utilitzar aquestes eines, fet que els acosta a un ús més autònom i estratègic, ideal per resoldre problemes complexos o preguntes multifacètiques. Gràcies al seu entrenament amb aprenentatge per reforç, poden combinar recursos de manera intel·ligent per produir anàlisis profundes en múltiples formats.
o3 és el model de raonament més avançat, superant benchmarks com Codeforces, SWE-bench i MMMU, i mostrant un rendiment superior especialment en tasques visuals, programació, matemàtiques, ciència i consultoria. Redueix els errors en un 20 % respecte al model o1 i destaca pel seu pensament crític en hipòtesis noves, especialment en biologia, matemàtiques i enginyeria.
D’altra banda, o4-mini està optimitzat per ser més ràpid i eficient en costos. És el model més precís en proves com AIME 2024 i 2025, arribant a un 99,5 % d’encerts amb accés a eines. També supera el model o3-mini en tasques no STEM i és ideal per a ús intensiu gràcies als seus límits d’ús més elevats.
En tasques visuals, tots dos models poden ara “pensar amb imatges”, interpretant fotos, gràfics o esquemes fins i tot si són borrosos o de baixa qualitat. A més, poden manipular imatges com a part del raonament. Aquest avanç permet abordar problemes abans inabastables.
Els dos models tenen accés complet a eines personalitzades mitjançant crides de funcions a l’API. Això els permet automatitzar tasques com recopilar dades, programar càlculs, generar gràfics i explicar resultats, tot dins d’una cadena de raonament coordinada.
També s’ha millorat la seguretat i ètica del sistema, amb nous filtres i entrenaments per rebutjar sol·licituds perilloses. OpenAI ha validat que aquests models estan per sota dels llindars de risc en ciberseguretat, biotecnologia i auto-millora.
Finalment, amb el nou Codex CLI, els usuaris poden interactuar amb aquests models des del terminal del seu ordinador per a tasques de codificació avançada. OpenAI també ha llançat una iniciativa de subvencions d’un milió de dòlars per donar suport a projectes que utilitzin aquesta tecnologia.
Novetats que marquen la diferència
- Raonament amb imatges: Els models ara poden interpretar imatges directament, encara que estiguin borroses o girades. I no només això, també poden manipular-les com a part de l’anàlisi.
- Accés complet a eines: Poden encadenar accions: cercar, calcular, fer gràfics i explicar, tot en una sola conversa.
- Més seguretat: Estan entrenats per evitar continguts perillosos i han passat pel programa de proves més rigorós d’OpenAI.
- Codex CLI: Una nova eina per a desenvolupadors que permet utilitzar aquests models directament des del terminal.
Preguntes i Respostes
Quines novetats aporten els models o3 i o4-mini?
Els models o3 i o4-mini permeten utilitzar eines com navegació web, anàlisi visual i generació d’imatges de manera autònoma, millorant el raonament i la precisió en tasques complexes.
Quina és la diferència principal entre o3 i o4-mini?
o3 és més potent per a tasques complexes i visuals, mentre que o4-mini és més ràpid, econòmic i adequat per a un ús intensiu amb raonament eficient.
Quines millores hi ha en seguretat amb aquests models?
Tots dos models han estat entrenats per rebutjar sol·licituds perilloses, amb filtres reforçats i un sistema de monitoratge que detecta riscos en temps real.
Què és Codex CLI i com es relaciona amb aquests models?
Codex CLI és una eina de línia d’ordres que permet utilitzar els models per a programació avançada des del teu propi ordinador, facilitant tasques tècniques amb interacció directa.