Llançament de GPT‑4.1 amb millores clau
El 14 d’abril de 2025, OpenAI va presentar oficialment la seva nova sèrie de models de llenguatge: GPT‑4.1, GPT‑4.1 mini i GPT‑4.1 nano. Aquestes versions millorades representen un gran avenç respecte als models anteriors, destacant per la seva capacitat per codificar, seguir instruccions i comprendre contextos extensos de fins a un milió de tokens.
Millores clau en codificació
GPT‑4.1 es posiciona com un dels models més sòlids per a tasques de programació. En proves com SWE-bench Verified, assoleix una taxa d’èxit del 54,6 %, superant notablement GPT‑4o (33,2 %) i GPT‑4.5 (38 %). També destaca en la producció de diffs més precisos i eficients, seguint formats específics per estalviar temps i recursos.
A més, el seu rendiment en el benchmark Aider polyglot el situa com a líder en edició de codi, ja que pot fer canvis mínims sense reescriure arxius complets, cosa fonamental en projectes de gran escala.
Seguiment d’instruccions més fiable
Un altre aspecte destacat és la millora en la comprensió i execució d’instruccions complexes. En el benchmark MultiChallenge, GPT‑4.1 va assolir un 38 %, davant del 28 % de GPT‑4o. També va obtenir un 87 % en IFEval, cosa que demostra la seva precisió a l’hora de seguir indicacions específiques, evitar errors i adaptar-se a formats diversos.
Aquesta fiabilitat converteix el model en una eina ideal per a agents intel·ligents que automatitzen tasques complexes, des de l’atenció al client fins a l’anàlisi legal o financer.
Context llarg: Fins a 1 milió de tokens
La família GPT‑4.1 pot processar i raonar amb volums enormes d’informació gràcies a la seva capacitat de context estès. Aquesta funció és essencial en sectors com el dret, l’enginyeria o l’anàlisi de dades. En proves com OpenAI-MRCR i Graphwalks, el model va demostrar la seva habilitat per identificar informació rellevant, fins i tot si està dispersa o envoltada de dades distractores.
Rendiment visual millorat
GPT‑4.1 i les seves variants també han millorat en tasques visuals. En proves com MMMU i MathVista, van superar GPT‑4o amb una major precisió a l’hora d’interpretar gràfics, diagrames i problemes matemàtics visuals. Aquestes capacitats amplien la seva utilitat en educació, ciència i anàlisi tècnica.
Latència i costos reduïts
A més de ser més potent, GPT‑4.1 és més econòmic. Gràcies a millores en la infraestructura, els temps de resposta s’han reduït significativament, especialment en els models mini i nano. GPT‑4.1 mini ofereix un rendiment comparable al de models més grans, però amb un 83 % menys de cost i gairebé el doble de velocitat.
Aplicacions reals
Empreses com Blue J, Carlyle i Thomson Reuters ja estan utilitzant GPT‑4.1 en producció. Aquestes organitzacions destaquen una major precisió, menor repetició d’errors i més agilitat en fluxos de treball complexos. La millora en eficiència i qualitat de resposta impulsa l’adopció del model en entorns exigents.
Preguntes i respostes
Quina diferència hi ha entre GPT‑4.1 i GPT‑4o?
GPT‑4.1 supera GPT‑4o en codificació, seguiment d’instruccions i comprensió de contextos llargs. També ofereix menor latència i més eficiència.
Quin avantatge tenen els models mini i nano?
Els models mini i nano ofereixen un rendiment similar o superior amb menor cost i més velocitat, ideals per a tasques ràpides o amb recursos limitats.
Quins sectors es beneficien més de GPT‑4.1?
Sectors com el desenvolupament de programari, dret, finances i atenció al client poden aprofitar les seves millores en comprensió, precisió i velocitat.
Estarà GPT‑4.1 disponible a ChatGPT?
No directament. GPT‑4.1 estarà disponible només a través de l’API. Tot i això, algunes de les seves millores ja s’han integrat en l’última versió de GPT‑4o per a ChatGPT.