OpenAI o1

14 de setembre de 2024632 Views

Els nous models d’IA desenvolupats per OpenAI marquen un avanç significatiu en la seva capacitat per raonar i resoldre tasques complexes, especialment en àrees com ciència, matemàtiques i programació. A diferència de versions anteriors, aquests models estan dissenyats per dedicar més temps a pensar abans d’oferir una resposta, cosa que els permet abordar problemes de major complexitat i millorar els seus resultats.

Un enfocament més profund per resoldre problemes complexos

Aquests nous models han estat entrenats per imitar el procés de raonament humà, el que significa que poden refinar el seu procés de pensament, provar diferents estratègies i aprendre dels seus errors. Aquest enfocament de raonament profund els permet manejar tasques desafiantes en camps com física, química i biologia amb un rendiment comparable al d’estudiants de doctorat. En particular, el model ha mostrat un gran rendiment en matemàtiques i programació. Durant les proves, el model anterior, GPT-4o, només va poder resoldre correctament el 13% dels problemes en un examen classificatori de l’Olimpíada Internacional de Matemàtiques (IMO). No obstant això, el nou model de raonament va aconseguir un 83% d’encerts, la qual cosa demostra la seva capacitat superior per resoldre problemes matemàtics complexos. A més, en competicions de programació en Codeforces, va assolir el 89% dels millors participants. Aquests resultats evidencien l’avanç en la capacitat de raonament dels models.

Funcionalitats limitades en la versió actual

Malgrat aquest progrés en les tasques de raonament, el model actual encara manca d’algunes funcionalitats presents en altres productes de ChatGPT, com la capacitat de navegar per la web i de pujar arxius o imatges. Per a la majoria dels casos comuns, GPT-4o seguirà sent més útil, però en tasques complexes de raonament, la nova sèrie, denominada OpenAI o1, suposa un salt qualitatiu quant a les capacitats de la IA. Aquest és només l’inici de la sèrie OpenAI o1, que s’actualitza i millora de manera contínua. A mesura que avanci, és probable que s’introdueixin noves característiques per ampliar la seva utilitat en una major varietat d’aplicacions.

Seguretat i alineació dels models

Quant a la seguretat, OpenAI ha adoptat un nou enfocament que aprofita les capacitats de raonament d’aquests models perquè segueixin les directrius de seguretat i alineació de manera més efectiva. Gràcies a la seva capacitat per raonar en context, els models poden aplicar les regles de seguretat de manera més estricta i evitar eludir-les. Un dels mètodes per avaluar la seguretat és mesurar com respon el model davant intents de jailbreaking (quan un usuari intenta evitar les restriccions del model). En una de les proves més difícils, GPT-4o va obtenir una puntuació de 22 en una escala de 0 a 100, mentre que el nou model de o1-preview va assolir un 84. Aquests resultats destaquen la seva capacitat per seguir les regles de seguretat de manera més eficient. A més, OpenAI ha reforçat els seus esforços en quant a seguretat interna, proves rigoroses i col·laboració amb el govern federal dels EE. UU. Aquest enfocament inclou proves amb el Preparedness Framework, avaluacions de seguretat de nivell alt, i processos de revisió per part del comitè de Seguretat i Governança. En suport al seu compromís amb la seguretat en la IA, OpenAI ha formalitzat acords amb els Instituts de Seguretat en IA dels EE. UU. i Regne Unit. Aquests acords inclouen l’accés anticipat dels instituts a una versió d’investigació d’aquest model per facilitar la seva avaluació i millorar la seguretat abans del seu llançament públic.

Destinataris i aplicacions d’OpenAI o1

Aquest nou nivell de capacitats de raonament està dirigit principalment a usuaris que necessitin resoldre problemes complexos en àrees com la ciència, les matemàtiques i la programació. Alguns exemples d’aplicacions inclouen: Investigadors en salut que poden usar el model per anotar dades de seqüenciació cel·lular. Físics que l’utilitzen per generar fórmules matemàtiques complexes necessàries en el camp de l’òptica quàntica. Desenvolupadors de diferents disciplines que necessiten construir i executar fluxos de treball de diversos passos.

OpenAI o1-mini: Una opció més econòmica

A més del model o1-preview, OpenAI ha llançat OpenAI o1-mini, una versió més petita i econòmica, optimitzada per a tasques de programació. Aquest model, al ser més lleuger, és un 80% més barat que o1-preview, i és ideal per a aplicacions que requereixen capacitats de raonament sense necessitat d’un ampli coneixement del món. o1-mini està dissenyat per ser una solució rendible per a desenvolupadors que busquen generar i depurar codi complex de manera eficient. Encara que és més petit, segueix sent una eina poderosa per a aquells que necessiten un model àgil i precís en la creació de codi.

Com accedir a OpenAI o1

Els usuaris de ChatGPT Plus i Team ja poden accedir als models de la sèrie o1 a la plataforma de ChatGPT. Els models o1-preview i o1-mini poden seleccionar-se manualment des del selector de models, i en aquesta fase de llançament, els límits de missatges setmanals són de 30 missatges per a o1-preview i 50 missatges per a o1-mini. OpenAI està treballant per augmentar aquests límits i habilitar la selecció automàtica del model més adequat segons la tasca. D’altra banda, els usuaris de ChatGPT Enterprise i Edu tindran accés a ambdós models la pròxima setmana. Per als desenvolupadors, aquells que qualifiquin per al nivell 5 d’ús de l’API poden començar a prototipar amb ambdós models, amb un límit de 20 sol·licituds per minut (RPM). No obstant això, l’API encara no inclou funcions com la crida a funcions, streaming, ni suport per a missatges del sistema. En el futur, OpenAI planeja oferir accés al model o1-mini per a tots els usuaris gratuïts de ChatGPT, fent aquesta tecnologia més accessible per a un major nombre de persones.

Pròxims passos

Aquesta sèrie de models de raonament està en les seves primeres fases, i OpenAI continuarà actualitzant i millorant tant aquests models com les versions de la sèrie GPT. Se preveu la incorporació de funcionalitats addicionals com la navegació web, càrrega d’arxius i pujada d’imatges, la qual cosa ampliarà la seva aplicabilitat a un major nombre d’usuaris i casos d’ús. Aquests desenvolupaments impulsaran la utilitat i versatilitat dels models a ChatGPT i l’API.

En resum, la nova sèrie OpenAI o1 representa un avanç important en la capacitat de raonament de la IA, amb aplicacions pràctiques en camps complexos com la ciència, les matemàtiques i la programació, mentre que es mantenen els més alts estàndards de seguretat i alineació amb les normatives.

Més informació

Aprenent a raonar…

Preguntes freqüents Open AI 01

Quina és l’avantatge principal dels models OpenAI o1 davant de GPT-4o?

L’avantatge principal dels models OpenAI o1 sobre GPT-4o resideix en la seva capacitat de raonament profund. Mentre que GPT-4o ofereix respostes ràpides i eficients per a tasques comunes, els models o1 estan dissenyats per abordar problemes complexos en àrees com matemàtiques, ciència i programació. Gràcies a un enfocament que els permet dedicar més temps a pensar, els models o1 poden refinar el seu procés de pensament, provar diferents estratègies i aprendre dels seus errors, la qual cosa resulta en una capacitat significativament millorada per resoldre problemes avançats.

Com ha millorat OpenAI o1 la seva capacitat per resoldre problemes complexos?

OpenAI o1 ha millorat la seva capacitat per resoldre problemes complexos en incorporar un enfocament de raonament que imita el procés de pensament humà. Aquests models no es limiten a oferir respostes immediates, sinó que avaluen diferents estratègies, detecten errors i optimitzen el procés de resolució de problemes. Per exemple, en proves matemàtiques, el model o1 va aconseguir resoldre el 83% dels problemes a la Olimpíada Internacional de Matemàtiques (IMO), en comparació amb el 13% de GPT-4o. A més, en competicions de programació com Codeforces, va assolir un rendiment del 89%, destacant la seva superioritat en tasques tècniques desafiants.

Quines són les limitacions actuals del model OpenAI o1?

Malgrat els seus avanços en raonament, el model OpenAI o1 té algunes limitacions en comparació amb altres versions de ChatGPT. Actualment, careix de funcions com la navegació web i la capacitat per processar arxius o imatges. Això significa que, encara que el model és excepcional en la resolució de problemes complexos, per a tasques més generals o quotidians, com la cerca a Internet o l’anàlisi d’arxius multimèdia, GPT-4o segueix sent una opció més pràctica. OpenAI planeja seguir millorant i afegint funcionalitats en futures actualitzacions de la sèrie o1.

Qui pot beneficiar-se més de l’ús dels models OpenAI o1?

Els usuaris que més es beneficiaran dels models OpenAI o1 són aquells que necessiten resoldre problemes complexos en àrees especialitzades com la ciència, les matemàtiques i la programació. Investigadors científics poden aprofitar el model per anàlisis avançats, com l’anotació de dades de seqüenciació cel·lular o la generació de fórmules en física quàntica. Així mateix, els desenvolupadors de programari que treballen amb fluxos de treball complexos i múltiples etapes trobaran en els models o1 una eina valuosa per generar i optimitzar codi.

És OpenAI o1-mini adequat per a desenvolupadors?

Sí, OpenAI o1-mini és una opció excel·lent per a desenvolupadors, especialment aquells que busquen una solució rendible. Malgrat ser una versió més lleugera que l’o1-preview, o1-mini segueix oferint potents capacitats de raonament, la qual cosa el fa ideal per a tasques de programació que requereixen precisió i eficiència. A més, el seu cost reduït, fins a un 80% més barat, el converteix en una alternativa assequible per a aquells que no necessiten un coneixement global extens, però sí un rendiment àgil en la creació i depuració de codi.

Com garanteix OpenAI la seguretat en els seus nous models o1?

OpenAI garanteix la seguretat dels seus models o1 adoptant un enfocament innovador que aprofita les capacitats de raonament per seguir estrictament les normes de seguretat. Els models o1 poden aplicar regles de seguretat de manera més efectiva, el que redueix la possibilitat que els usuaris eludeixin restriccions mitjançant tècniques com el jailbreaking. En proves rigoroses, l’o1-preview va obtenir una puntuació de 84 sobre 100 en seguretat, comparat amb 22 de GPT-4o. A més, OpenAI col·labora amb organismes governamentals