Operator d’OpenAI reinventa les tasques web
Operator és un nou agent d’OpenAI dissenyat per executar tasques a la web de manera autònoma. Utilitzant un model innovador anomenat Computer-Using Agent (CUA), combina la visió avançada de GPT-4 amb habilitats de raonament per interactuar amb interfícies gràfiques, com botons, menús i camps de text. Actualment, està en una etapa de vista prèvia de recerca i disponible exclusivament per a usuaris Pro als Estats Units.
Com funciona Operator?
Operator pot “veure” les pàgines web mitjançant captures de pantalla i “actuar” simulant clics i tecles. Això elimina la necessitat d’integrar APIs personalitzades i permet a l’agent realitzar tasques com omplir formularis, programar reserves o fins i tot crear memes.
Quan troba problemes, pot autocorregir-se gràcies a la seva capacitat de raonament. En casos més complexos, com introduir dades de pagament o resoldre CAPTCHAs, Operator retorna el control a l’usuari per garantir seguretat i precisió.
Beneficis clau per a usuaris i empreses
- Optimització de tasques repetitives: Des de comprar aliments fins a reservar vols, Operator facilita processos quotidians.
- Integració amb empreses: Organitzacions com Instacart, DoorDash i Uber col·laboren per adaptar Operator a necessitats reals.
- Aplicacions cíviques: S’està provant a Stockton, Califòrnia, per simplificar l’accés als serveis públics.
Enfocament en seguretat i privacitat
Operator prioritza la seguretat mitjançant diverses mesures:
- Mode de supervisió: L’agent demana confirmació abans d’accions crítiques i transfereix el control a l’usuari en situacions delicades.
- Gestió de dades: Els usuaris poden eliminar els historials de navegació i desactivar l’opció que la seva informació sigui utilitzada per a entrenament.
- Prevenció d’abusos: Inclou defenses contra llocs maliciosos i rebutja sol·licituds perjudicials o de risc elevat.
Limitacions actuals i futur
Operator encara s’enfronta a reptes amb interfícies complexes i tasques avançades, com la creació de calendaris. Tanmateix, l’aprenentatge continu i el feedback dels usuaris seran essencials per millorar les seves capacitats. En el futur, s’integrarà a ChatGPT per a usuaris Plus i Team, i es preveu obrir el seu model CUA a desenvolupadors mitjançant una API.
Preguntes freqüents
Què és Operator?
És un agent d’OpenAI dissenyat per automatitzar tasques web interactuant amb interfícies gràfiques.
Com garanteix la seguretat?
Operator supervisa les seves accions, sol·licita confirmacions i permet eliminar dades fàcilment.
Està disponible per a tothom?
De moment, està limitat a usuaris Pro als Estats Units, amb plans d’expansió futura.