ChatGPT: Mode Veu amb Visió
OpenAI ha presentat la seva nova funció Advanced Voice with Vision durant el sisè dia de la campanya “12 Days of OpenAI”. Aquest avanç permet als usuaris interactuar amb ChatGPT mitjançant entrada de veu, imatges i vídeo, obrint noves possibilitats en creativitat i resolució de problemes. Actualment, aquesta funció està disponible exclusivament per als subscriptors de ChatGPT Plus i Pro.
Què és l’Advanced Voice with Vision
Aquesta eina combina la modalitat de veu amb anàlisi visual, permetent identificar objectes en temps real, entendre pantalles compartides i resoldre problemes complexos, com explicar configuracions o realitzar anàlisis matemàtics. La funcionalitat s’activa al subscriure’s a ChatGPT Plus, amb un cost mensual de 20 $, que també inclou accés al model GPT-4.5 i respostes més ràpides.
Com activar la funció
- Subscripció: Adquireix ChatGPT Plus des del lloc web oficial.
- Accés: Inicia sessió i busca la icona del micròfon per activar l’entrada per veu. Per a l’anàlisi visual, selecciona la icona de vídeo a la part inferior esquerra.
- Pantalla compartida: Accedeix al menú de tres punts i selecciona “Share Screen”.
Modes festius: Santa Mode
Com a detall especial, OpenAI ha llançat el Santa Mode, un preset de veu amb característiques del Pare Noel. Accessible mitjançant la icona de floc de neu al costat del micròfon, aquesta funció està disponible fins i tot per a usuaris gratuïts que hagin superat el seu límit de xats.
Competència al mercat
La presentació ha coincidit amb l’anunci del model Gemini 2.0 de Google, que inclou capacitats similars d’anàlisi visual i auditiu. Aquest model té diferents aplicacions sota noms com Project Astra i Project Mariner. OpenAI ha destacat la precisió de la seva modalitat visual, però també ha admès fallades ocasionals, com en problemes geomètrics durant proves recents.
Limitacions actuals
Tot i que el llançament ja ha començat, la funció estarà completament disponible en una setmana. Usuaris a la UE, Islàndia, Noruega i altres països hauran d’esperar fins al gener de 2024.
Preguntes i Respostes
Què és l’Advanced Voice with Vision de ChatGPT?
És una funció que permet als usuaris interactuar amb ChatGPT mitjançant veu, imatges i vídeo, disponible per a subscriptors Plus.
Com activar el Santa Mode a ChatGPT?
Busca la icona de floc de neu al costat del micròfon a l’aplicació de ChatGPT i selecciona Santa Mode.
Quant costa ChatGPT Plus?
La subscripció costa 20 $ mensuals i inclou accés a Advanced Voice with Vision i altres funcions premium.
Quan estarà disponible a la UE?
OpenAI planeja habilitar aquesta funció al gener de 2024 per a usuaris a la UE i països associats.