ChatGPT: Modo Voz con Visión

OpenAI presentó su nueva función Advanced Voice with Vision durante el sexto día de la campaña «12 Days of OpenAI». Este avance permite a los usuarios interactuar con ChatGPT mediante entrada de voz, imágenes y video, abriendo nuevas posibilidades en creatividad y resolución de problemas. Actualmente, esta función está disponible exclusivamente para suscriptores de ChatGPT Plus y Pro.

Qué es el Advanced Voice with Vision

Esta herramienta combina la modalidad de voz con análisis visual, permitiendo identificar objetos en tiempo real, entender pantallas compartidas y resolver problemas complejos, como explicar configuraciones o realizar análisis matemáticos. La funcionalidad se activa al suscribirse a ChatGPT Plus, con un costo mensual de $20, que también incluye acceso al modelo GPT-4.5 y respuestas más rápidas.

Cómo activar la función

  1. Suscripción: Adquiere ChatGPT Plus desde el sitio web oficial.
  2. Acceso: Inicia sesión y busca el ícono del micrófono para activar la entrada por voz. Para análisis visual, selecciona el ícono de video en la parte inferior izquierda.
  3. Pantalla compartida: Accede al menú de tres puntos y selecciona «Share Screen».

Modos festivos: Santa Mode

Como un detalle especial, OpenAI lanzó el Santa Mode, un preset de voz con características de Santa Claus. Accesible mediante el ícono de copo de nieve junto al micrófono, esta función está disponible incluso para usuarios gratuitos que hayan excedido su límite de chats.

Competencia en el mercado

La presentación coincidió con el anuncio del modelo Gemini 2.0 de Google, que incluye capacidades similares de análisis visual y auditivo. Este modelo tiene diferentes aplicaciones bajo nombres como Project Astra y Project Mariner. OpenAI destacó la precisión de su modalidad visual, pero también admitió fallos ocasionales, como en problemas geométricos durante pruebas recientes.

Limitaciones actuales

Aunque el lanzamiento ya inició, la función estará completamente disponible en una semana. Usuarios en la UE, Islandia, Noruega y otros países deberán esperar hasta enero de 2024.

Preguntas y Respuestas

¿Qué es el Advanced Voice with Vision de ChatGPT?

Es una función que permite a los usuarios interactuar con ChatGPT mediante voz, imágenes y video, disponible para suscriptores Plus.

¿Cómo activar Santa Mode en ChatGPT?

Busca el ícono de copo de nieve junto al micrófono en la aplicación de ChatGPT y selecciona Santa Mode.

¿Cuánto cuesta ChatGPT Plus?

La suscripción cuesta $20 mensuales e incluye acceso a Advanced Voice with Vision y otras funciones premium.

¿Cuándo estará disponible en la UE?

OpenAI planea habilitar esta función en enero de 2024 para usuarios en la UE y países asociados.