OpenAI lanza o3 y o4-mini, sus modelos más potentes

OpenAI acaba de lanzar dos nuevos modelos de inteligencia artificial que están marcando un antes y un después: o3 y o4-mini. Estos modelos no solo piensan más profundamente, sino que ahora también usan herramientas de forma autónoma dentro de ChatGPT. ¿Qué significa esto? Que pueden buscar en la web, analizar archivos, interpretar imágenes y hasta crear contenido visual… ¡todo en menos de un minuto!

¿La clave? Han aprendido cuándo y cómo usar estas herramientas para resolver tareas complejas. Es un paso más hacia una IA que no solo responde, sino que actúa como un verdadero asistente estratégico.

Los modelos están diseñados para decidir cuándo y cómo utilizar estas herramientas, lo que los acerca a un uso más autónomo y estratégico, ideal para resolver problemas complejos o preguntas multifacéticas. Gracias a su entrenamiento con aprendizaje por refuerzo, pueden combinar recursos de forma inteligente para producir análisis profundos en múltiples formatos.

o3 es el modelo de razonamiento más avanzado, superando benchmarks como Codeforces, SWE-bench y MMMU, y mostrando un rendimiento superior especialmente en tareas visuales, programación, matemáticas, ciencia y consultoría. Reduce los errores en un 20 % respecto al modelo o1 y destaca por su pensamiento crítico en hipótesis novedosas, especialmente en biología, matemáticas e ingeniería.

Por otro lado, o4-mini está optimizado para ser más rápido y eficiente en costes. Es el modelo más preciso en pruebas como AIME 2024 y 2025, alcanzando un 99,5 % de aciertos con acceso a herramientas. También supera al modelo o3-mini en tareas no STEM y es ideal para uso intensivo gracias a sus límites de uso más elevados.

En tareas visuales, ambos modelos pueden ahora “pensar con imágenes”, interpretando fotos, gráficos o esquemas incluso si están borrosos o son de baja calidad. Además, pueden manipular imágenes como parte del razonamiento. Este avance permite abordar problemas antes inalcanzables.

Los dos modelos tienen acceso completo a herramientas personalizadas mediante llamadas de funciones en la API. Esto les permite automatizar tareas como recopilar datos, programar cálculos, generar gráficos y explicar resultados, todo en una cadena de razonamiento coordinada.

También se ha mejorado la seguridad y ética del sistema, con nuevos filtros y entrenamientos para rechazar solicitudes peligrosas. OpenAI ha validado que estos modelos están por debajo de los umbrales de riesgo en ciberseguridad, biotecnología y auto-mejora.

Finalmente, con el nuevo Codex CLI, los usuarios pueden interactuar con estos modelos desde la terminal de su computadora para tareas de codificación avanzada. OpenAI también ha lanzado una iniciativa de subvenciones de un millón de dólares para apoyar proyectos que usen esta tecnología.

Novedades que marcan la diferencia

  • Razonamiento con imágenes: Los modelos ahora pueden interpretar imágenes directamente, aunque estén borrosas o giradas. Y no solo eso, también pueden manipularlas como parte del análisis.
  • Acceso completo a herramientas: Pueden encadenar acciones: buscar, calcular, graficar y explicar, todo en una sola conversación.
  • Más seguridad: Están entrenados para evitar contenidos peligrosos y han pasado por el programa de pruebas más riguroso de OpenAI.
  • Codex CLI: Una herramienta nueva para desarrolladores que permite usar estos modelos directamente desde la terminal.

Preguntas y Respuestas

¿Qué novedades traen los modelos o3 y o4-mini?

Los modelos o3 y o4-mini permiten usar herramientas como navegación web, análisis visual y generación de imágenes de forma autónoma, mejorando el razonamiento y la precisión en tareas complejas.

¿Cuál es la diferencia principal entre o3 y o4-mini?

o3 es más potente para tareas complejas y visuales, mientras que o4-mini es más rápido, económico y adecuado para uso intensivo con razonamiento eficiente.

¿Qué mejoras hay en seguridad con estos modelos?

Ambos modelos fueron entrenados para rechazar solicitudes peligrosas, con filtros reforzados y un sistema de monitoreo que detecta riesgos en tiempo real.

¿Qué es Codex CLI y cómo se relaciona con estos modelos?

Codex CLI es una herramienta de línea de comandos que permite usar los modelos para programación avanzada desde tu propio ordenador, facilitando tareas técnicas con interacción directa.