Lanzamiento de GPT‑4.1 con mejoras clave

22 de abril de 2025911 Views

El 14 de abril de 2025, OpenAI presentó oficialmente su nueva serie de modelos de lenguaje: GPT‑4.1, GPT‑4.1 mini y GPT‑4.1 nano. Estas versiones mejoradas representan un gran avance respecto a los modelos anteriores, destacando por su capacidad para codificar, seguir instrucciones y comprender contextos extensos de hasta un millón de tokens.

Mejoras clave en codificación

GPT‑4.1 se posiciona como uno de los modelos más sólidos para tareas de programación. En pruebas como SWE-bench Verified, alcanza una tasa de éxito del 54.6 %, superando notablemente a GPT‑4o (33.2 %) y GPT‑4.5 (38 %). También sobresale en la producción de diffs más precisos y eficientes, siguiendo formatos específicos para ahorrar tiempo y recursos.

Además, su rendimiento en el benchmark Aider polyglot lo ubica como líder en edición de código, ya que puede realizar cambios mínimos sin reescribir archivos completos, algo fundamental en proyectos de gran escala.

Seguimiento de instrucciones más fiable

Otro aspecto destacado es la mejora en la comprensión y ejecución de instrucciones complejas. En el benchmark MultiChallenge, GPT‑4.1 logró un 38 %, frente al 28 % de GPT‑4o. También obtuvo un 87 % en IFEval, lo que demuestra su precisión al seguir indicaciones específicas, evitar errores y adaptarse a formatos diversos.

Esta fiabilidad convierte al modelo en una herramienta ideal para agentes inteligentes que automatizan tareas complejas, desde la atención al cliente hasta el análisis legal o financiero.

Contexto largo: Hasta 1 millón de tokens

La familia GPT‑4.1 puede procesar y razonar con volúmenes enormes de información gracias a su capacidad de contexto extendido. Esta función resulta esencial en sectores como derecho, ingeniería o análisis de datos. En pruebas como OpenAI-MRCR y Graphwalks, el modelo demostró su habilidad para identificar información relevante, incluso si está dispersa o rodeada de datos distractores.

Rendimiento visual mejorado

GPT‑4.1 y sus variantes también han mejorado en tareas visuales. En pruebas como MMMU y MathVista, superaron a GPT‑4o con una mayor precisión al interpretar gráficos, diagramas y problemas matemáticos visuales. Estas capacidades amplían su utilidad en educación, ciencia y análisis técnico.

Latencia y costos reducidos

Además de ser más potente, GPT‑4.1 es más económico. Gracias a mejoras en infraestructura, los tiempos de respuesta se han reducido significativamente, especialmente en los modelos mini y nano. GPT‑4.1 mini ofrece un rendimiento comparable al de modelos más grandes, pero con un 83 % menos de coste y casi el doble de velocidad.

Aplicaciones reales

Empresas como Blue J, Carlyle y Thomson Reuters ya están utilizando GPT‑4.1 en producción. Estas organizaciones destacan una mayor precisión, menor repetición de errores y mayor agilidad en flujos de trabajo complejos. La mejora en eficiencia y calidad de respuesta impulsa la adopción del modelo en entornos exigentes.

Preguntas y respuestas

¿Qué diferencia a GPT‑4.1 de GPT‑4o?

GPT‑4.1 supera a GPT‑4o en codificación, seguimiento de instrucciones y comprensión de contextos largos. También ofrece menor latencia y mayor eficiencia.

¿Cuál es la ventaja de los modelos mini y nano?

Los modelos mini y nano ofrecen un rendimiento similar o superior con menor coste y mayor velocidad, ideales para tareas rápidas o con recursos limitados.

¿Qué sectores se benefician más de GPT‑4.1?

Sectores como desarrollo de software, derecho, finanzas y atención al cliente pueden aprovechar sus mejoras en comprensión, precisión y velocidad.

¿Estará GPT‑4.1 disponible en ChatGPT?

No directamente. GPT‑4.1 estará disponible solo en la API. Sin embargo, algunas de sus mejoras ya se han integrado en la última versión de GPT‑4o para ChatGPT.

Más informació