OpenAI lanza nuevos modelos IA código abierto GPT-OSS
En un movimiento inesperado que ha captado la atención de toda la comunidad tecnológica, OpenAI ha presentado sus primeros modelos de «código abierto» desde el ya lejano GPT-2 en 2019. El lanzamiento de GPT-OSS 120B y GPT-OSS 20B marca un hito crucial, reposicionando a la compañía como un actor relevante en el ecosistema de la inteligencia artificial de peso abierto. Este paso la sitúa en competencia directa con gigantes como Meta (con su serie LLaMA) y destacados laboratorios chinos como DeepSeek. Estos nuevos modelos, distribuidos bajo la permisiva licencia Apache 2.0, están especialmente diseñados para tareas de razonamiento complejo, programación y el uso de herramientas, poniendo un fuerte énfasis en la eficiencia y la seguridad.
Características y Eficiencia de los Modelos GPT-OSS
Los modelos GPT-OSS se distinguen por su innovadora arquitectura Mixture-of-Experts (MoE), optimizada para ofrecer un alto rendimiento con una eficiencia sin precedentes. El modelo GPT-OSS 120B, aunque cuenta con 120 mil millones de parámetros, solo activa aproximadamente 5,1 mil millones en cada proceso, lo que reduce drásticamente el consumo de recursos. Esta optimización, junto con la técnica de cuantización MXFP4, permite que este modelo se ejecute en una sola GPU de 80 GB como la Nvidia H100, algo que antes era impensable para modelos de este tamaño.
Por otro lado, el modelo más pequeño, GPT-OSS 20B, es igual de impresionante en términos de accesibilidad. Este modelo utiliza 21 mil millones de parámetros, activando 3,6 mil millones de ellos. Gracias a esta eficiencia, puede funcionar en dispositivos de consumo como una tarjeta gráfica RTX 4090 o incluso en un ordenador portátil, haciéndolo accesible para una base de usuarios mucho más amplia. Ambos modelos incorporan la tecnología de razonamiento Chain of Thought (CoT), una característica ya conocida en los modelos O1 de OpenAI, que les permite descomponer problemas complejos para ofrecer soluciones más precisas y lógicas en campos como las matemáticas o la programación. Además, ofrecen la capacidad de ajustar el nivel de complejidad del razonamiento y soportan un contexto de hasta 128.000 tokens.
gpt-oss-120b | gpt-oss-20b | OpenAI o3 | OpenAI o4-mini | |
Razonamiento y conocimiento | ||||
MMLU | 90 | 85,3 | 93,4 | 93 |
GPQA Diamond | 80,9 | 74,2 | 77 | 81,4 |
El último examen de la humanidad | 19 | 17,3 | 24,9 | 17,7 |
Matemáticas de competición | ||||
AIME 2024 | 96,6 | 96 | 91,6 | 93,4 |
AIME 2025 | 97,9 | 98,7 | 88,9 | 92,7 |
Licencia y Accesibilidad para el Ecosistema
Uno de los aspectos más significativos de este lanzamiento es la elección de la licencia Apache 2.0, considerada una de las más permisivas del sector. Esta licencia no solo permite el uso gratuito de los modelos, sino que también autoriza a las empresas a monetizar sus productos sin requerir pagos adicionales ni permisos de OpenAI. La disponibilidad de estos modelos a través de plataformas como Hugging Face y GitHub simplifica su adopción, facilitando su instalación local con herramientas como Ollama y LM Studio. A pesar de esta apertura, OpenAI ha decidido no divulgar los datos utilizados para el entrenamiento, una medida preventiva ante el creciente número de litigios por derechos de autor que afectan a los desarrolladores de IA. Este enfoque permite a OpenAI fomentar la innovación en la comunidad sin exponerse a riesgos legales innecesarios.
Rendimiento y Casos de Uso
El rendimiento de los modelos ha sido rigurosamente evaluado. El GPT-OSS 120B muestra un desempeño comparable al modelo propietario O-Mini en tareas de razonamiento. Destaca especialmente en el benchmark de matemáticas AE 2025, donde logra una precisión del 97,9%, superando a varios modelos cerrados. En competiciones de programación como Code Forces, alcanza un nivel de ELO de 2622, lo que lo equipara a un programador competitivo avanzado. Sin embargo, en la prueba de «Humanity’s Last Exam» (HLE), diseñada para medir habilidades de IA de alto riesgo, su rendimiento es notablemente inferior al de los modelos más avanzados de OpenAI, como O3 y O4-mini, con una precisión del 19%. Este resultado sugiere que, aunque potente, aún no se encuentra al mismo nivel que las versiones más sofisticadas y cerradas de la compañía.
El modelo GPT-OSS 20B, por su parte, demuestra un excelente desempeño en conocimiento general y tareas especializadas como «Health Bench Hard». Ambos modelos, a pesar de sus altas capacidades, presentan una tasa de «alucinación» superior a la de sus equivalentes cerrados, lo que se atribuye a su menor cantidad de parámetros activos. Estos modelos están optimizados para una amplia gama de aplicaciones, desde la creación de asistentes inteligentes que funcionan de manera local y con total privacidad, hasta ser copilotos de programación para desarrolladores. También son idóneos para tareas complejas de generación de texto y análisis lógico, permitiendo a empresas e individuos integrar IA avanzada en sus operaciones sin depender de servicios en la nube.
Preguntas y Respuestas sobre GPT-OSS
¿Qué es GPT-OSS y por qué es importante su lanzamiento?
GPT-OSS es la primera serie de modelos de inteligencia artificial de «peso abierto» que OpenAI ha lanzado desde 2019. Su lanzamiento es crucial porque marca el regreso de OpenAI al ecosistema de código abierto, compitiendo directamente con otras empresas y fomentando la innovación y la accesibilidad de la IA para desarrolladores y empresas de todo el mundo.
¿Qué hace a los modelos GPT-OSS tan eficientes?
La eficiencia de los modelos GPT-OSS se debe a su arquitectura Mixture-of-Experts (MoE), que permite que solo una fracción de sus parámetros se active en cada operación. Además, la técnica de cuantización MXFP4 reduce significativamente el uso de memoria, haciendo posible ejecutar el modelo más grande en una sola GPU y el más pequeño en hardware de consumo.
¿Para qué tipo de tareas son más adecuados los modelos GPT-OSS?
Los modelos están optimizados para una variedad de tareas que incluyen razonamiento complejo, codificación y uso de herramientas. Son ideales para la creación de asistentes inteligentes locales, copilotos de programación avanzados y el desarrollo de aplicaciones que requieren un alto nivel de privacidad, ya que pueden funcionar sin necesidad de enviar datos a la nube.
¿Cuál es la principal diferencia entre los modelos GPT-OSS y los modelos propietarios de OpenAI?
La principal diferencia radica en su accesibilidad y rendimiento. Los modelos GPT-OSS son de código abierto y gratuitos, mientras que los propietarios (como O3 y O4-mini) son de acceso restringido y de pago. Aunque los modelos GPT-OSS son muy potentes, su rendimiento en algunas pruebas, especialmente en aquellas de «frontera» como el HLE, aún no iguala el de los modelos cerrados más avanzados de OpenAI.