Qwen2.5-Coder: Nuevo estándar en LLMs de código

Hoy se ha anunciado la apertura de la serie Qwen2.5-Coder, una gama de modelos de código abierto con capacidades poderosas, diversas y prácticas para el desarrollo de LLMs especializados en código.

Poderoso: El modelo Qwen2.5-Coder-32B-Instruct es ahora el modelo de código abierto líder en el sector, igualando las habilidades de GPT-4o en generación y reparación de código, con solidez en tareas de razonamiento y matemáticas. Destaca en los principales benchmarks de generación de código, como EvalPlus y LiveCodeBench, demostrando ser una herramienta robusta para desarrolladores que buscan soporte en múltiples lenguajes.

Qwen 2.5 Coder

Diverso: Con esta versión, Qwen2.5-Coder amplía sus opciones con seis tamaños de modelo (0.5B a 32B), lo que lo convierte en una opción adaptable a diversas necesidades y recursos. Esto permite a los desarrolladores elegir modelos que se ajusten a sus requerimientos, ya sea en entornos de prueba o en aplicaciones más complejas.

Práctico: Qwen2.5-Coder muestra su utilidad en entornos reales, especialmente como asistente de código y en la generación de artefactos. Su rendimiento en tareas de reparación de código es sobresaliente, obteniendo una puntuación de 73.7 en el benchmark Aider, casi al nivel de GPT-4o, y con soporte para más de 40 lenguajes de programación, superando a otros modelos en evaluación multilenguaje con una puntuación de 75.2 en MdEval.

En términos de alineación con preferencias humanas, Qwen2.5-Coder ha sido evaluado en la plataforma interna Code Arena, donde su alineación de respuestas con expectativas humanas ha destacado al compararse con GPT-4o. Esto respalda su utilidad como asistente de programación confiable, tanto en la generación de nuevo código como en la adaptación de fragmentos existentes.

Variadas opciones de tamaño de modelo: La disponibilidad de tamaños de 0.5B, 1.5B, 3B, 7B, 14B y 32B permite que Qwen2.5-Coder se utilice en entornos con distintos recursos. En evaluaciones internas, se ha demostrado una correlación positiva entre el tamaño del modelo y su rendimiento, posicionando a Qwen2.5-Coder como uno de los modelos más adaptables y competitivos en código abierto.

ModelsParamsNon-Emb ParamsLayersContext LengthLicense
Qwen2.5-Coder-0.5B0.49B0.36B2432KApache 2.0
Qwen2.5-Coder-1.5B1.54B1.31B2832KApache 2.0
Qwen2.5-Coder-3B3.09B2.77B3632KQwen Research
Qwen2.5-Coder-7B7.61B6.53B28128KApache 2.0
Qwen2.5-Coder-14B14.7B13.1B48128KApache 2.0
Qwen2.5-Coder-32B32.5B31.0B64128KApache 2.0

Entornos prácticos: Cursor y Artifacts: Qwen2.5-Coder se ha optimizado para funcionar como asistente de código en la plataforma Cursor y para la generación de artifacts o proyectos visuales, como simulaciones complejas. Además, estará disponible próximamente en la web oficial de Tongyi, permitiendo la creación de sitios web, mini-juegos y gráficos de datos con un solo clic.

Licencias y disponibilidad: Los modelos de Qwen2.5-Coder están disponibles bajo licencias Apache 2.0 y Qwen-Research (para el modelo 3B), garantizando acceso abierto y uso adaptativo para la comunidad.

Planes a futuro: El equipo de Qwen-Coder continuará desarrollando modelos enfocados en el razonamiento y alineación con preferencias humanas, buscando proporcionar herramientas más potentes para desarrolladores de todo el mundo.

Preguntas y Respuestas sobre Qwen2.5-Coder

¿Qué es Qwen2.5-Coder?

Qwen2.5-Coder es un modelo de lenguaje especializado en programación de código abierto, desarrollado para brindar soporte en generación y reparación de código en múltiples lenguajes.

¿Qué capacidades tiene Qwen2.5-Coder-32B?

Qwen2.5-Coder-32B posee capacidades avanzadas en generación, reparación y razonamiento de código, con rendimientos comparables a los de GPT-4o.

¿Cuántos tamaños de modelo ofrece Qwen2.5-Coder?

Ofrece seis tamaños de modelo (0.5B a 32B), adaptándose a distintos recursos y necesidades de los desarrolladores.

¿Dónde se puede utilizar Qwen2.5-Coder?

Puede usarse como asistente de código en la plataforma Cursor y en la generación de artefactos visuales en aplicaciones como Open WebUI y Tongyi.