Qwen2.5-Coder: Nuevo estándar en LLMs de código
Hoy se ha anunciado la apertura de la serie Qwen2.5-Coder, una gama de modelos de código abierto con capacidades poderosas, diversas y prácticas para el desarrollo de LLMs especializados en código.
Poderoso: El modelo Qwen2.5-Coder-32B-Instruct es ahora el modelo de código abierto líder en el sector, igualando las habilidades de GPT-4o en generación y reparación de código, con solidez en tareas de razonamiento y matemáticas. Destaca en los principales benchmarks de generación de código, como EvalPlus y LiveCodeBench, demostrando ser una herramienta robusta para desarrolladores que buscan soporte en múltiples lenguajes.
Diverso: Con esta versión, Qwen2.5-Coder amplía sus opciones con seis tamaños de modelo (0.5B a 32B), lo que lo convierte en una opción adaptable a diversas necesidades y recursos. Esto permite a los desarrolladores elegir modelos que se ajusten a sus requerimientos, ya sea en entornos de prueba o en aplicaciones más complejas.
Práctico: Qwen2.5-Coder muestra su utilidad en entornos reales, especialmente como asistente de código y en la generación de artefactos. Su rendimiento en tareas de reparación de código es sobresaliente, obteniendo una puntuación de 73.7 en el benchmark Aider, casi al nivel de GPT-4o, y con soporte para más de 40 lenguajes de programación, superando a otros modelos en evaluación multilenguaje con una puntuación de 75.2 en MdEval.
En términos de alineación con preferencias humanas, Qwen2.5-Coder ha sido evaluado en la plataforma interna Code Arena, donde su alineación de respuestas con expectativas humanas ha destacado al compararse con GPT-4o. Esto respalda su utilidad como asistente de programación confiable, tanto en la generación de nuevo código como en la adaptación de fragmentos existentes.
Variadas opciones de tamaño de modelo: La disponibilidad de tamaños de 0.5B, 1.5B, 3B, 7B, 14B y 32B permite que Qwen2.5-Coder se utilice en entornos con distintos recursos. En evaluaciones internas, se ha demostrado una correlación positiva entre el tamaño del modelo y su rendimiento, posicionando a Qwen2.5-Coder como uno de los modelos más adaptables y competitivos en código abierto.
Models | Params | Non-Emb Params | Layers | Context Length | License |
---|---|---|---|---|---|
Qwen2.5-Coder-0.5B | 0.49B | 0.36B | 24 | 32K | Apache 2.0 |
Qwen2.5-Coder-1.5B | 1.54B | 1.31B | 28 | 32K | Apache 2.0 |
Qwen2.5-Coder-3B | 3.09B | 2.77B | 36 | 32K | Qwen Research |
Qwen2.5-Coder-7B | 7.61B | 6.53B | 28 | 128K | Apache 2.0 |
Qwen2.5-Coder-14B | 14.7B | 13.1B | 48 | 128K | Apache 2.0 |
Qwen2.5-Coder-32B | 32.5B | 31.0B | 64 | 128K | Apache 2.0 |
Entornos prácticos: Cursor y Artifacts: Qwen2.5-Coder se ha optimizado para funcionar como asistente de código en la plataforma Cursor y para la generación de artifacts o proyectos visuales, como simulaciones complejas. Además, estará disponible próximamente en la web oficial de Tongyi, permitiendo la creación de sitios web, mini-juegos y gráficos de datos con un solo clic.
Licencias y disponibilidad: Los modelos de Qwen2.5-Coder están disponibles bajo licencias Apache 2.0 y Qwen-Research (para el modelo 3B), garantizando acceso abierto y uso adaptativo para la comunidad.
Planes a futuro: El equipo de Qwen-Coder continuará desarrollando modelos enfocados en el razonamiento y alineación con preferencias humanas, buscando proporcionar herramientas más potentes para desarrolladores de todo el mundo.
Preguntas y Respuestas sobre Qwen2.5-Coder
¿Qué es Qwen2.5-Coder?
Qwen2.5-Coder es un modelo de lenguaje especializado en programación de código abierto, desarrollado para brindar soporte en generación y reparación de código en múltiples lenguajes.
¿Qué capacidades tiene Qwen2.5-Coder-32B?
Qwen2.5-Coder-32B posee capacidades avanzadas en generación, reparación y razonamiento de código, con rendimientos comparables a los de GPT-4o.
¿Cuántos tamaños de modelo ofrece Qwen2.5-Coder?
Ofrece seis tamaños de modelo (0.5B a 32B), adaptándose a distintos recursos y necesidades de los desarrolladores.
¿Dónde se puede utilizar Qwen2.5-Coder?
Puede usarse como asistente de código en la plataforma Cursor y en la generación de artefactos visuales en aplicaciones como Open WebUI y Tongyi.