Qwen2.5-Coder: Nuevo estándar en LLMs de código

13 de noviembre de 20241776 Views

Hoy se ha anunciado la apertura de la serie Qwen2.5-Coder, una gama de modelos de código abierto con capacidades poderosas, diversas y prácticas para el desarrollo de LLMs especializados en código.

Poderoso: El modelo Qwen2.5-Coder-32B-Instruct es ahora el modelo de código abierto líder en el sector, igualando las habilidades de GPT-4o en generación y reparación de código, con solidez en tareas de razonamiento y matemáticas. Destaca en los principales benchmarks de generación de código, como EvalPlus y LiveCodeBench, demostrando ser una herramienta robusta para desarrolladores que buscan soporte en múltiples lenguajes.

Diverso: Con esta versión, Qwen2.5-Coder amplía sus opciones con seis tamaños de modelo (0.5B a 32B), lo que lo convierte en una opción adaptable a diversas necesidades y recursos. Esto permite a los desarrolladores elegir modelos que se ajusten a sus requerimientos, ya sea en entornos de prueba o en aplicaciones más complejas.

Práctico: Qwen2.5-Coder muestra su utilidad en entornos reales, especialmente como asistente de código y en la generación de artefactos. Su rendimiento en tareas de reparación de código es sobresaliente, obteniendo una puntuación de 73.7 en el benchmark Aider, casi al nivel de GPT-4o, y con soporte para más de 40 lenguajes de programación, superando a otros modelos en evaluación multilenguaje con una puntuación de 75.2 en MdEval.

En términos de alineación con preferencias humanas, Qwen2.5-Coder ha sido evaluado en la plataforma interna Code Arena, donde su alineación de respuestas con expectativas humanas ha destacado al compararse con GPT-4o. Esto respalda su utilidad como asistente de programación confiable, tanto en la generación de nuevo código como en la adaptación de fragmentos existentes.

Variadas opciones de tamaño de modelo: La disponibilidad de tamaños de 0.5B, 1.5B, 3B, 7B, 14B y 32B permite que Qwen2.5-Coder se utilice en entornos con distintos recursos. En evaluaciones internas, se ha demostrado una correlación positiva entre el tamaño del modelo y su rendimiento, posicionando a Qwen2.5-Coder como uno de los modelos más adaptables y competitivos en código abierto.

Models	Params	Non-Emb Params	Layers	Context Length	License
Qwen2.5-Coder-0.5B	0.49B	0.36B	24	32K	Apache 2.0
Qwen2.5-Coder-1.5B	1.54B	1.31B	28	32K	Apache 2.0
Qwen2.5-Coder-3B	3.09B	2.77B	36	32K	Qwen Research
Qwen2.5-Coder-7B	7.61B	6.53B	28	128K	Apache 2.0
Qwen2.5-Coder-14B	14.7B	13.1B	48	128K	Apache 2.0
Qwen2.5-Coder-32B	32.5B	31.0B	64	128K	Apache 2.0

Entornos prácticos: Cursor y Artifacts: Qwen2.5-Coder se ha optimizado para funcionar como asistente de código en la plataforma Cursor y para la generación de artifacts o proyectos visuales, como simulaciones complejas. Además, estará disponible próximamente en la web oficial de Tongyi, permitiendo la creación de sitios web, mini-juegos y gráficos de datos con un solo clic.

Licencias y disponibilidad: Los modelos de Qwen2.5-Coder están disponibles bajo licencias Apache 2.0 y Qwen-Research (para el modelo 3B), garantizando acceso abierto y uso adaptativo para la comunidad.

Planes a futuro: El equipo de Qwen-Coder continuará desarrollando modelos enfocados en el razonamiento y alineación con preferencias humanas, buscando proporcionar herramientas más potentes para desarrolladores de todo el mundo.

Preguntas y Respuestas sobre Qwen2.5-Coder

¿Qué es Qwen2.5-Coder?

Qwen2.5-Coder es un modelo de lenguaje especializado en programación de código abierto, desarrollado para brindar soporte en generación y reparación de código en múltiples lenguajes.