Qwen 2.5 de Alibaba es el mejor modelo de código abierto en matemáticas y codificación

Alibaba lanzó más de 100 modelos de IA de código abierto, incluido Qwen 2.5 72B, que supera a otros modelos de código abierto en pruebas comparativas de matemáticas y codificación.

Gran parte de la atención de la industria de la IA en los modelos de código abierto se ha centrado en los esfuerzos de Meta con Llama 3, pero Qwen 2.5 de Alibaba ha cerrado la brecha significativamente. La familia de modelos Qwen 2.5 recién lanzada tiene un tamaño que oscila entre 0,5 y 72 mil millones de parámetros con modelos base generalizados, así como modelos centrados en tareas muy específicas.

Alibaba dice que estos modelos vienen con “conocimientos mejorados y capacidades más sólidas en matemáticas y codificación” con modelos especializados centrados en codificación, matemáticas y múltiples modalidades que incluyen lenguaje, audio y visión.

Alibaba Cloud también anunció una actualización de su modelo insignia patentado Qwen-Max, que no ha lanzado como código abierto. Los puntos de referencia del Qwen 2.5 Max se ven bien, pero es el modelo Qwen 2.5 72B el que ha generado la mayor parte del entusiasmo entre los fanáticos del código abierto.

Qwen 2.5 72B instruye a los modelos en matemáticas y puntos de referencia de codificación. Fuente: Nube de Alibaba

Los puntos de referencia muestran que Qwen 2.5 72B vence al modelo insignia Llama 3.1 405B, mucho más grande de Meta, en varios frentes, especialmente en matemáticas y codificación. La brecha entre los modelos de código abierto y los propietarios como los de OpenAI y Google también se está cerrando rápidamente.

Los primeros usuarios de Qwen 2.5 72B muestran que el modelo está muy por debajo del Sonnet 3.5 e incluso superando AbiertoAIModelos o1 en codificación.

Qwen 2.5 de código abierto supera a los modelos o1 en codificación 🤯🤯
Qwen 2.5 obtiene puntuaciones más altas que los modelos o1 en codificación en Livebench AI
Qwen está justo debajo de Sonnet 3.5, y para un modo de código abierto, ¡eso es increíble!
o1 es bueno en algo de codificación pero terrible en problemas de finalización de código y… pic.twitter.com/iazam61eP9
– Bindu Reddy (@bindureddy) 20 de septiembre de 2024

Alibaba dice que todos estos nuevos modelos fueron entrenados en su conjunto de datos a gran escala que abarca hasta 18 billones de tokens. Los modelos Qwen 2.5 vienen con una ventana de contexto de hasta 128k y pueden generar salidas de hasta 8k tokens.

LEER Repensar las leyes de escala en el desarrollo de la IA

El paso a modelos gratuitos más pequeños, más capaces y de código abierto probablemente tendrá un impacto más amplio en muchos usuarios que los modelos más avanzados como o1. Las capacidades perimetrales y en el dispositivo de estos modelos significan que puede sacar mucho provecho de un modelo gratuito que se ejecuta en su computadora portátil.

El modelo Qwen 2.5 más pequeño ofrece codificación de nivel GPT-4 por una fracción del costo, o incluso gratis si tiene una computadora portátil decente para ejecutarla localmente.

¡Tenemos GPT-4 para codificar en casa! miré hacia arriba OpenAI?ref_src=twsrc%5Etfw”>@AbiertoAI Resultados de GPT-4 0613 para varios puntos de referencia y los comparó con @Alibaba_Qwen Codificador 2,5 7B. 👀
> 15 meses después del lanzamiento de GPT-0613, tenemos un LLM abierto bajo Apache 2.0, que funciona igual de bien. 🤯
> Precios de GPT-4… pic.twitter.com/2szw5kwTe5
—Philipp Schmid (@_philschmid) 22 de septiembre de 2024

Además de los LLM, Alibaba lanzó una actualización importante de su modelo de lenguaje de visión con la introducción de Qwen2-VL. Qwen2-VL puede comprender videos que duran más de 20 minutos y admite respuestas a preguntas basadas en videos.

Está diseñado para integrarse en teléfonos móviles, automóviles y robots para permitir la automatización de operaciones que requieren comprensión visual.

Alibaba también presentó un nuevo modelo de texto a video como parte de su generador de imágenes, la gran familia de modelos Tongyi Wanxiang. Tongyi Wanxiang AI Video puede producir contenido de vídeo de calidad cinematográfica y animación 3D con varios estilos artísticos basados en indicaciones de texto.

Las demostraciones parecen impresionantes y la herramienta es de uso gratuito, aunque necesitarás un número de móvil chino para registrarte aquí. Sora tendrá una competencia seria cuando OpenAI finalmente lo lance, o si lo hace.

LEER El marco de inferencia de Microsoft lleva modelos de lenguaje grande de 1 bit a dispositivos locales

Qwen 2.5 de Alibaba es el mejor modelo de código abierto en matemáticas y codificación

Últimas noticias

Valve está creando un nuevo controlador Steam para juegos de PC, más uno para realidad virtual, según una filtración

Vivo Y300 lanzado en India con cámara Aura Light y funciones de IA: consultar precio y especificaciones

Los 10 casos de uso de PAM más impactantes para mejorar la seguridad organizacional

La herramienta OSS-Fuzz impulsada por IA de Google encuentra 26 vulnerabilidades en proyectos de código abierto

Mejor servicio VPN 2024

Selección del editor

¿Buscas conseguir una buena oferta en tu nueva compra de MacBook? Estas son las mejores opciones

Las mejores ofertas de disipadores de CPU antes del Black Friday 2024

Los supuestos esquemas del Apple Watch Series 10 muestran una pantalla más grande de 2 pulgadas y un sistema de fijación de banda sin cambios

Se filtró la fecha de lanzamiento global de Vivo X200, X200 Pro: aquí es cuando puede debutar la nueva generación

Síguenos en las redes sociales