Empresa Alibaba asegura que su nuevo modelo de IA supera a DeepSeek

Los días revueltos en el mundo de la tecnología y la inteligencia artificial no parecen tener para cuándo parar. Sigue en la mira DeepSeek bajo miles de miradas y de interrogantes, y ahora la competencia de la propia app continuará en China, con el anuncio de Alibaba, conocido como el Amazon chino, que lanzó una nueva versión de su IA Qwen, con un modelo de lenguaje más avanzado: Qwen2.5-Max.
Así, Alibaba se suma a la carrera por superar a DeepSeek en su propio país. Qwen2.5-Max es una alternativa preentrenada con 20 billones de tokens y mejorada mediante técnicas de fine-tuning supervisado (SFT) y aprendizaje por refuerzo a partir de comentarios humanos (RLHF).
Lee además: Consecuencias de los ataques cibernéticos a DeepSeek: suspenden temporalmente el registro de nuevos usuarios
Según el medio Xataka, al igual que GPT-4 y DeepSeek, Qwen2.5-Max utiliza una arquitectura Mixture of Experts (MoE), que optimiza los recursos al activar únicamente las partes necesarias del modelo, los llamados “expertos”. Indican que este es diseñado para destacar en tareas como la programación y conversaciones, pero lo más interesante es que supera en varios benchmarks a rivales como DeepSeek V3 y Llama 3.1.
Recomendamos: Todo sobre DeepSeek, la alternativa china que compite con OpenAI
Este chatbot de Alibaba cuenta con funciones como búsqueda web, artifacts, y generación de imágenes y vídeos, además, es capaz de analizar imágenes y documentos, y también funciona en español.
La presentación de Qwen 2.5-Max, se realizó en un momento inusual, fue el primer día del Año Nuevo Lunar, cuando la mayoría de los chinos no trabajan y están con sus familias, pero esto, sugieren medios internacionales, apunta a la presión que el meteórico ascenso de la empresa china de inteligencia artificial DeepSeek en las últimas tres semanas ha ejercido no sólo sobre sus rivales extranjeros, sino también sobre su competencia nacional.
(Foto tomada de Clarín)