Llama 4: La nueva colección de modelos de IA de Meta

Llama 4: La nueva colección de modelos de IA de Meta

Meta ha anunciado el lanzamiento de su nueva colección de modelos de inteligencia artificial. Su nombre es Llama 4 y promete traer capacidades al nivel de GPT-4o, de OpenAI, Gemini 2.0 Flash, de Google, y DeepSeek-V3.

 

Desde su lanzamiento en 2023, Meta ha introducido actualizaciones progresivas en su línea de modelos Llama, incluyendo Llama 2 y Llama 3.1, con mejoras en eficiencia, capacidad de contexto y soporte multilingüe. 

 

Recomendamos: Según Marck Zuckerberg las gafas inteligentes triunfarán sobre los smartphones

 

Esta nueva generación, desarrollada bajo la dirección de Mark Zuckerberg, optimiza la arquitectura de versiones anteriores e incorpora mejoras en el procesamiento de lenguaje natural, así como en la capacidad de interpretar texto e imágenes de forma integrada. Además, mantiene la compatibilidad con el ecosistema Llama, facilitando su implementación en desarrollos personalizados por parte de empresas y desarrolladores.

 

Llama 4, la colección de modelos

 

Inicialmente, presentaron Llama 4 Scout, el cual, según Meta, “es el mejor modelo multimodal del mundo en su categoría y supera a todas las generaciones anteriores de Llama”. Está compuesto por un sistema basado en “mezcla de expertos”, que integra 16 submodelos especializados en diversas tareas, temáticas y formatos multimedia que se activan según las solicitudes del usuario.

 

De acuerdo con los desarrolladores, Llama 4 Scout supera a Gemma 3, Gemini 2.0 Flash-Lite y Mistral 3.1 en tareas como el análisis profundo de datos, revisiones extensas de código, generación de resúmenes complejos y evaluación legal de documentos extensos.

 

Te podría interesar: OpenAI rompe récord: logra la mayor financiación de una start-up con 40.000 millones de dólares

 

Luego está Llama 4 Maverick, que es el primer modelo de la serie que incorpora capacidades multimodales de manera nativa, es decir, ha sido entrenado simultáneamente con texto, imágenes y video sin necesidad de etiquetado previo. Su estructura cuenta con 128 expertos, lo que le permite alcanzar un total de 400,000 millones de parámetros, manteniendo activos 17,000 millones por token

 

Todo eso lo posiciona como un competidor de alto nivel, capaz de igualar los resultados de DeepSeek V3 y superar a GPT-4o, Gemini 2.0 y Claude 3 Opus en tareas de razonamiento, codificación y comprensión de contenido visual y textual. Según Meta, “Llama 4 Maverick es ideal para la interpretación precisa de imágenes y la escritura creativa”.

 

En tercer lugar, Meta presentó Llama 4 Behemoth, el cual fue descrito como “el modelo más avanzado de la compañía y uno de los grandes modelos de lenguaje más inteligentes del mundo”. 

 

Behemoth está aun en desarrollo y no está disponible públicamente. Este modelo se emplea principalmente para mejorar la calidad de los sistemas más pequeños mediante técnicas de co-destilación. Meta lo considera clave para avanzar hacia agentes de IA más versátiles y autónomos. Según sus pruebas internas, Behemoth supera a GPT-4.5, Claude Sonnet 3.7 y Gemini 2.0 Pro en múltiples evaluaciones relacionadas con las disciplinas STEM (ciencia, tecnología, ingeniería y matemáticas, por sus siglas en inglés).

 

Lo novedoso

 

Especialistas destacan como una de las características más notables de esta nueva generación la implementación de la técnica de entrenamiento llamada MetaP, diseñada para facilitar la transferencia eficiente de hiperparámetros entre modelos de distintos tamaños. 

 

Esta metodología optimiza el proceso de entrenamiento, especialmente en modelos a gran escala como Behemoth, que requieren grandes volúmenes de datos y recursos computacionales. Además, permite definir y aplicar comportamientos deseados en diferentes versiones del modelo. Junto a esto, Meta ha incorporado un post-entrenamiento personalizado que refuerza el razonamiento mediante estrategias avanzadas de selección de datos y métricas de evaluación específicas.

 

Los modelos Llama 4 Maverick y Scout ya están disponibles para descarga a través del sitio web oficial de Meta y la plataforma Hugging Face. Próximamente se integrarán a las principales infraestructuras de nube, soluciones de edge computing y servicios ofrecidos por integradores globales. El público general podrá experimentar sus capacidades mediante Meta AI, el asistente inteligente de la empresa accesible en WhatsApp, Facebook, Instagram y Messenger.

 

(Con información de Wired y El Espectador)

 

Artículos relacionados

Registrate para tener acceso a todos nuestros servicios