Una guía rápida para comprender qué ofrece Llama, la IA de Meta

Portada | Ciencia y tecnología

Foto: Sergio F Cara (NotiPress/Composición)

En el competitivo mundo de la inteligencia artificial (IA), Meta lanzó una herramienta revolucionaria que promete transformar la manera donde los desarrolladores interactúan con la tecnología generativa. Llama, el nuevo modelo de IA de Meta, se destaca por su naturaleza "abierta", permitiendo a los usuarios explorar y personalizar sus capacidades de una forma poco común entre otros modelos líderes en el mercado. A diferencia de sus competidores, que suelen estar disponibles solo a través de APIs cerradas, Llama ofrece un acceso más flexible y adaptable, abriendo nuevas oportunidades para innovar en aplicaciones basadas en IA.

Asimismo, a diferencia de otros modelos como Claude de Anthropic, GPT-4 de OpenAI y Gemini de Google, que solo se accede a través de APIs, Llama ofrece más flexibilidad en su uso. Para ampliar su accesibilidad, Meta colaboró con proveedores de servicios en la nube como AWS, Google Cloud y Microsoft Azure, que ofrecen versiones de Llama alojadas en sus plataformas.

Por otro lado, Meta lanzó herramientas diseñadas para facilitar la personalización y el ajuste del modelo. Llama no es un único modelo, sino una familia que incluye Llama 8B, Llama 70B y Llama 405B. Las versiones más recientes, Llama 3.1 8B, Llama 3.1 70B y Llama 3.1 405B, fueron lanzadas en julio de 2024. Estos modelos se entrenaron utilizando una variedad de datos, como páginas web en diferentes idiomas, código abierto y datos generados por otros modelos de IA.

Llama 3.1 8B y Llama 3.1 70B están diseñados para funcionar en una amplia gama de dispositivos, mientras Llama 3.1 405B, por su tamaño, requiere hardware especializado de centro de datos. Aunque los modelos 8B y 70B son más rápidos, el 405B ofrece una mayor capacidad. También puede realizar una variedad de tareas como codificación, resolución de problemas matemáticos básicos y resumen de documentos en ocho idiomas: inglés, alemán, francés, italiano, portugués, hindi, español y tailandés.

Pese a que no puede procesar o generar imágenes en su configuración actual, este aspecto podría cambiar en el futuro. Los modelos están preparados para interactuar con herramientas y APIs de terceros, como Brave Search para obtener información actualizada, Wolfram Alpha para consultas matemáticas y científicas, y un intérprete de Python para validar código. Meta también asegura que Llama 3.1 puede integrar herramientas nuevas y no vistas anteriormente, aunque la confiabilidad de esta integración aún está en evaluación.

Esta nueva herramienta está integrada en varias plataformas como Facebook Messenger, WhatsApp, Instagram y Oculus. Los desarrolladores pueden descargar y adaptar el modelo en plataformas de nube populares, con más de 25 socios de Meta que lo alojan, incluyendo NVIDIA, Databricks y Snowflake. Estos socios desarrollaron herramientas adicionales permiten a Llama manejar datos propietarios y operar con menor latencia.

Bajo esta misma línea, Meta recomendó utilizar los modelos 8B y 70B para aplicaciones generales, como chatbots y generación de código, mientras el modelo 405B es más adecuado para tareas como la destilación de modelos y la generación de datos sintéticos. No obstante, también se proporciona varias herramientas para mejorar la seguridad y funcionalidad de esta herramienta.

Finalmente, Llama Guard, detectará contenido problemático, Prompt Guard, previene ataques de inyección rápida y CyberSecEval, evaluará riesgos de ciberseguridad. Llama Guard y Prompt Guard ayudarán a proteger contra contenido dañino y ataques maliciosos, mientras CyberSecEval proporcionará puntos de referencia para evaluar el riesgo de seguridad de los modelos.

DESCARGA LA NOTA SÍGUENOS EN GOOGLE NEWS