Meta выпустила Llama 3.2: это первая LLM в Open Source

Meta выпустила Llama 3.2: это первая LLM в Open Source

10
Компания Meta снова произвела фурор в ИИ-сообществе, выпустив свою первую мультимодальную LLM Llama 3.2 без предварительных анонсов.

Как и в прошлые разы, её открытые модели обошли многие передовые закрытые аналоги, такие как GPT от OpenAI и Gemini от Google.

На самом деле, Llama 3.2 — это целое семейство моделей. В него входят вариант на 11 миллиардов параметров, который работает быстрее и занимает меньше ресурсов, а также более крупная версия на 90 миллиардов параметров. Ожидается, что в будущем будет выпущена и более мощная модель с 400 миллиардами параметров, как это уже было в предыдущих релизах.

Уже вышедшие модели показывают отличные результаты в тестах. Llama 3.2 на 90 миллиардов параметров успешно соревнуется с передовыми моделями, такими как GPT-4o mini от OpenAI и Claude3 - Haiku от Anthropic, которые имеют схожее количество параметров. Llama 3.2 особенно впечатлила на Vision-тестах, задачах, связанных с анализом изображений и графиков, превзойдя GPT-4o.

Весовые файлы моделей уже доступны на платформе Hugging Face.

Помимо мультимодальной Llama 3.2, Meta представила и новые маленькие модели, предназначенные только для работы с текстом. Они имеют 1 и 3 миллиарда параметров, и подходят для локальных запусков или интеграции в корпоративные системы. Несмотря на небольшой размер, эти модели успешно обгоняют такие известные аналоги, как Phi 3.5 и Gemma 2.

Поделиться: