Microsoft выпустила три новые ИИ-модели ИИ Phi-3.5

Microsoft выпустила три новые ИИ-модели ИИ Phi-3.5

54
Компания Microsoft не стала останавливаться на успехах своего сотрудничества с OpenAI и представила три новые системы искусственного интеллекта семейства Phi, включающие языковые и мультимодальные модели.

Проекты Phi 3.5 включают три версии: компактную языковую модель Phi-3.5-mini-instruct с 3,82 миллиарда параметров, мощную Phi-3.5-MoE-instruct с 41,9 миллиарда параметров, а также Phi-3.5-vision-instruct с 4,15 миллиарда параметров, предназначенную для анализа изображений и видео. Эти модели доступны на платформе Hugging Face под лицензией MIT, что позволяет пользователям загружать, настраивать, изменять и использовать их в коммерческих целях без ограничений. По тестам они сопоставимы или превосходят конкурентов, таких как Google Gemini 1.5 Flash, Meta Llama 3.1 и даже OpenAI GPT-4o.

Phi-3.5 Mini Instruct создана для использования в средах с ограниченными вычислительными ресурсами. Модель с 3,8 миллиарда параметров решает задачи генерации кода, математических вычислений и логических рассуждений, поддерживая контексты длиной до 128 тысяч токенов. Несмотря на свои компактные размеры, модель успешно конкурирует в многоязычных и сложных языковых задачах, опережая в некоторых тестах такие системы, как Llama-3.1-8B-instruct и Mistral-7B-instruct.

Phi-3.5 MoE (Mixture of Experts) использует несколько специализированных моделей, объединяющих 42 миллиарда активных параметров. Она эффективна в математике, генерации кода и многоязычных запросах, нередко превосходя более крупные модели. В тесте MMLU модель показала превосходные результаты в научных и гуманитарных дисциплинах, обогнав GPT-4o mini.

Phi-3.5 Vision Instruct совмещает обработку текста и изображений. Она подходит для распознавания символов, анализа диаграмм и создания видеосводок. Поддержка контекста длиной до 128 тысяч токенов позволяет решать сложные многокадровые задачи. Модель обучена на тщательно отобранных наборах данных с акцентом на высокое качество информации.

Все три модели обучались на огромных объёмах данных с использованием мощных ускорителей Nvidia H100 и A100, и доступны по лицензии MIT, которая позволяет разработчикам свободно использовать и модифицировать их. Однако Microsoft не несёт ответственности за любые последствия их использования, поскольку модели предоставляются "как есть".

Поделиться: