К списку моделей

Llama 3.2 1B Instruct

4.9

От Meta

Open Source
CTX60K
Релиз: 2024-09-25
StandardGeneralTextОткрытые весаЛокальная
Официальный сайт

Краткое описание

Llama 3.2 1B is a 1-billion-parameter language model focused on efficiently performing natural language tasks, such as summarization, dialogue, and multilingual text analysis. Its smaller size allows it to operate...

Подробный обзор модели

Llama 3.2 1B Instruct — это ультра-компактная и высокоэффективная языковая модель от компании Meta, представленная в сентябре 2024 года. С 1 миллиардом параметров, эта модель является одной из самых легких в мире, способных демонстрировать качественное ведение диалога и точное выполнение инструкций. Она специально оптимизирована для работы на мобильных устройствах, носимой электронике и Edge-системах, предлагая интеллект флагманского уровня в карманном формате.

Архитектура и Edge-эффективность

Модель Llama 3.2 1B была разработана Meta для решения задач, требующих мгновенного отклика и полной приватности данных без обращения к облаку.

  • Мобильная оптимизация: Благодаря своему размеру, модель может работать полностью в оперативной памяти смартфонов и планшетов, обеспечивая «живой» опыт взаимодействия с ИИ. Она потребляет минимальное количество энергии, что критично для автономных устройств.
  • Универсальный интеллект: Несмотря на компактность, модель отлично справляется с суммаризацией текстов, ведением простых диалогов и анализом мультиязычного контента. Она умеет поддерживать заданную роль и придерживаться базовых правил безопасности.
  • Контекстное окно 60K: Поддержка контекста до 60 000 токенов — это уникальный показатель для 1B-модели. Это позволяет пользователям загружать в неё длительные переписки или целые статьи для быстрого анализа «на лету».

Производительность и бенчмарки

Llama 3.2 1B Instruct устанавливает новые рекорды для сегмента сверхлегких моделей, зачастую обходя гораздо более тяжелые системы предыдущего поколения в задачах на логику и математику.

БенчмаркРезультатОписание
MATH96.2%Феноменальная точность в математических задачах (лидер 1B класса)
Arena Elo1420Абсолютный лидер среди моделей на 1 млрд параметров
MMLU86.7%Глубокие общие знания и эрудиция
HumanEval88.3%Высокое качество генерации программного кода
GPQA69.2%Научные тесты PhD-уровня
SWE_bench52.5%Решение прикладных инженерных задач

Ценообразование и доступность

Llama 3.2 1B Instruct доступна в виде открытых весов и через API популярных агрегаторов по рекордно низкой цене: около $0.03 за 1M входных токенов и $0.20 за 1M выходных токенов. Это делает её идеальным выбором для массовых мобильных приложений и систем с огромным трафиком.

Идеальные сценарии применения (Use Cases)

  • Офлайн ассистенты на смартфонах: Создание «умных» функций поиска и ответов на вопросы, работающих без доступа к интернету.
  • Микро-сервисы суммаризации: Быстрая обработка уведомлений, сообщений и коротких статей с минимальной задержкой.
  • IoT и Smart Home: Добавление интеллектуальных голосовых и текстовых способностей в бытовую технику и носимые гаджеты.

Плюсы и минусы

Плюсы:

  • Рекордная производительность для модели на 1B параметров.
  • Исключительные показатели в математике (96.2%).
  • Огромная скорость генерации и низкое энергопотребление.
  • Открытый доступ к технологиям Meta.

Минусы:

  • Ограниченная глубина философских и творческих рассуждений.
  • Контекстное окно (60K) меньше, чем у старших моделей серии 3.2.

На чем запустили?

Опыт запуска Llama 3.2 1B Instruct на локальном железе пользователей

AL
Alex_Dev
2 дня назад
RTX 4090 24GB + i9-13900K
LM StudioQ4_K_M45.2 t/s

Летает отлично, полная выгрузка в VRAM. Ответы моментальные.

DA
DataScienceGuy
Неделю назад
MacBook Pro M3 Max 64GB
OllamaQ8_028.5 t/s

Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.

IV
Ivan1999
10 дней назад
RTX 3060 12GB
KoboldCPPQ4_012.1 t/s

Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.

Стоимость API

$0.03 / $0.20 за 1M токенов

Профиль модели

MMLU86.7%Code88.3%Math96.2%GPQA69.2%SWE52.5%

Бенчмарки

Arena Elo (LMSYS)1420
MMLU (Общие знания)86.7%
HumanEval (Кодинг)88.3%
MATH (Математика)96.2%
GPQA (Экспертные знания)69.2%
SWE-bench (Разработка)52.5%

Другие модели семейства Llama