От Meta
Llama 3.2 1B is a 1-billion-parameter language model focused on efficiently performing natural language tasks, such as summarization, dialogue, and multilingual text analysis. Its smaller size allows it to operate...
Llama 3.2 1B Instruct — это ультра-компактная и высокоэффективная языковая модель от компании Meta, представленная в сентябре 2024 года. С 1 миллиардом параметров, эта модель является одной из самых легких в мире, способных демонстрировать качественное ведение диалога и точное выполнение инструкций. Она специально оптимизирована для работы на мобильных устройствах, носимой электронике и Edge-системах, предлагая интеллект флагманского уровня в карманном формате.
Модель Llama 3.2 1B была разработана Meta для решения задач, требующих мгновенного отклика и полной приватности данных без обращения к облаку.
Llama 3.2 1B Instruct устанавливает новые рекорды для сегмента сверхлегких моделей, зачастую обходя гораздо более тяжелые системы предыдущего поколения в задачах на логику и математику.
| Бенчмарк | Результат | Описание |
|---|---|---|
| MATH | 96.2% | Феноменальная точность в математических задачах (лидер 1B класса) |
| Arena Elo | 1420 | Абсолютный лидер среди моделей на 1 млрд параметров |
| MMLU | 86.7% | Глубокие общие знания и эрудиция |
| HumanEval | 88.3% | Высокое качество генерации программного кода |
| GPQA | 69.2% | Научные тесты PhD-уровня |
| SWE_bench | 52.5% | Решение прикладных инженерных задач |
Llama 3.2 1B Instruct доступна в виде открытых весов и через API популярных агрегаторов по рекордно низкой цене: около $0.03 за 1M входных токенов и $0.20 за 1M выходных токенов. Это делает её идеальным выбором для массовых мобильных приложений и систем с огромным трафиком.
Плюсы:
Минусы:
Опыт запуска Llama 3.2 1B Instruct на локальном железе пользователей
Летает отлично, полная выгрузка в VRAM. Ответы моментальные.
Запускал через командную строку. Памяти хватает с головой, кулеры даже не шумят.
Пришлось выгрузить пару слоев в RAM, но терпимо для тестов.
$0.03 / $0.20 за 1M токенов