К списку инструментов

Калькулятор железа для локальных LLM

Узнайте, какие нейросети (Llama 3.3, Qwen 2.5, DeepSeek R1) можно запустить на вашем компьютере. Калькулятор оценивает VRAM для быстрой генерации (на видеокарте) и RAM для гибридного запуска.

Параметры устройства

Мощность процессора влияет на генерацию при недостатке видеопамяти.

Вердикт системы

Полностью в GPU (Очень быстро)

Скорость от 20 до 100+ токенов в секунду. Модель целиком помещается в видеопамять (или объединенную память Mac).

Gemma 2 9B / Mistral Nemo 12B
Сильные модели для сложной логики.
9B - 12B
~8 GB VRAM
Qwen 2.5 7B / Llama 3.1 8B
Отличный баланс скорости и качества для 90% задач.
7B - 8B
~5.5 GB VRAM
Llama 3.2 1B / 3B
Идеально для базовых задач и слабых устройств.
< 3B
~2.5 GB VRAM

Частично в RAM (Средняя скорость)

Скорость 3-15 токенов в секунду. Модель частично выгружается в оперативную память. Зависит от мощности .

DeepSeek R1 Distill 32B
Мощная модель с рассуждениями (CoT).
32B
~20 GB RAM
Qwen 2.5 14B / 32B
Уровень GPT-3.5+ локально.
14B - 32B
~19 GB RAM