Калькулятор железа для локальных LLM

Узнайте, какие нейросети (Llama 3.3, Qwen 2.5, DeepSeek R1) можно запустить на вашем компьютере. Калькулятор оценивает VRAM для быстрой генерации (на видеокарте) и RAM для гибридного запуска.

Параметры устройства

Платформа

Процессор (CPU)

Мощность процессора влияет на генерацию при недостатке видеопамяти.

Оперативная память (RAM)

Видеопамять (VRAM)

В чем запускать?

LM Studio

Отличный интерфейс. Скачивание моделей в 1 клик и локальный сервер.

Oll

Ollama

Консольная утилита. Легко работает в фоне и интегрируется с Open-WebUI.

Вердикт системы

Полностью в GPU (Очень быстро)

Скорость от 20 до 100+ токенов в секунду. Модель целиком помещается в видеопамять (или объединенную память Mac).

Gemma 2 9B / Mistral Nemo 12B

Сильные модели для сложной логики.

9B - 12B

~8 GB VRAM

Qwen 2.5 7B / Llama 3.1 8B

Отличный баланс скорости и качества для 90% задач.

7B - 8B

~5.5 GB VRAM

Llama 3.2 1B / 3B

Идеально для базовых задач и слабых устройств.

< 3B

~2.5 GB VRAM

Частично в RAM (Средняя скорость)

Скорость 3-15 токенов в секунду. Модель частично выгружается в оперативную память. Зависит от мощности .

DeepSeek R1 Distill 32B

Мощная модель с рассуждениями (CoT).

32B

~20 GB RAM

Qwen 2.5 14B / 32B

Уровень GPT-3.5+ локально.

14B - 32B

~19 GB RAM