Claude Token Saver MCP

Name: Claude Token Saver MCP
Author: BlackFoil

BlackFoilApache-2.0

4 звёзд

Claude Token Saver MCP — это MCP-сервер, который переносит рутинные задачи кодирования с Claude API на локальную LLM через Ollama. Разработчики, использующие Claude Code, тратят до 40% токенов на шаблонные операции: генерацию бойлерплейта, написание тестов, рефакторинг простых функций. Этот сервер автоматически определяет такие задачи и отправляет их локальному ассистенту. Результат: экономия токенов, снижение затрат, сохранение конфиденциальности (данные не покидают вашу машину) и часто — более быстрый ответ за счёт локального выполнения. Сервер работает через протокол MCP (Model Context Protocol). Он регистрируется как инструмент для Claude Code. Когда поступает запрос, сервер оценивает тип задачи. Если задача рутинная — она уходит в Ollama. Если локальный LLM недоступен или ответ недостаточно качественный — запрос автоматически перенаправляется в облачный API Claude. Такая гибридная схема даёт практичную экономию без потери качества.

Claude AI и машинное обучение Разработка

Подключить MCP Открыть на GitHub

Подключение

Подключить Claude Token Saver MCP

Выберите способ запуска и свой MCP-клиент. Ниже останется одна готовая инструкция, которую можно проверить и скопировать.

Способ подключения

Куда подключить

Скопируйте и проверьте

Claude Desktop / Claude Code

Клиент запускает MCP-сервер как локальный процесс.

1.Откройте настройки MCP в Claude.
2.Добавьте сервер с указанной командой и переменными окружения.
3.Перезапустите Claude, если сервер не появился автоматически.

json

{
  "mcpServers": {
    "claude-token-saver-mcp": {
      "command": "npx",
      "args": [
        "-y",
        "claude-token-saver-mcp"
      ]
    }
  }
}

Сгенерировано из существующей команды запуска. Желательно сверить с README.

Инструкция собрана из данных карточки и пока не отмечена как проверенная редакцией. Сверьте команду с README источника и не передавайте лишние права или секреты.

Как оценить Claude Token Saver MCP

Claude Token Saver MCP относится к Claude, AI и машинное обучение, Разработка. Ниже собраны проверяемые признаки, по которым его можно сравнить с другими серверами каталога.

Происхождение: Проект сообщества
Лицензия: Apache-2.0
Реализация: TypeScript
Транспорт: stdio

Что проверить перед выбором

Изучите README, открытые issues и историю последних изменений в репозитории.
Проверьте команду установки и зависимости перед запуском в рабочем окружении.
Ограничьте доступ MCP-сервера только нужными файлами, API и переменными окружения.

Карточка отредактирована 20.07.2026.

Автоматическая проверка источника ещё не выполнена. Внешних источников в карточке: 1.

Характеристики

Общее

СтатусСообщество
РазработчикBlackFoil
ЛицензияApache-2.0

Технологии

Языки
TypeScript
Транспорт
stdio

Описание

Возможности

Автоматическое перенаправление шаблонных запросов кодирования на локальную LLM (Ollama)
Выбор оптимальной модели на основе объёма оперативной памяти: для 8 ГБ — qwen2.5-coder:1.5b, для 16 ГБ — qwen2.5-coder:7b, для 32+ ГБ — Qwen3-14b и выше
Автоматическая загрузка и предварительная загрузка выбранной модели при старте (не нужно запускать ollama pull вручную)
Мониторинг экономии токенов и затрат: каждый запрос показывает локальную модель, количество сэкономленных токенов и сумму в долларах
Механизм fallback: если Ollama не отвечает или ответ неудовлетворительный, запрос уходит в Claude API
Поддержка любых моделей Ollama, совместимых с чат-форматом (например, Llama 3, Mistral, Gemma, DeepSeek Coder)
Прозрачная конфигурация через .mcp.json — установка одной командой npx
Покрытие тестами 97% — 736 автоматических тестов для стабильности

Как подключить

Убедитесь, что на компьютере установлены Node.js 20+ и Ollama. Ollama должна быть запущена (команда ollama serve).

Создайте в корне проекта файл .mcp.json с таким содержимым:

{
  "mcpServers": {
    "token-saver": {
      "command": "npx",
      "args": ["-y", "claude-token-saver-mcp"]
    }
  }
}

Запустите Claude Code в этой директории. Клиент автоматически обнаружит конфигурацию и установит сервер.
Попросите ассистента: «Настрой локальный LLM для экономии токенов». Сервер сам выберет модель под вашу RAM, скачает её (около 4 ГБ) и загрузит в память. Процесс занимает пару минут.
Дайте тестовое задание: «Напиши функцию на TypeScript, которая перемешивает массив». Если в ответе появится строка «Локальная модель: qwen2.5-coder:1.5b» — всё работает.

Если вы предпочитаете собрать сервер из исходников, клонируйте репозиторий, выполните npm ci && npm run build и укажите в .mcp.json путь к скомпилированному бинарнику.

Примеры запросов

«Сгенерируй для функции parseCSV юнит-тесты на Jest. Покрыть краевые случаи: пустая строка, кавычки, разные разделители.»
«Напиши bash-скрипт для бэкапа PostgreSQL базы раз в день с ротацией за 7 дней.»
«Перепиши этот компонент React с классового на функциональный, используя хуки.»
«Сделай краткую выжимку этого текста на 3-4 предложения, выдели ключевые тезисы.»

Технические детали

Язык: TypeScript
Транспорт: stdio (MCP)
Лицензия: Apache-2.0
Клиенты: Claude Code, а также любые MCP-совместимые приложения
Зависимости: Node.js 20+, Ollama (с любой запущенной моделью)
Установка: npx -y claude-token-saver-mcp (без глобальной установки)

Telegram WhatsApp VK OK X

Обсудить с ИИ

ChatGPT Claude Gemini DeepSeek Perplexity