claude-token-saver-mcp

claude-token-saver-mcp

BlackFoilApache-2.0
4 звёзд
Claude Token Saver MCP — это MCP-сервер, который переносит рутинные задачи кодирования с Claude API на локальную LLM через Ollama. Разработчики, использующие Claude Code, тратят до 40% токенов на шаблонные операции: генерацию бойлерплейта, написание тестов, рефакторинг простых функций. Этот сервер автоматически определяет такие задачи и отправляет их локальному ассистенту. Результат: экономия токенов, снижение затрат, сохранение конфиденциальности (данные не покидают вашу машину) и часто — более быстрый ответ за счёт локального выполнения. Сервер работает через протокол MCP (Model Context Protocol). Он регистрируется как инструмент для Claude Code. Когда поступает запрос, сервер оценивает тип задачи. Если задача рутинная — она уходит в Ollama. Если локальный LLM недоступен или ответ недостаточно качественный — запрос автоматически перенаправляется в облачный API Claude. Такая гибридная схема даёт практичную экономию без потери качества.

Установка

npx -y claude-token-saver-mcp

Характеристики

Общее

  • СтатусСообщество
  • РазработчикBlackFoil
  • ЛицензияApache-2.0

Технологии

  • Языки
    TypeScript
  • Транспорт
    stdio

Описание

Возможности

  • Автоматическое перенаправление шаблонных запросов кодирования на локальную LLM (Ollama)
  • Выбор оптимальной модели на основе объёма оперативной памяти: для 8 ГБ — qwen2.5-coder:1.5b, для 16 ГБ — qwen2.5-coder:7b, для 32+ ГБ — Qwen3-14b и выше
  • Автоматическая загрузка и предварительная загрузка выбранной модели при старте (не нужно запускать ollama pull вручную)
  • Мониторинг экономии токенов и затрат: каждый запрос показывает локальную модель, количество сэкономленных токенов и сумму в долларах
  • Механизм fallback: если Ollama не отвечает или ответ неудовлетворительный, запрос уходит в Claude API
  • Поддержка любых моделей Ollama, совместимых с чат-форматом (например, Llama 3, Mistral, Gemma, DeepSeek Coder)
  • Прозрачная конфигурация через .mcp.json — установка одной командой npx
  • Покрытие тестами 97% — 736 автоматических тестов для стабильности

Как подключить

Убедитесь, что на компьютере установлены Node.js 20+ и Ollama. Ollama должна быть запущена (команда ollama serve).

  1. Создайте в корне проекта файл .mcp.json с таким содержимым:

    {
      "mcpServers": {
        "token-saver": {
          "command": "npx",
          "args": ["-y", "claude-token-saver-mcp"]
        }
      }
    }
    
  2. Запустите Claude Code в этой директории. Клиент автоматически обнаружит конфигурацию и установит сервер.

  3. Попросите ассистента: «Настрой локальный LLM для экономии токенов». Сервер сам выберет модель под вашу RAM, скачает её (около 4 ГБ) и загрузит в память. Процесс занимает пару минут.

  4. Дайте тестовое задание: «Напиши функцию на TypeScript, которая перемешивает массив». Если в ответе появится строка «Локальная модель: qwen2.5-coder:1.5b» — всё работает.

Если вы предпочитаете собрать сервер из исходников, клонируйте репозиторий, выполните npm ci && npm run build и укажите в .mcp.json путь к скомпилированному бинарнику.

Примеры запросов

  • «Сгенерируй для функции parseCSV юнит-тесты на Jest. Покрыть краевые случаи: пустая строка, кавычки, разные разделители.»
  • «Напиши bash-скрипт для бэкапа PostgreSQL базы раз в день с ротацией за 7 дней.»
  • «Перепиши этот компонент React с классового на функциональный, используя хуки.»
  • «Сделай краткую выжимку этого текста на 3-4 предложения, выдели ключевые тезисы.»

Технические детали

  • Язык: TypeScript
  • Транспорт: stdio (MCP)
  • Лицензия: Apache-2.0
  • Клиенты: Claude Code, а также любые MCP-совместимые приложения
  • Зависимости: Node.js 20+, Ollama (с любой запущенной моделью)
  • Установка: npx -y claude-token-saver-mcp (без глобальной установки)

Поделиться