DeepSeek + Claude Code: reasoning за копейки

Пошаговая настройка DeepSeek V3.2 для Claude Code с алиасом dsk. Reasoning через extended thinking, цены $0.28/$0.42 за MTok.

DeepSeek + Claude Code: reasoning за копейки

TL;DR: Подключаем DeepSeek V3.2 к Claude Code за 3 минуты. Reasoning-модель за $0.28/$0.42 за миллион токенов — это примерно в 10 раз дешевле Claude Sonnet. Настроим алиас dsk для переключения одной командой.

DeepSeek сделали Anthropic-совместимый API-эндпоинт специально для Claude Code. Это значит, что никаких прокси не нужно — подключаешь напрямую. Модель DeepSeek-V3.2 работает в двух режимах: обычный чат и reasoning с цепочкой рассуждений. Второй режим хорош для сложных задач: дебаг, рефакторинг, разбор чужого кода.

Что понадобится

  • Claude Code (установленный)
  • Аккаунт на platform.deepseek.com (регистрация бесплатная)
  • Баланс на аккаунте (минимальный пополнение от $1-2)
  • Терминал с zsh или bash

Шаг 1. Регистрация и пополнение баланса

Заходи на platform.deepseek.com и создай аккаунт. DeepSeek работает по модели pay-per-token — подписки нет, платишь только за использование.

Пополни баланс. Для тестов хватит $2-3, этого достаточно на несколько дней активной работы с Claude Code. При текущих ценах $0.28/$0.42 за миллион токенов — это много.

DeepSeek — модели и цены API

Шаг 2. Получаем API-ключ

В личном кабинете перейди в раздел «API Keys». Создай новый ключ, дай ему название. Ключ показывается один раз, скопируй его сразу.

Сохрани в ~/.zshrc:

export DEEPSEEK_API_KEY="sk-вставь-свой-ключ"

Затем source ~/.zshrc.

Шаг 3. Настраиваем алиас dsk

Добавь в ~/.zshrc функцию:

dsk() {
  ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic \
  ANTHROPIC_AUTH_TOKEN="$DEEPSEEK_API_KEY" \
  API_TIMEOUT_MS=600000 \
  ANTHROPIC_MODEL=deepseek-chat \
  ANTHROPIC_SMALL_FAST_MODEL=deepseek-chat \
  CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC=1 \
  claude "$@"
}

Пару слов про параметры:

  • API_TIMEOUT_MS=600000 — таймаут 10 минут. DeepSeek рекомендует ставить побольше, потому что reasoning-режим думает долго и стандартные 2 минуты могут не хватить
  • ANTHROPIC_MODEL=deepseek-chat — основная модель. Если передать любое другое имя (вроде claude-sonnet-4-5), DeepSeek всё равно подставит deepseek-chat
  • ANTHROPIC_SMALL_FAST_MODEL=deepseek-chat — модель для фоновых задач

Перезагрузи терминал:

source ~/.zshrc

Шаг 4. Включаем reasoning-режим

DeepSeek V3.2 поддерживает thinking mode через параметр thinking в Anthropic API. В Claude Code это работает через встроенную функцию extended thinking.

Чтобы включить reasoning в сессии dsk:

  1. Запусти dsk в терминале
  2. Нажми Shift+Tab — переключишься в режим «think»
  3. Или набери /config и включи extended thinking

Когда thinking включён, Claude Code отправляет параметр thinking в запросе. DeepSeek его поддерживает — модель сначала строит цепочку рассуждений, потом даёт ответ. Параметр budget_tokens при этом игнорируется — модель думает столько, сколько считает нужным.

Reasoning-режим лучше для задач, где нужна логика: сложные баги, проектирование, анализ кода. Для простых задач типа «переименуй переменную» обычный режим быстрее и дешевле.

Цена за токен одинаковая — $0.28/$0.42 за миллион. Но с thinking модель генерирует больше токенов (из-за цепочки рассуждений), так что на практике обходится дороже.

Шаг 5. Проверяем

dsk

Если сессия открылась и отвечает на вопросы — работает. Попробуй попросить объяснить какой-нибудь файл в проекте.

Для проверки reasoning нажми Shift+Tab в сессии, чтобы переключиться в режим think. Задай сложный вопрос: «найди потенциальные баги в этом файле» или «предложи рефакторинг». В ответе увидишь блок с рассуждениями перед финальным ответом.

Шаг 6. Глобальная настройка (альтернатива алиасу)

Если хочешь, чтобы Claude Code всегда работал через DeepSeek, без алиасов:

{
  "env": {
    "ANTHROPIC_BASE_URL": "https://api.deepseek.com/anthropic",
    "ANTHROPIC_AUTH_TOKEN": "sk-ваш-ключ",
    "API_TIMEOUT_MS": "600000",
    "ANTHROPIC_MODEL": "deepseek-chat",
    "ANTHROPIC_SMALL_FAST_MODEL": "deepseek-chat",
    "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1"
  }
}

Сохрани в ~/.claude/settings.json. Подробнее про settings.json — в гайде по настройке Claude Code.

Результат

Команда dsk запускает Claude Code с DeepSeek V3.2. Переключение между обычным и reasoning-режимом — через Shift+Tab прямо в сессии. Переключаешься между DeepSeek и Anthropic одной командой в терминале.

Частые ошибки

Таймаут при длинных ответах

Стандартный таймаут Claude Code — 2 минуты. DeepSeek в reasoning-режиме иногда думает дольше. Решение: API_TIMEOUT_MS=600000 (10 минут). Если и этого мало, ставь 900000 (15 минут).

Ответы приходят медленно или запросы висят

DeepSeek периодически испытывает нагрузку, особенно в рабочие часы по Китаю (UTC+8). Это не проблема конфигурации. Если запрос висит больше минуты — попробуй ещё раз. У меня бывало, что один запрос шёл 40 секунд, а следующий — 3.

«Image content is not supported»

DeepSeek через Anthropic API не поддерживает изображения. Если Claude Code пытается отправить скриншот — будет ошибка. Это ограничение провайдера, обойти нельзя.

MCP-серверы не вызываются

Tool calls поддерживаются, но mcp_tool_use и mcp_tool_result — нет. Обычные MCP-серверы работают через стандартный tool_use, с ними проблем быть не должно. Если что-то не вызывается, проверь, не использует ли сервер server-side tools.

FAQ

Сколько стоит DeepSeek для Claude Code?

$0.28 за миллион входных токенов (без кэша), $0.42 за миллион выходных. С кэшем вход обходится в $0.028 — почти бесплатно. Для сравнения: Claude Sonnet 4.5 стоит $3/$15. Разница примерно в 10-35 раз.

Работает ли extended thinking в Claude Code через DeepSeek?

Да. Anthropic API эндпоинт DeepSeek поддерживает параметр thinking, который Claude Code отправляет при включённом extended thinking. Включи его через Shift+Tab или /config. Параметр budget_tokens игнорируется — модель сама решает, сколько думать.

Можно ли использовать DeepSeek бесплатно?

Бесплатного тарифа нет, но при регистрации иногда дают грантовый баланс. Плюс с кэшем вход стоит $0.028/MTok — на $1 можно сделать очень много запросов.

Какой максимальный контекст и длина ответа?

Контекст — 128K токенов. Максимальная длина ответа: 8K в обычном режиме, 64K с thinking. По умолчанию 4K и 32K соответственно.

Безопасно ли отправлять код в DeepSeek?

Серверы DeepSeek в Китае. Если работаешь с чувствительным кодом или данными под NDA, лучше использовать Ollama (локально) или облачных провайдеров вроде Bedrock/Vertex. Для личных проектов и open-source — ок.

Что ещё почитать