promptra
← Все статьи
Модели12 мин чтения

DeepSeek V4 Pro API за рубли: дёшево и легально для бизнеса

DeepSeek V4 Pro API в России: цена в рублях, промо −75% до 31 мая 2026 и базовый тариф после, контекст 1M, сила в коде. Подключение и оплата на юр.лицо.

Сравнительная схема стоимости запроса: высокий столбец флагманской модели и рядом столбец DeepSeek в несколько раз ниже, подсвеченный терракотой как самый выгодный вариант

DeepSeek V4 Pro в каталоге Promptra стоит 30 ₽ за миллион входных токенов и 60 ₽ за миллион выходных ($0.435 / $0.87). Это самая дешёвая флагманская модель в линейке — но важная оговорка: текущая цена включает промо-скидку −75%, которая действует до 31 мая 2026. После окончания акции базовый тариф вернётся примерно к $1.74 / $3.48 за 1M токенов (≈ 120 / 240 ₽). Даже по базовой цене DeepSeek остаётся в разы дешевле GPT-5.5 ($5 / $30) и Claude Opus 4.7 ($5 / $25). Оплата — на юр.лицо с полным пакетом закрывающих документов через ЭДО, подключение — заменой одной строки base_url в OpenAI-совместимом SDK.

В этом разборе — что такое DeepSeek V4 Pro и где он силён, точные цены в обоих сценариях (промо и база), три конкретных расчёта стоимости рабочей нагрузки в сравнении с премиум-моделями, когда брать более дешёвый V4-Flash, как подключить за пять минут и как это оформляется в российской бухгалтерии. Без воды, на цифрах. По состоянию на 2026-05-28.

Что такое DeepSeek V4 Pro и для чего он

DeepSeek V4 Pro — флагманская языковая модель китайской лаборатории DeepSeek, наследница линейки V3/V3.2, которая в 2024–2025 годах сломала привычное представление о том, сколько должен стоить сильный reasoning. Главная особенность модели — open-weight: веса опубликованы под открытой лицензией, модель можно скачать и запустить на своём железе. Для большинства команд это не значит «будем хостить сами» (это дорого и сложно операционно), но это значит важную вещь: модель не привязана к единственному вендору, её отдают десятки инференс-провайдеров, и цена на неё держится низкой за счёт конкуренции.

Технические параметры DeepSeek V4 Pro:

ПараметрЗначение
Контекстное окно1 048 576 токенов (1M)
Максимум выходных токенов384 000 (384K)
Модальностьтекст
Тип весовopen-weight (открытая лицензия)
Endpointchat (OpenAI-совместимый)
Сильные стороныпрограммирование, математика, логические задачи

Контекст в 1M токенов ставит V4 Pro в один ряд с Claude Opus 4.7, GPT-5.5 и Gemini 3 Pro — то есть в модель целиком влезает крупный кодовый репозиторий, длинная техническая документация или несколько часов транскрипта. Максимум выходных токенов 384K — это нетипично много: большинство моделей ограничены 8K–65K на ответ. На практике это означает, что DeepSeek может за один вызов сгенерировать большой связный артефакт — например, целый модуль кода с тестами или развёрнутый технический разбор — не упираясь в потолок длины ответа на середине.

Где DeepSeek V4 Pro объективно силён — это код и математика. Линейка DeepSeek исторически затачивалась под формальное рассуждение: решение задач с пошаговым выводом, генерация и рефакторинг кода, работа с алгоритмами. Это не модель-универсал «на всё подряд» уровня GPT-5.5 с мультимодальностью и аудио — V4 Pro работает только с текстом. Но в своей нише — там, где нужно правильно написать функцию, разобрать стек-трейс, вывести формулу или пройти цепочку логики — она конкурирует с моделями в десять раз дороже.

Радар-диаграмма способностей модели: многоугольник с длинными лучами в направлениях «код» и «математика» и заметно более короткими лучами в сторону «мультимодальность» и «аудио», без подписей, чистый векторный editorial-стиль

Цена DeepSeek V4 Pro в рублях: промо и базовый тариф

Это центральный раздел, и здесь важно не запутаться в двух цифрах. У DeepSeek V4 Pro сейчас действует промо-скидка −75%, и она заканчивается 31 мая 2026. Поэтому считать стоимость нужно в двух сценариях.

Цены в Promptra совпадают с официальным прайсом DeepSeek (источник — страница pricing DeepSeek API), пересчитаны в рубли по курсу ЦБ РФ на 27.05.2026 (1 USD = 71.668 ₽), без наценки на токены:

ПериодInput $/1MOutput $/1MInput ₽/1MOutput ₽/1M
Промо (до 31 мая 2026)$0.435$0.8730 ₽60 ₽
Базовый (с 1 июня 2026)≈ $1.74≈ $3.48≈ 120 ₽≈ 240 ₽

Базовая цена — это ровно ×4 от промо (скидка снимает три четверти стоимости). Точную цифру после окончания акции стоит сверить на официальной странице DeepSeek — провайдер может скорректировать тариф, мы синхронизируем каталог с прайсом DeepSeek по курсу ЦБ.

Чтобы понять масштаб экономии, поставим DeepSeek рядом с премиум-моделями. Вот цена за 1M output-токенов — именно output обычно составляет 60–80% счёта в реальной LLM-нагрузке:

МодельOutput $/1MOutput ₽/1MИсточник
DeepSeek V4 Pro (промо)$0.8760 ₽api-docs.deepseek.com
DeepSeek V4 Pro (база)≈ $3.48≈ 240 ₽api-docs.deepseek.com
GPT-5.5$30.002150 ₽openai.com/api/pricing
Claude Opus 4.7$25.001790 ₽platform.claude.com/pricing
Gemini 3 Pro$12.00851 ₽ai.google.dev/pricing

Даже после окончания промо output DeepSeek ($3.48) почти в 9 раз дешевле GPT-5.5 и в 7 раз дешевле Claude Opus 4.7. На промо-тарифе разрыв доходит до ×34 против GPT-5.5. Это не маркетинговое «дешевле» — это другой порядок величины в счёте.

Горизонтальный таймлайн ценовой динамики: слева низкая отметка-точка промо-периода, затем ступенька вверх к более высокой отметке базового тарифа, вертикальная пунктирная линия-граница делит до и после, всё в терракотово-кремовой палитре без цифр

Сколько это в деньгах: три расчёта рабочей нагрузки

Абстрактные «доллары за миллион» плохо ложатся в голову. Посчитаем три типовых месячных сценария и сравним DeepSeek с флагманами на одинаковой нагрузке.

Сценарий 1 — продуктовый чат-бот / ассистент. Допустим, сервис обрабатывает 50M входных и 10M выходных токенов в месяц (порядка нескольких тысяч диалогов средней длины).

МодельСтоимость в месяц (USD)Во сколько раз дороже DeepSeek-промо
DeepSeek V4 Pro (промо)$30.45
DeepSeek V4 Pro (база)$121.80×4
Claude Opus 4.7$500.00×16
GPT-5.5$550.00×18

Сценарий 2 — разовая агентская задача в коде. Агент прогоняет крупный рефакторинг: читает контекст и генерирует много кода, скажем 5M входных и 5M выходных токенов за один большой прогон.

МодельСтоимость прогона (USD)
DeepSeek V4 Pro (промо)$6.52
Claude Opus 4.7$150.00
GPT-5.5$175.00

Один и тот же кодовый прогон стоит $6.52 на DeepSeek-промо против $175 на GPT-5.5 — разница в 27 раз. Здесь важна оговорка: на сложных agentic-задачах премиум-модель может чаще давать правильный ответ с первой попытки и экономить итерации. Но для задач, где DeepSeek справляется (а в коде и матлогике он справляется часто), экономия очевидна.

Сценарий 3 — что будет после 31 мая. Тот же бот из сценария 1 на базовом тарифе DeepSeek обойдётся в $121.80 в месяц. Это уже не «×18», но всё ещё в 4–4.5 раза дешевле GPT-5.5 и Opus 4.7. То есть даже когда промо закончится, экономический смысл выбирать DeepSeek для подходящих задач никуда не денется — просто из «на порядок дешевле» он станет «в несколько раз дешевле».

Вывод по расчётам простой: если ваша нагрузка — это код, формальная логика, генерация текста и чат, где сильная reasoning-модель не критична до уровня топ-флагмана, DeepSeek снимает с месячного счёта один-два нуля.

DeepSeek V4-Flash: когда нужно ещё дешевле

Если даже промо-тариф V4 Pro кажется избыточным для задачи, есть младшая модель — DeepSeek V4-Flash по цене $0.14 / $0.28 за 1M токенов (≈ 10 / 20 ₽). Это примерно втрое дешевле промо-V4 Pro и более чем в сто раз дешевле GPT-5.5 на output.

Flash имеет смысл там, где не нужен максимум reasoning:

  • классификация и маршрутизация запросов (определить тему, язык, тональность);
  • извлечение структурированных данных из текста (парсинг, тегирование);
  • короткие ответы в чате с простыми вопросами;
  • предварительная фильтрация перед отправкой сложных запросов в старшую модель.

Типовая архитектура «два уровня»: дешёвый Flash сортирует входящие и обрабатывает 80% простых запросов, а оставшиеся 20% сложных уходят на V4 Pro или флагман. Такой роутинг по моделям часто срезает счёт ещё в несколько раз поверх и без того низкой цены DeepSeek. Подробнее про то, как разные модели закрывают разные ниши, мы разбирали в обзоре топ-5 LLM 2026 года.

Схема двухуровневой маршрутизации: входящий поток стрелок разделяется на узле-развилке, большая часть уходит к маленькому прямоугольнику-«быстрой модели», тонкий ручеёк — к крупному прямоугольнику-«старшей модели», подсвеченному терракотой, без подписей

Как подключить DeepSeek API из России за 5 минут

DeepSeek API — OpenAI-совместимый. Это значит, что подключение в существующий код сводится к замене двух вещей: base_url на endpoint Promptra и model на идентификатор DeepSeek. Остальной код, написанный под официальный OpenAI SDK, работает без изменений — те же chat.completions.create, те же роли сообщений, тот же streaming.

Python (официальный openai SDK):

from openai import OpenAI

client = OpenAI(
    api_key="prm-xxxxxxxxxxxx",          # ключ Promptra
    base_url="https://api.promptra.ru/v1",
)

response = client.chat.completions.create(
    model="deepseek/deepseek-v4-pro",     # для дешёвой версии: deepseek/deepseek-v4-flash
    messages=[
        {"role": "user", "content": "Напиши функцию бинарного поиска на Python с тестами"},
    ],
)
print(response.choices[0].message.content)

Node.js (openai npm-пакет):

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: "prm-xxxxxxxxxxxx",
  baseURL: "https://api.promptra.ru/v1",
});

const response = await client.chat.completions.create({
  model: "deepseek/deepseek-v4-pro",
  messages: [
    { role: "user", content: "Напиши функцию бинарного поиска на Python с тестами" },
  ],
});
console.log(response.choices[0].message.content);

Хорошая практика — держать base_url и model в переменных окружения, чтобы переключаться между моделями и провайдерами без правки кода:

import os
from openai import OpenAI

# .env:
# OPENAI_BASE_URL=https://api.promptra.ru/v1
# OPENAI_API_KEY=prm-xxxxxxxxxxxx
# MODEL=deepseek/deepseek-v4-pro

client = OpenAI(
    api_key=os.environ["OPENAI_API_KEY"],
    base_url=os.environ["OPENAI_BASE_URL"],
)

response = client.chat.completions.create(
    model=os.environ["MODEL"],
    messages=[{"role": "user", "content": "Привет"}],
)

Если у вас уже есть код под OpenAI и вы хотите попробовать DeepSeek на A/B — достаточно поменять одну переменную MODEL и сравнить качество ответов на своей реальной нагрузке. Никакого нового SDK, никакой переписи интеграции.

Когда выбирать DeepSeek, а когда флагман

DeepSeek — не «замена всему». Честная картина выглядит так.

Берите DeepSeek V4 Pro, когда:

  • основная нагрузка — генерация и рефакторинг кода, разбор ошибок, алгоритмические задачи;
  • нужно решать математику и формальную логику с пошаговым выводом;
  • объёмы большие, и цена за токен напрямую влияет на юнит-экономику;
  • нужен длинный контекст (репозиторий, документация) при низкой цене за 1M;
  • задача текстовая — мультимодальность (изображения, аудио) не требуется.

Берите премиум-флагман (GPT-5.5 / Claude Opus 4.7), когда:

  • нужна максимальная надёжность ответа с первой попытки в сложном agentic-сценарии, где цена ошибки выше цены токенов;
  • требуется мультимодальность: анализ изображений, аудио, видео в одном запросе;
  • задача — тонкий копирайтинг, нюансированный диалог, работа с подтекстом, где премиум-модели заметно лучше;
  • регуляторные или контрактные требования диктуют конкретного вендора.

Берите V4-Flash, когда: задача простая и массовая — классификация, извлечение данных, короткие ответы, фильтрация перед старшей моделью.

Самый прагматичный подход — не выбирать одну модель навсегда, а маршрутизировать запросы: простое → Flash, основной объём кода и логики → V4 Pro, редкие критичные сложные кейсы → флагман. Поскольку все они доступны через один OpenAI-совместимый endpoint и один ключ, такой роутинг — это вопрос параметра model в запросе, а не отдельных интеграций.

Оплата DeepSeek на юр.лицо: документы и легальность

Техническая сторона — половина дела. Для команды в компании вторая половина — как это оплатить и провести в бухгалтерии так, чтобы расходы корректно встали в учёт.

Прямая оплата DeepSeek с российской карты или через VPN упирается в те же проблемы, что и любой зарубежный AI-сервис: валютный платёж юрлица в адрес иностранной компании требует основания (договор, счёт, акт), которого при оплате личной картой сотрудника нет. Расходы без правильно оформленных закрывающих документов не принимаются к учёту как затраты бизнеса.

Через Promptra схема прозрачна:

  1. Российская компания заключает договор-оферту с резидентом РФ — ООО «ТРАФИК АГРЕГАТОР» (ИНН 9707022118).
  2. Оплачивает счёт в рублях на расчётный счёт юр.лица.
  3. Получает доступ к DeepSeek (и остальным моделям) через единый API-endpoint.
  4. В конце периода получает полный пакет закрывающих документов — счёт, акт, счёт-фактуру, УПД — через ЭДО (Диадок / СБИС).
  5. Бухгалтерия проводит расходы корректно, документы приходят в учётную систему автоматически через электронный документооборот.

Оплата идёт на юр.лицо с полным пакетом первички, работаем через ЭДО — это снимает вопрос «как объяснить ФНС платёж в адрес китайского AI-провайдера». Подробный разбор юридической стороны работы с зарубежными LLM на компанию — в отдельном материале: легально ли использовать AI API на юрлицо.

Отдельно про цену: наценки на токены нет — DeepSeek стоит ровно столько, сколько в официальном прайсе провайдера, пересчитанном по курсу ЦБ. Сервисная комиссия 5% берётся только при пополнении баланса, а не с каждого токена. То есть промо-тариф $0.435 / $0.87 вы получаете один-в-один, без скрытой маржи сверху.

Схема документооборота: блок «компания» соединён стрелкой оплаты с блоком «юр.лицо-резидент РФ», от которого отходит стрелка доступа к облачному узлу-API и обратная стрелка с пакетом документов через узел ЭДО к блоку «бухгалтерия», минималистичный flowchart без подписей

FAQ

Почему DeepSeek V4 Pro такой дешёвый — есть подвох?

Две причины. Первая — модель open-weight: веса опубликованы, её отдают много инференс-провайдеров, конкуренция держит цену низкой. Вторая — сейчас действует промо-скидка −75% до 31 мая 2026, которая временно опускает цену до $0.435 / $0.87. После окончания акции базовый тариф вырастет примерно до $1.74 / $3.48 — но даже это в несколько раз дешевле флагманов. Подвоха в качестве нет: для кода и математики DeepSeek конкурирует с куда более дорогими моделями, но он текстовый и не покрывает мультимодальные задачи.

Что будет с ценой после 31 мая 2026?

Промо-скидка снимается, и цена возвращается к базовой — ориентировочно $1.74 / $3.48 за 1M входных/выходных токенов (≈ 120 / 240 ₽ по курсу ЦБ). Это ровно вчетверо дороже промо, но всё ещё примерно в 4–9 раз дешевле GPT-5.5 и Claude Opus 4.7. Точную цифру после акции стоит сверить на официальной странице DeepSeek; каталог Promptra синхронизируется с прайсом провайдера по курсу ЦБ.

Чем DeepSeek V4 Pro отличается от V4-Flash?

V4 Pro — старшая модель: сильнее в сложном reasoning, коде и математике, контекст 1M, максимум вывода 384K, цена $0.435 / $0.87 (промо). V4-Flash — младшая и более дешёвая ($0.14 / $0.28), для простых массовых задач: классификация, извлечение данных, короткие ответы. Типовой паттерн — Flash на основной поток простых запросов, V4 Pro на код и логику.

Нужно ли переписывать код, чтобы перейти на DeepSeek?

Нет. DeepSeek API OpenAI-совместим, а Promptra отдаёт его через тот же endpoint, что и остальные модели. В коде на официальном openai SDK достаточно поменять base_url на https://api.promptra.ru/v1 и указать model: "deepseek/deepseek-v4-pro". Логика запросов, роли сообщений, streaming — всё остаётся прежним.

Можно ли оплатить DeepSeek на юр.лицо с закрывающими документами?

Да. Оплата идёт на юр.лицо ООО «ТРАФИК АГРЕГАТОР» (ИНН 9707022118) в рублях, с полным пакетом первички — договор-оферта, счёт, акт, счёт-фактура, УПД — через ЭДО (Диадок / СБИС). Расходы корректно учитываются в бухгалтерии. Наценки на токены нет, сервисная комиссия 5% — только при пополнении баланса.

Подходит ли DeepSeek для production?

Да, для текстовых задач, особенно связанных с кодом и логикой. Контекст 1M и максимум вывода 384K покрывают крупные кодовые прогоны и длинную документацию. Для критичных agentic-сценариев, где важна максимальная точность с первой попытки, или для мультимодальных задач (изображения, аудио) разумно держать рядом флагман и маршрутизировать сложные запросы на него — благо это один и тот же endpoint и один ключ.

Если хотите посчитать стоимость своей конкретной нагрузки на DeepSeek (с учётом окончания промо) или обсудить подключение и закрывающие документы — напишите команде Promptra напрямую в Telegram: t.me/nesterov_av. Технические вопросы про миграцию и роутинг по моделям обычно решаются за один разговор.

Promptra

Готовы попробовать Promptra?

Один API-ключ ко всем флагманским LLM. Оплата на юр.лицо, цены в рублях по курсу ЦБ. Тестовые токены бесплатно.

Promptra

Готовы попробовать Promptra?

Один API-ключ ко всем флагманским LLM. Оплата на юр.лицо, цены в рублях по курсу ЦБ. Тестовые токены бесплатно.