promptra
← Все статьи
Модели16 мин чтения

GPT-5.4 API за рубли: универсал OpenAI для прода

GPT-5.4 API в России: цена 170/1070 ₽ за 1M токенов, контекст 1.05M, нюанс тарификации свыше 272K, drop-in через OpenAI SDK и оплата на юр.лицо с документами.

Сравнительная схема трёх моделей OpenAI: универсал GPT-5.4 в центре с ценой 170/1070 ₽ выделен терракотой, слева флагман GPT-5.5, справа бюджетный GPT-5.4 mini

GPT-5.4 — рабочая лошадка линейки OpenAI: модель, которая закрывает большинство повседневных задач за половину цены флагмана. Через Promptra она стоит 170 ₽ за 1M входных токенов и 1070 ₽ за 1M выходных — это цена 1-в-1 с прайсом OpenAI ($2.5 и $15 соответственно) по курсу ЦБ РФ на 27.05.2026 (71.668 ₽/$), без наценки на токены. Контекстное окно — 1 050 000 токенов, максимум на выход — 128 000 токенов. Подключение занимает пять минут: в коде на OpenAI SDK меняется один параметр base_url на https://api.promptra.ru/v1, остальной код остаётся прежним. Оплата идёт на российское юр.лицо с полным пакетом закрывающих документов через ЭДО.

Главный практический вопрос по GPT-5.4 — не «хорошая ли это модель», а «где проходит граница, за которой нужен флагман GPT-5.5, а где хватит дешёвой GPT-5.4 mini». Ответ короткий: GPT-5.4 — точка по умолчанию для прода. Берите её, если не уверены, какая модель нужна; поднимайте до 5.5 там, где 5.4 систематически ошибается, и опускайте до mini там, где задача массовая и простая. Ниже разберём цену в рублях на конкретных сценариях, нюанс тарификации длинных контекстов, выбор между тремя моделями и специализированную GPT-5.3 Codex для кода. Все цены — на 2026-05-29.

Что такое GPT-5.4 и для каких задач

GPT-5.4 — это универсальная модель OpenAI, которую сам провайдер описывает как лучший выбор для chat и общих задач. В отличие от флагманской GPT-5.5, заточенной под предельно сложный reasoning, GPT-5.4 спроектирована как «крепкий середняк» — модель, которая даёт качественный результат на широком спектре задач при цене вдвое ниже флагмана.

На практике GPT-5.4 закрывает порядка 80% реальных сценариев продуктовой разработки:

  • Генерация и рефакторинг кода средней сложности — написать функцию, разобрать стек-трейс, переписать модуль, объяснить чужой код.
  • Развёрнутые текстовые ответы — ассистенты для сотрудников, генерация черновиков, суммаризация документов и переписки.
  • Работа с документами — извлечение структуры из PDF, ответы по содержанию договоров и регламентов, перевод и адаптация текстов.
  • RAG-сценарии — ответы по корпоративной базе знаний, где контекст подаётся в промпт, а модель формулирует ответ.
  • Чат-ассистенты — внутренние помощники, поддержка первой линии, диалоговые сценарии.

Поднимать задачу до флагмана GPT-5.5 имеет смысл там, где 5.4 начинает «срываться»: путает требования в длинном ТЗ, теряет нить в многофайловом рефакторинге, выдаёт правдоподобный, но неверный ответ на вопрос с длинной цепочкой рассуждений. На таких задачах разница в качестве оправдывает удвоение цены выхода. На всём остальном — нет.

Ключевые технические характеристики из нашего каталога:

ПараметрЗначение
Идентификатор моделиgpt-5.4
ПровайдерOpenAI
Контекстное окно1 050 000 токенов
Максимум на выход128 000 токенов
Модальности входатекст, изображения
Модальности выходатекст
Endpointschat, responses

Миллион токенов контекста — это ориентировочно 700–750 тысяч слов русского текста или примерно 50 000 строк кода. На практике в одно окно влезает кодовая база среднего сервиса целиком, годовой архив переписки или несколько объёмных PDF-договоров. Контекст у GPT-5.4 идентичен флагману GPT-5.5 (обе модели — 1.05M), так что по объёму данных, который можно подать за один вызов, универсал не уступает флагману. Разница — в глубине рассуждения и в цене.

Цена GPT-5.4 в рублях: полная таблица

Promptra не накручивает наценку на токены. Стоимость модели равна официальному прайсу OpenAI, пересчитанному в рубли по курсу ЦБ РФ. Сервисная комиссия 5% берётся только при пополнении баланса, а не с каждого запроса, поэтому в расчётах за токены её нет. Базовый прайс OpenAI публикуется на странице прайс-листа OpenAI.

Тип токеновЦена OpenAI (USD за 1M)Цена Promptra (₽ за 1M)
Вход (input)$2.50170 ₽
Выход (output)$15.001070 ₽

Курс пересчёта: 1 USD = 71.668 ₽ (ЦБ РФ на 27.05.2026). Точная арифметика: $2.5 × 71.668 = 179.17 ₽, $15 × 71.668 = 1075.02 ₽. В каталоге значения округлены до 170 и 1070 ₽ — фактический счёт считается по курсу ЦБ на день пополнения, поэтому в разные дни рублёвая цифра слегка плавает вслед за курсом, а долларовая ставка остаётся фиксированной.

Чтобы понимать порядок расходов, прикинем стоимость типовых сценариев. Соотношение вход/выход в реальной нагрузке обычно смещено в сторону входа (длинный промпт + контекст, короткий ответ).

СценарийВходВыходСтоимость
Короткий чат-запрос1K0.5K≈ 0.7 ₽
Анализ документа на 50 страниц40K4K≈ 11.1 ₽
Развёрнутый ответ ассистента4K6K≈ 7.1 ₽
RAG-ответ по базе знаний80K2K≈ 15.7 ₽

Цифры приблизительные и зависят от точного количества токенов в ваших данных. Считаются они просто: (входные_токены / 1 000 000 × 170) + (выходные_токены / 1 000 000 × 1070). Реальный расход всегда видно в дашборде по факту запроса, а оценить заранее можно через официальный токенайзер OpenAI — он показывает, на сколько токенов разобьётся конкретный текст.

Горизонтальная столбчатая диаграмма стоимости 1M выходных токенов в рублях: GPT-5.5 2150 рублей, GPT-5.4 1070 рублей терракотовым, GPT-5.4 mini 320 рублей, с подписями на русском

Нюанс тарификации свыше 272K: тот же порог, что у флагмана

Как и у флагманской GPT-5.5, у GPT-5.4 есть правило тарификации длинных контекстов, которое легко упустить из виду при планировании бюджета. OpenAI указывает в pricing-документации: если входной контекст запроса превышает 272 000 токенов, тарификация всей сессии переключается на повышенную ставку — 2× за вход и 1.5× за выход.

Критичный момент: это не «доплата за токены сверх порога». Это смена ставки для всего запроса целиком. Если вы отправили 280K входных токенов, по двойной ставке оплачиваются все 280K, а не только 8K, которые превысили лимит. И выход этого же запроса считается по ставке 1.5×, даже если на выход пришлась пара тысяч токенов.

Посчитаем разницу в рублях:

РежимВход (₽ за 1M)Выход (₽ за 1M)
Обычный (вход до 272K)170 ₽1070 ₽
Повышенный (вход свыше 272K)340 ₽1605 ₽

Повышенные ставки — это $5/1M на вход ($2.5 × 2) и $22.5/1M на выход ($15 × 1.5), в рублях по курсу ЦБ примерно 340 и 1605 ₽. Иными словами, как только запрос пересекает порог 272K на входе, каждый его токен дорожает: входной вдвое, выходной в полтора раза.

Покажем на конкретном примере, насколько обиден этот «прыжок через порог». Возьмём два почти одинаковых запроса:

ЗапросВходВыходСтавка входаСтавка выходаСтоимость
A — под порогом270K5K170 ₽1070 ₽≈ 51.2 ₽
B — над порогом275K5K340 ₽1605 ₽≈ 101.5 ₽

Разница во входных токенах между запросами — всего 5 тысяч (менее 2%), а счёт почти удвоился: с 51 до 102 ₽. Причина — переход всего запроса на повышенный тариф.

Практический вывод тот же, что и для флагмана: держите вход под 272K через грамотный отбор контекста (retrieval), а если контекст принципиально большой — закладывайте в бюджет повышенные ставки 340/1605 ₽ за 1M заранее, чтобы фактический счёт не оказался вдвое выше плановых ожиданий. Там, где документы можно обрабатывать секциями, два запроса по 200K дешевле одного на 400K примерно вдвое по входу. Подробнее этот же механизм с расчётами на флагманских ставках мы разбирали в статье про GPT-5.5 API за рубли.

Как подключить GPT-5.4 из России: drop-in через OpenAI SDK

Технически GPT-5.4 через Promptra подключается так же, как напрямую через OpenAI — потому что API совместим с OpenAI на уровне протокола. Меняется ровно один параметр: base_url. Ключ OpenAI заменяется на ключ Promptra, всё остальное в коде остаётся прежним.

Python

from openai import OpenAI

client = OpenAI(
    api_key="prm-xxxxxxxxxxxx",          # ключ Promptra
    base_url="https://api.promptra.ru/v1",  # единственное изменение
)

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[
        {"role": "system", "content": "Ты — ассистент инженера."},
        {"role": "user", "content": "Перепиши эту функцию без рекурсии."},
    ],
)

print(response.choices[0].message.content)

Node.js

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: "prm-xxxxxxxxxxxx",
  baseURL: "https://api.promptra.ru/v1", // единственное изменение
});

const response = await client.chat.completions.create({
  model: "gpt-5.4",
  messages: [
    { role: "system", content: "Ты — ассистент инженера." },
    { role: "user", content: "Перепиши эту функцию без рекурсии." },
  ],
});

console.log(response.choices[0].message.content);

Хорошая практика: base_url в переменной окружения

Чтобы не зашивать endpoint в код и иметь возможность переключиться за секунды, держите base_url и ключ в .env:

import os
from openai import OpenAI

# В .env:
#   OPENAI_API_KEY=prm-xxxxxxxxxxxx
#   OPENAI_BASE_URL=https://api.promptra.ru/v1

client = OpenAI(
    api_key=os.environ["OPENAI_API_KEY"],
    base_url=os.environ["OPENAI_BASE_URL"],
)

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[{"role": "user", "content": "Привет"}],
)

Проверить, что подключение работает, можно одним curl-запросом без всякого SDK:

curl https://api.promptra.ru/v1/chat/completions \
  -H "Authorization: Bearer prm-xxxxxxxxxxxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.4",
    "messages": [{"role": "user", "content": "ping"}]
  }'

Если в ответ пришёл JSON с полем choices — модель отвечает, можно подключать в продакшен. Отдельный плюс drop-in-подхода: переключение между моделями — это смена одной строки model. Сегодня прод работает на gpt-5.4, завтра вы поднимаете критичный пайплайн на gpt-5.5, а массовую очередь опускаете на gpt-5.4-mini — код при этом не меняется. Почему этот путь надёжнее прямого доступа через VPN и виртуальные карты — мы подробно разобрали в гайде про OpenAI API в России: там и про блокировки аккаунтов, и про риски карт, и про юридическую сторону.

Схема drop-in миграции: код разработчика с подписью base_url равно api.promptra.ru проходит через единый шлюз и расходится стрелками к трём моделям gpt-5.4, gpt-5.5, gpt-5.4 mini, центральная стрелка к 5.4 выделена терракотой

GPT-5.4 vs GPT-5.5 vs GPT-5.4 mini: матрица выбора

Это центральный раздел статьи. В линейке OpenAI на конец мая 2026 три рабочие точки, и выбор между ними — это в первую очередь вопрос экономики, а не «качества вообще». Сведём их в таблицу (цены — из нашего каталога, 1-в-1 с прайсом OpenAI по курсу ЦБ).

МодельВход (₽/1M)Выход (₽/1M)КонтекстМакс. выходРоль
GPT-5.5350 ₽2150 ₽1.05M128KФлагман: сложный reasoning, агенты
GPT-5.4170 ₽1070 ₽1.05M128KУниверсал: chat, общие задачи, прод
GPT-5.4 mini50 ₽320 ₽400K128KМассовые запросы, автоматизация

USD-прайс для справки: GPT-5.5 — $5/$30, GPT-5.4 — $2.5/$15, GPT-5.4 mini — $0.75/$4.5 (источник — прайс-лист OpenAI).

Цифры показывают разрывы наглядно. По выходу — самому весомому компоненту счёта в большинстве задач — GPT-5.4 ровно вдвое дешевле флагмана GPT-5.5 и примерно в 3.3 раза дороже mini. По входу: GPT-5.4 вдвое дешевле флагмана и в 3.4 раза дороже mini. То есть GPT-5.4 сидит ровно посередине ценовой лестницы — и это делает её естественной точкой по умолчанию.

Берите GPT-5.4 (по умолчанию), когда: нужен крепкий универсал для большинства задач — генерация и рефакторинг кода средней сложности, развёрнутые ответы, работа с документами, чат-ассистенты для сотрудников, RAG. Это «рабочая лошадка», которая закрывает порядка 80% сценариев за половину цены флагмана. Если вы не уверены, какая модель нужна, — стартуйте с 5.4 и корректируйте по факту.

Поднимайте до GPT-5.5, когда: задача требует глубокого многошагового рассуждения, и цена ошибки выше цены токенов. Сложный код с длинными зависимостями, агентные пайплайны с планированием, анализ, где модель должна удерживать много условий одновременно. Сигнал к апгрейду — когда вы видите, что 5.4 систематически ошибается на вашем классе задач. Платите за глубину только там, где она реально работает. Полный разбор флагмана — в статье про GPT-5.5 API за рубли.

Опускайте до GPT-5.4 mini, когда: объём запросов большой, а каждая задача простая — классификация, извлечение полей, модерация, короткие ответы, обработка очередей. На потоке в миллионы запросов экономия против универсала ощутима: выход дешевле в 3.3 раза. Обратите внимание: у mini контекст 400K, а не 1.05M — для большинства массовых задач этого с запасом, но для обработки очень длинных документов потребуется старшая модель.

Дерево решения выбора модели OpenAI: от корневого вопроса о сложности задачи стрелки расходятся к трём подписанным прямоугольникам — большой GPT-5.5 для сложного reasoning, средний терракотовый GPT-5.4 по умолчанию, компактный GPT-5.4 mini для массовых задач

Почему «универсал по умолчанию» экономит больше, чем кажется

Распространённая ошибка — ставить флагман «на всякий случай», чтобы точно хватило качества. На потоке это дорого. Допустим, продукт делает 300 000 запросов в месяц со средним входом 5K и выходом 1.5K токенов. Посчитаем счёт на разных моделях:

МодельВход/месВыход/месСтоимость/мес
GPT-5.5 (флагман)1.5B450M≈ 1 492 500 ₽
GPT-5.4 (универсал)1.5B450M≈ 736 500 ₽
GPT-5.4 mini (бюджет)1.5B450M≈ 219 000 ₽

Расчёт для GPT-5.4: 1500M входных токенов × 170 ₽ + 450M выходных × 1070 ₽ = 255 000 + 481 500 = 736 500 ₽. Переход с флагмана на универсал на той же нагрузке режет счёт ровно вдвое — на 756 000 ₽ в месяц. Если часть этих запросов простая и переносится на mini, экономия ещё больше.

Отсюда — гибридная схема, которую строят многие команды: дешёвая модель на потоке, универсал в основе прода, флагман — только на тех запросах, где он реально нужен. Поскольку переключение модели — это одна строка кода, маршрутизировать запросы по сложности несложно. Сервисная комиссия Promptra (5%) при этом берётся один раз при пополнении баланса, а не с каждого запроса.

GPT-5.3 Codex: специализация под код

Если ваша основная нагрузка — генерация и ревью кода, в линейке OpenAI есть отдельная специализированная модель — GPT-5.3 Codex. Это не универсал, а модель, заточенная именно под код и code-review. Сравним её с GPT-5.4 по цене и параметрам.

ПараметрGPT-5.4GPT-5.3 Codex
Вход (₽/1M)170 ₽120 ₽
Выход (₽/1M)1070 ₽1000 ₽
Вход (USD/1M)$2.50$1.75
Выход (USD/1M)$15.00$14.00
Контекст1.05M400K
Макс. выход128K128K
Назначениеуниверсалкод, code-review

USD-прайс GPT-5.3 Codex — $1.75/$14 (источник — страница модели в документации OpenAI). По цене Codex чуть дешевле универсала и на входе (120 против 170 ₽), и на выходе (1000 против 1070 ₽). Главное отличие в характеристиках — контекст: у Codex 400K против 1.05M у GPT-5.4.

Практический вывод: если ваш сценарий — преимущественно кодинг (написание функций, рефакторинг, ревью pull request'ов, генерация тестов) и помещается в 400K контекста, Codex может оказаться выгоднее и точнее универсала за счёт специализации. Если же вы работаете с очень длинными кодовыми базами целиком (нужен контекст ближе к миллиону токенов) или ваша нагрузка смешанная (код + документы + чат), универсал GPT-5.4 удобнее: один model на все задачи и контекст в 2.6 раза шире. Для интеграции с инструментами разработки вроде Claude Code на своём ключе мы собрали отдельный гайд.

Лимиты, контекст и максимальный выход

Помимо цены, у GPT-5.4 есть архитектурные лимиты, которые важно учитывать при проектировании:

  • Контекстное окно — 1 050 000 токенов. Это суммарный объём «вход + всё, что модель удерживает в рамках запроса». На практике это позволяет загрузить очень крупный объём данных за один вызов — но помните про порог тарификации 272K на входе.
  • Максимум на выход — 128 000 токенов. Сколько модель может сгенерировать в одном ответе. 128K выходных токенов — это примерно 90–100 тысяч слов, объём небольшой книги. Для подавляющего большинства задач этого с огромным запасом, но если вы генерируете очень длинные структурированные документы, держите лимит в голове.
  • Входные модальности — текст и изображения. GPT-5.4 принимает на вход не только текст, но и изображения (например, скриншоты интерфейсов, диаграммы, фотографии документов). Выход — только текст.
  • Endpoints — chat и responses. Модель доступна через стандартный chat-completions API (совместимый с OpenAI SDK, как в примерах выше) и через responses API.

Если задача упирается в лимит выхода (нужно сгенерировать документ длиннее 128K токенов) — стандартное решение — разбивать генерацию на части с продолжением контекста, а не пытаться выжать всё в один вызов.

Сколько стоит GPT-5.4 в месяц: прикидка для команды

Чтобы цена в ₽ за миллион токенов превратилась в понятную цифру месячного бюджета, прикинем три профиля нагрузки. Допущения указаны рядом — подставьте свои.

ПрофильЗапросов/месСредний входСредний выходТокенов вход/месТокенов выход/месСтоимость/мес
Небольшой продукт50 0003K1K150M50M≈ 79 000 ₽
Средняя нагрузка300 0005K1.5K1.5B450M≈ 736 500 ₽
Кодинг-ассистент100 0006K4K600M400M≈ 530 000 ₽

Расчёт прямой: входные токены за месяц делим на миллион и умножаем на 170 ₽, выходные — на 1070 ₽, складываем. Например, для «небольшого продукта»: 150 × 170 + 50 × 1070 = 25 500 + 53 500 = 79 000 ₽.

Видно, что даже на средней нагрузке универсал обходится примерно в 736 500 ₽/мес против почти 1.5 млн ₽ на флагмане при тех же объёмах — двукратная разница. Именно поэтому осознанный выбор модели под задачу даёт больше экономии, чем поиск «агрегатора подешевле»: разрыв между уровнями моделей кратный, а наценка на токены у Promptra нулевая в обоих случаях.

Оплата и документы для юр.лица

Для команд в компаниях важна не только цена токена, но и то, как эти расходы проходят по бухгалтерии. Promptra принимает оплату на российское юр.лицо — ООО «ТРАФИК АГРЕГАТОР» (ИНН 9707022118) — с полным пакетом закрывающих документов: договор-оферта, счёт, акт, счёт-фактура, УПД. Документооборот идёт через ЭДО (Диадок, СБИС), что удобно для корпоративной бухгалтерии — документы автоматически проводятся в учётной системе.

Это принципиальное отличие от прямого доступа к OpenAI через VPN и виртуальные карты: при таком сценарии у вас на руках нет закрывающих документов российского формата, расход сложно корректно учесть, а аккаунт живёт до первого бана. Расходы на API без правильно оформленной первички не принимаются к учёту бизнеса. Подробно юридическую и бухгалтерскую сторону мы разобрали в гайде про OpenAI API в России — там и про оферту OpenAI, и про то, как расходы корректно ложатся в учёт компании.

FAQ

Сколько стоит GPT-5.4 в рублях?

Через Promptra — 170 ₽ за 1M входных токенов и 1070 ₽ за 1M выходных. Это прямой пересчёт прайса OpenAI ($2.5 и $15 за 1M) по курсу ЦБ РФ (71.668 ₽/$ на 27.05.2026), без наценки на токены. Фактический счёт считается по курсу ЦБ на день пополнения баланса. Сервисная комиссия 5% берётся отдельно — только при пополнении, а не с каждого запроса.

Чем GPT-5.4 отличается от GPT-5.5?

GPT-5.4 — универсал для большинства повседневных задач, GPT-5.5 — флагман для сложного reasoning и агентных пайплайнов. По цене разрыв двукратный: выход GPT-5.4 стоит 1070 ₽/1M против 2150 ₽/1M у флагмана. Контекст и максимум выхода у них одинаковые (1.05M и 128K). Брать 5.5 имеет смысл там, где 5.4 систематически ошибается; на большинстве задач разница в качестве не оправдывает удвоения цены.

Когда выбирать GPT-5.4 mini вместо GPT-5.4?

Когда задача массовая и простая: классификация, извлечение полей, модерация, короткие ответы, обработка очередей. Выход mini дешевле универсала в 3.3 раза (320 ₽ против 1070 ₽ за 1M). Ограничение mini — контекст 400K вместо 1.05M, поэтому для очень длинных документов нужна старшая модель. Типичная схема: mini на потоке простых запросов, GPT-5.4 — в основе прода.

Как подключить GPT-5.4 из России без VPN?

Через OpenAI-совместимый endpoint Promptra. В коде на OpenAI SDK меняется один параметр — base_url на https://api.promptra.ru/v1, ключ OpenAI заменяется на ключ Promptra, остальной код не трогается. Модель указывается как gpt-5.4. Прямой доступ через VPN и зарубежные карты не нужен — запросы проксируются легально, а оплата идёт в рублях на юр.лицо.

Что значит «тарификация свыше 272K токенов» у GPT-5.4?

Если входной контекст запроса превышает 272 000 токенов, OpenAI переключает всю сессию на повышенную ставку: 2× за вход (340 ₽/1M) и 1.5× за выход (1605 ₽/1M). По двойной ставке оплачивается весь запрос целиком, а не только токены сверх порога. На длинных контекстах стоит либо держать вход под 272K через отбор контекста, либо заранее закладывать в бюджет повышенные ставки.

Что выбрать для кода — GPT-5.4 или GPT-5.3 Codex?

GPT-5.3 Codex — специализированная модель под код и code-review, чуть дешевле универсала (120/1000 ₽ против 170/1070 ₽). Если нагрузка преимущественно кодинг и помещается в 400K контекста — Codex выгоднее за счёт специализации. Если кодовые базы очень большие (нужен контекст ближе к 1M) или нагрузка смешанная (код + документы + чат) — удобнее универсал GPT-5.4: один model на все задачи и контекст в 2.6 раза шире.

Если вы хотите посчитать стоимость GPT-5.4 под вашу реальную нагрузку или обсудить подключение с закрывающими документами — напишите команде Promptra напрямую в Telegram: t.me/nesterov_av. Поможем прикинуть бюджет под ваш профиль запросов и подобрать модель — флагман там, где он нужен, универсал в основе прода и более дешёвую модель там, где её достаточно. Если хотите сначала сориентироваться в ландшафте моделей целиком — загляните в обзор топ-5 LLM 2026.

Promptra

Готовы попробовать Promptra?

Один API-ключ ко всем флагманским LLM. Оплата на юр.лицо, цены в рублях по курсу ЦБ. Тестовые токены бесплатно.

Promptra

Готовы попробовать Promptra?

Один API-ключ ко всем флагманским LLM. Оплата на юр.лицо, цены в рублях по курсу ЦБ. Тестовые токены бесплатно.