GPT-5.4 — рабочая лошадка линейки OpenAI: модель, которая закрывает большинство повседневных задач за половину цены флагмана. Через Promptra она стоит 170 ₽ за 1M входных токенов и 1070 ₽ за 1M выходных — это цена 1-в-1 с прайсом OpenAI ($2.5 и $15 соответственно) по курсу ЦБ РФ на 27.05.2026 (71.668 ₽/$), без наценки на токены. Контекстное окно — 1 050 000 токенов, максимум на выход — 128 000 токенов. Подключение занимает пять минут: в коде на OpenAI SDK меняется один параметр base_url на https://api.promptra.ru/v1, остальной код остаётся прежним. Оплата идёт на российское юр.лицо с полным пакетом закрывающих документов через ЭДО.
Главный практический вопрос по GPT-5.4 — не «хорошая ли это модель», а «где проходит граница, за которой нужен флагман GPT-5.5, а где хватит дешёвой GPT-5.4 mini». Ответ короткий: GPT-5.4 — точка по умолчанию для прода. Берите её, если не уверены, какая модель нужна; поднимайте до 5.5 там, где 5.4 систематически ошибается, и опускайте до mini там, где задача массовая и простая. Ниже разберём цену в рублях на конкретных сценариях, нюанс тарификации длинных контекстов, выбор между тремя моделями и специализированную GPT-5.3 Codex для кода. Все цены — на 2026-05-29.
Что такое GPT-5.4 и для каких задач
GPT-5.4 — это универсальная модель OpenAI, которую сам провайдер описывает как лучший выбор для chat и общих задач. В отличие от флагманской GPT-5.5, заточенной под предельно сложный reasoning, GPT-5.4 спроектирована как «крепкий середняк» — модель, которая даёт качественный результат на широком спектре задач при цене вдвое ниже флагмана.
На практике GPT-5.4 закрывает порядка 80% реальных сценариев продуктовой разработки:
- Генерация и рефакторинг кода средней сложности — написать функцию, разобрать стек-трейс, переписать модуль, объяснить чужой код.
- Развёрнутые текстовые ответы — ассистенты для сотрудников, генерация черновиков, суммаризация документов и переписки.
- Работа с документами — извлечение структуры из PDF, ответы по содержанию договоров и регламентов, перевод и адаптация текстов.
- RAG-сценарии — ответы по корпоративной базе знаний, где контекст подаётся в промпт, а модель формулирует ответ.
- Чат-ассистенты — внутренние помощники, поддержка первой линии, диалоговые сценарии.
Поднимать задачу до флагмана GPT-5.5 имеет смысл там, где 5.4 начинает «срываться»: путает требования в длинном ТЗ, теряет нить в многофайловом рефакторинге, выдаёт правдоподобный, но неверный ответ на вопрос с длинной цепочкой рассуждений. На таких задачах разница в качестве оправдывает удвоение цены выхода. На всём остальном — нет.
Ключевые технические характеристики из нашего каталога:
| Параметр | Значение |
|---|---|
| Идентификатор модели | gpt-5.4 |
| Провайдер | OpenAI |
| Контекстное окно | 1 050 000 токенов |
| Максимум на выход | 128 000 токенов |
| Модальности входа | текст, изображения |
| Модальности выхода | текст |
| Endpoints | chat, responses |
Миллион токенов контекста — это ориентировочно 700–750 тысяч слов русского текста или примерно 50 000 строк кода. На практике в одно окно влезает кодовая база среднего сервиса целиком, годовой архив переписки или несколько объёмных PDF-договоров. Контекст у GPT-5.4 идентичен флагману GPT-5.5 (обе модели — 1.05M), так что по объёму данных, который можно подать за один вызов, универсал не уступает флагману. Разница — в глубине рассуждения и в цене.
Цена GPT-5.4 в рублях: полная таблица
Promptra не накручивает наценку на токены. Стоимость модели равна официальному прайсу OpenAI, пересчитанному в рубли по курсу ЦБ РФ. Сервисная комиссия 5% берётся только при пополнении баланса, а не с каждого запроса, поэтому в расчётах за токены её нет. Базовый прайс OpenAI публикуется на странице прайс-листа OpenAI.
| Тип токенов | Цена OpenAI (USD за 1M) | Цена Promptra (₽ за 1M) |
|---|---|---|
| Вход (input) | $2.50 | 170 ₽ |
| Выход (output) | $15.00 | 1070 ₽ |
Курс пересчёта: 1 USD = 71.668 ₽ (ЦБ РФ на 27.05.2026). Точная арифметика: $2.5 × 71.668 = 179.17 ₽, $15 × 71.668 = 1075.02 ₽. В каталоге значения округлены до 170 и 1070 ₽ — фактический счёт считается по курсу ЦБ на день пополнения, поэтому в разные дни рублёвая цифра слегка плавает вслед за курсом, а долларовая ставка остаётся фиксированной.
Чтобы понимать порядок расходов, прикинем стоимость типовых сценариев. Соотношение вход/выход в реальной нагрузке обычно смещено в сторону входа (длинный промпт + контекст, короткий ответ).
| Сценарий | Вход | Выход | Стоимость |
|---|---|---|---|
| Короткий чат-запрос | 1K | 0.5K | ≈ 0.7 ₽ |
| Анализ документа на 50 страниц | 40K | 4K | ≈ 11.1 ₽ |
| Развёрнутый ответ ассистента | 4K | 6K | ≈ 7.1 ₽ |
| RAG-ответ по базе знаний | 80K | 2K | ≈ 15.7 ₽ |
Цифры приблизительные и зависят от точного количества токенов в ваших данных. Считаются они просто: (входные_токены / 1 000 000 × 170) + (выходные_токены / 1 000 000 × 1070). Реальный расход всегда видно в дашборде по факту запроса, а оценить заранее можно через официальный токенайзер OpenAI — он показывает, на сколько токенов разобьётся конкретный текст.

Нюанс тарификации свыше 272K: тот же порог, что у флагмана
Как и у флагманской GPT-5.5, у GPT-5.4 есть правило тарификации длинных контекстов, которое легко упустить из виду при планировании бюджета. OpenAI указывает в pricing-документации: если входной контекст запроса превышает 272 000 токенов, тарификация всей сессии переключается на повышенную ставку — 2× за вход и 1.5× за выход.
Критичный момент: это не «доплата за токены сверх порога». Это смена ставки для всего запроса целиком. Если вы отправили 280K входных токенов, по двойной ставке оплачиваются все 280K, а не только 8K, которые превысили лимит. И выход этого же запроса считается по ставке 1.5×, даже если на выход пришлась пара тысяч токенов.
Посчитаем разницу в рублях:
| Режим | Вход (₽ за 1M) | Выход (₽ за 1M) |
|---|---|---|
| Обычный (вход до 272K) | 170 ₽ | 1070 ₽ |
| Повышенный (вход свыше 272K) | 340 ₽ | 1605 ₽ |
Повышенные ставки — это $5/1M на вход ($2.5 × 2) и $22.5/1M на выход ($15 × 1.5), в рублях по курсу ЦБ примерно 340 и 1605 ₽. Иными словами, как только запрос пересекает порог 272K на входе, каждый его токен дорожает: входной вдвое, выходной в полтора раза.
Покажем на конкретном примере, насколько обиден этот «прыжок через порог». Возьмём два почти одинаковых запроса:
| Запрос | Вход | Выход | Ставка входа | Ставка выхода | Стоимость |
|---|---|---|---|---|---|
| A — под порогом | 270K | 5K | 170 ₽ | 1070 ₽ | ≈ 51.2 ₽ |
| B — над порогом | 275K | 5K | 340 ₽ | 1605 ₽ | ≈ 101.5 ₽ |
Разница во входных токенах между запросами — всего 5 тысяч (менее 2%), а счёт почти удвоился: с 51 до 102 ₽. Причина — переход всего запроса на повышенный тариф.
Практический вывод тот же, что и для флагмана: держите вход под 272K через грамотный отбор контекста (retrieval), а если контекст принципиально большой — закладывайте в бюджет повышенные ставки 340/1605 ₽ за 1M заранее, чтобы фактический счёт не оказался вдвое выше плановых ожиданий. Там, где документы можно обрабатывать секциями, два запроса по 200K дешевле одного на 400K примерно вдвое по входу. Подробнее этот же механизм с расчётами на флагманских ставках мы разбирали в статье про GPT-5.5 API за рубли.
Как подключить GPT-5.4 из России: drop-in через OpenAI SDK
Технически GPT-5.4 через Promptra подключается так же, как напрямую через OpenAI — потому что API совместим с OpenAI на уровне протокола. Меняется ровно один параметр: base_url. Ключ OpenAI заменяется на ключ Promptra, всё остальное в коде остаётся прежним.
Python
from openai import OpenAI
client = OpenAI(
api_key="prm-xxxxxxxxxxxx", # ключ Promptra
base_url="https://api.promptra.ru/v1", # единственное изменение
)
response = client.chat.completions.create(
model="gpt-5.4",
messages=[
{"role": "system", "content": "Ты — ассистент инженера."},
{"role": "user", "content": "Перепиши эту функцию без рекурсии."},
],
)
print(response.choices[0].message.content)Node.js
import OpenAI from "openai";
const client = new OpenAI({
apiKey: "prm-xxxxxxxxxxxx",
baseURL: "https://api.promptra.ru/v1", // единственное изменение
});
const response = await client.chat.completions.create({
model: "gpt-5.4",
messages: [
{ role: "system", content: "Ты — ассистент инженера." },
{ role: "user", content: "Перепиши эту функцию без рекурсии." },
],
});
console.log(response.choices[0].message.content);Хорошая практика: base_url в переменной окружения
Чтобы не зашивать endpoint в код и иметь возможность переключиться за секунды, держите base_url и ключ в .env:
import os
from openai import OpenAI
# В .env:
# OPENAI_API_KEY=prm-xxxxxxxxxxxx
# OPENAI_BASE_URL=https://api.promptra.ru/v1
client = OpenAI(
api_key=os.environ["OPENAI_API_KEY"],
base_url=os.environ["OPENAI_BASE_URL"],
)
response = client.chat.completions.create(
model="gpt-5.4",
messages=[{"role": "user", "content": "Привет"}],
)Проверить, что подключение работает, можно одним curl-запросом без всякого SDK:
curl https://api.promptra.ru/v1/chat/completions \
-H "Authorization: Bearer prm-xxxxxxxxxxxx" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-5.4",
"messages": [{"role": "user", "content": "ping"}]
}'Если в ответ пришёл JSON с полем choices — модель отвечает, можно подключать в продакшен. Отдельный плюс drop-in-подхода: переключение между моделями — это смена одной строки model. Сегодня прод работает на gpt-5.4, завтра вы поднимаете критичный пайплайн на gpt-5.5, а массовую очередь опускаете на gpt-5.4-mini — код при этом не меняется. Почему этот путь надёжнее прямого доступа через VPN и виртуальные карты — мы подробно разобрали в гайде про OpenAI API в России: там и про блокировки аккаунтов, и про риски карт, и про юридическую сторону.

GPT-5.4 vs GPT-5.5 vs GPT-5.4 mini: матрица выбора
Это центральный раздел статьи. В линейке OpenAI на конец мая 2026 три рабочие точки, и выбор между ними — это в первую очередь вопрос экономики, а не «качества вообще». Сведём их в таблицу (цены — из нашего каталога, 1-в-1 с прайсом OpenAI по курсу ЦБ).
| Модель | Вход (₽/1M) | Выход (₽/1M) | Контекст | Макс. выход | Роль |
|---|---|---|---|---|---|
| GPT-5.5 | 350 ₽ | 2150 ₽ | 1.05M | 128K | Флагман: сложный reasoning, агенты |
| GPT-5.4 | 170 ₽ | 1070 ₽ | 1.05M | 128K | Универсал: chat, общие задачи, прод |
| GPT-5.4 mini | 50 ₽ | 320 ₽ | 400K | 128K | Массовые запросы, автоматизация |
USD-прайс для справки: GPT-5.5 — $5/$30, GPT-5.4 — $2.5/$15, GPT-5.4 mini — $0.75/$4.5 (источник — прайс-лист OpenAI).
Цифры показывают разрывы наглядно. По выходу — самому весомому компоненту счёта в большинстве задач — GPT-5.4 ровно вдвое дешевле флагмана GPT-5.5 и примерно в 3.3 раза дороже mini. По входу: GPT-5.4 вдвое дешевле флагмана и в 3.4 раза дороже mini. То есть GPT-5.4 сидит ровно посередине ценовой лестницы — и это делает её естественной точкой по умолчанию.
Берите GPT-5.4 (по умолчанию), когда: нужен крепкий универсал для большинства задач — генерация и рефакторинг кода средней сложности, развёрнутые ответы, работа с документами, чат-ассистенты для сотрудников, RAG. Это «рабочая лошадка», которая закрывает порядка 80% сценариев за половину цены флагмана. Если вы не уверены, какая модель нужна, — стартуйте с 5.4 и корректируйте по факту.
Поднимайте до GPT-5.5, когда: задача требует глубокого многошагового рассуждения, и цена ошибки выше цены токенов. Сложный код с длинными зависимостями, агентные пайплайны с планированием, анализ, где модель должна удерживать много условий одновременно. Сигнал к апгрейду — когда вы видите, что 5.4 систематически ошибается на вашем классе задач. Платите за глубину только там, где она реально работает. Полный разбор флагмана — в статье про GPT-5.5 API за рубли.
Опускайте до GPT-5.4 mini, когда: объём запросов большой, а каждая задача простая — классификация, извлечение полей, модерация, короткие ответы, обработка очередей. На потоке в миллионы запросов экономия против универсала ощутима: выход дешевле в 3.3 раза. Обратите внимание: у mini контекст 400K, а не 1.05M — для большинства массовых задач этого с запасом, но для обработки очень длинных документов потребуется старшая модель.

Почему «универсал по умолчанию» экономит больше, чем кажется
Распространённая ошибка — ставить флагман «на всякий случай», чтобы точно хватило качества. На потоке это дорого. Допустим, продукт делает 300 000 запросов в месяц со средним входом 5K и выходом 1.5K токенов. Посчитаем счёт на разных моделях:
| Модель | Вход/мес | Выход/мес | Стоимость/мес |
|---|---|---|---|
| GPT-5.5 (флагман) | 1.5B | 450M | ≈ 1 492 500 ₽ |
| GPT-5.4 (универсал) | 1.5B | 450M | ≈ 736 500 ₽ |
| GPT-5.4 mini (бюджет) | 1.5B | 450M | ≈ 219 000 ₽ |
Расчёт для GPT-5.4: 1500M входных токенов × 170 ₽ + 450M выходных × 1070 ₽ = 255 000 + 481 500 = 736 500 ₽. Переход с флагмана на универсал на той же нагрузке режет счёт ровно вдвое — на 756 000 ₽ в месяц. Если часть этих запросов простая и переносится на mini, экономия ещё больше.
Отсюда — гибридная схема, которую строят многие команды: дешёвая модель на потоке, универсал в основе прода, флагман — только на тех запросах, где он реально нужен. Поскольку переключение модели — это одна строка кода, маршрутизировать запросы по сложности несложно. Сервисная комиссия Promptra (5%) при этом берётся один раз при пополнении баланса, а не с каждого запроса.
GPT-5.3 Codex: специализация под код
Если ваша основная нагрузка — генерация и ревью кода, в линейке OpenAI есть отдельная специализированная модель — GPT-5.3 Codex. Это не универсал, а модель, заточенная именно под код и code-review. Сравним её с GPT-5.4 по цене и параметрам.
| Параметр | GPT-5.4 | GPT-5.3 Codex |
|---|---|---|
| Вход (₽/1M) | 170 ₽ | 120 ₽ |
| Выход (₽/1M) | 1070 ₽ | 1000 ₽ |
| Вход (USD/1M) | $2.50 | $1.75 |
| Выход (USD/1M) | $15.00 | $14.00 |
| Контекст | 1.05M | 400K |
| Макс. выход | 128K | 128K |
| Назначение | универсал | код, code-review |
USD-прайс GPT-5.3 Codex — $1.75/$14 (источник — страница модели в документации OpenAI). По цене Codex чуть дешевле универсала и на входе (120 против 170 ₽), и на выходе (1000 против 1070 ₽). Главное отличие в характеристиках — контекст: у Codex 400K против 1.05M у GPT-5.4.
Практический вывод: если ваш сценарий — преимущественно кодинг (написание функций, рефакторинг, ревью pull request'ов, генерация тестов) и помещается в 400K контекста, Codex может оказаться выгоднее и точнее универсала за счёт специализации. Если же вы работаете с очень длинными кодовыми базами целиком (нужен контекст ближе к миллиону токенов) или ваша нагрузка смешанная (код + документы + чат), универсал GPT-5.4 удобнее: один model на все задачи и контекст в 2.6 раза шире. Для интеграции с инструментами разработки вроде Claude Code на своём ключе мы собрали отдельный гайд.
Лимиты, контекст и максимальный выход
Помимо цены, у GPT-5.4 есть архитектурные лимиты, которые важно учитывать при проектировании:
- Контекстное окно — 1 050 000 токенов. Это суммарный объём «вход + всё, что модель удерживает в рамках запроса». На практике это позволяет загрузить очень крупный объём данных за один вызов — но помните про порог тарификации 272K на входе.
- Максимум на выход — 128 000 токенов. Сколько модель может сгенерировать в одном ответе. 128K выходных токенов — это примерно 90–100 тысяч слов, объём небольшой книги. Для подавляющего большинства задач этого с огромным запасом, но если вы генерируете очень длинные структурированные документы, держите лимит в голове.
- Входные модальности — текст и изображения. GPT-5.4 принимает на вход не только текст, но и изображения (например, скриншоты интерфейсов, диаграммы, фотографии документов). Выход — только текст.
- Endpoints —
chatиresponses. Модель доступна через стандартный chat-completions API (совместимый с OpenAI SDK, как в примерах выше) и через responses API.
Если задача упирается в лимит выхода (нужно сгенерировать документ длиннее 128K токенов) — стандартное решение — разбивать генерацию на части с продолжением контекста, а не пытаться выжать всё в один вызов.
Сколько стоит GPT-5.4 в месяц: прикидка для команды
Чтобы цена в ₽ за миллион токенов превратилась в понятную цифру месячного бюджета, прикинем три профиля нагрузки. Допущения указаны рядом — подставьте свои.
| Профиль | Запросов/мес | Средний вход | Средний выход | Токенов вход/мес | Токенов выход/мес | Стоимость/мес |
|---|---|---|---|---|---|---|
| Небольшой продукт | 50 000 | 3K | 1K | 150M | 50M | ≈ 79 000 ₽ |
| Средняя нагрузка | 300 000 | 5K | 1.5K | 1.5B | 450M | ≈ 736 500 ₽ |
| Кодинг-ассистент | 100 000 | 6K | 4K | 600M | 400M | ≈ 530 000 ₽ |
Расчёт прямой: входные токены за месяц делим на миллион и умножаем на 170 ₽, выходные — на 1070 ₽, складываем. Например, для «небольшого продукта»: 150 × 170 + 50 × 1070 = 25 500 + 53 500 = 79 000 ₽.
Видно, что даже на средней нагрузке универсал обходится примерно в 736 500 ₽/мес против почти 1.5 млн ₽ на флагмане при тех же объёмах — двукратная разница. Именно поэтому осознанный выбор модели под задачу даёт больше экономии, чем поиск «агрегатора подешевле»: разрыв между уровнями моделей кратный, а наценка на токены у Promptra нулевая в обоих случаях.
Оплата и документы для юр.лица
Для команд в компаниях важна не только цена токена, но и то, как эти расходы проходят по бухгалтерии. Promptra принимает оплату на российское юр.лицо — ООО «ТРАФИК АГРЕГАТОР» (ИНН 9707022118) — с полным пакетом закрывающих документов: договор-оферта, счёт, акт, счёт-фактура, УПД. Документооборот идёт через ЭДО (Диадок, СБИС), что удобно для корпоративной бухгалтерии — документы автоматически проводятся в учётной системе.
Это принципиальное отличие от прямого доступа к OpenAI через VPN и виртуальные карты: при таком сценарии у вас на руках нет закрывающих документов российского формата, расход сложно корректно учесть, а аккаунт живёт до первого бана. Расходы на API без правильно оформленной первички не принимаются к учёту бизнеса. Подробно юридическую и бухгалтерскую сторону мы разобрали в гайде про OpenAI API в России — там и про оферту OpenAI, и про то, как расходы корректно ложатся в учёт компании.
FAQ
Сколько стоит GPT-5.4 в рублях?
Через Promptra — 170 ₽ за 1M входных токенов и 1070 ₽ за 1M выходных. Это прямой пересчёт прайса OpenAI ($2.5 и $15 за 1M) по курсу ЦБ РФ (71.668 ₽/$ на 27.05.2026), без наценки на токены. Фактический счёт считается по курсу ЦБ на день пополнения баланса. Сервисная комиссия 5% берётся отдельно — только при пополнении, а не с каждого запроса.
Чем GPT-5.4 отличается от GPT-5.5?
GPT-5.4 — универсал для большинства повседневных задач, GPT-5.5 — флагман для сложного reasoning и агентных пайплайнов. По цене разрыв двукратный: выход GPT-5.4 стоит 1070 ₽/1M против 2150 ₽/1M у флагмана. Контекст и максимум выхода у них одинаковые (1.05M и 128K). Брать 5.5 имеет смысл там, где 5.4 систематически ошибается; на большинстве задач разница в качестве не оправдывает удвоения цены.
Когда выбирать GPT-5.4 mini вместо GPT-5.4?
Когда задача массовая и простая: классификация, извлечение полей, модерация, короткие ответы, обработка очередей. Выход mini дешевле универсала в 3.3 раза (320 ₽ против 1070 ₽ за 1M). Ограничение mini — контекст 400K вместо 1.05M, поэтому для очень длинных документов нужна старшая модель. Типичная схема: mini на потоке простых запросов, GPT-5.4 — в основе прода.
Как подключить GPT-5.4 из России без VPN?
Через OpenAI-совместимый endpoint Promptra. В коде на OpenAI SDK меняется один параметр — base_url на https://api.promptra.ru/v1, ключ OpenAI заменяется на ключ Promptra, остальной код не трогается. Модель указывается как gpt-5.4. Прямой доступ через VPN и зарубежные карты не нужен — запросы проксируются легально, а оплата идёт в рублях на юр.лицо.
Что значит «тарификация свыше 272K токенов» у GPT-5.4?
Если входной контекст запроса превышает 272 000 токенов, OpenAI переключает всю сессию на повышенную ставку: 2× за вход (340 ₽/1M) и 1.5× за выход (1605 ₽/1M). По двойной ставке оплачивается весь запрос целиком, а не только токены сверх порога. На длинных контекстах стоит либо держать вход под 272K через отбор контекста, либо заранее закладывать в бюджет повышенные ставки.
Что выбрать для кода — GPT-5.4 или GPT-5.3 Codex?
GPT-5.3 Codex — специализированная модель под код и code-review, чуть дешевле универсала (120/1000 ₽ против 170/1070 ₽). Если нагрузка преимущественно кодинг и помещается в 400K контекста — Codex выгоднее за счёт специализации. Если кодовые базы очень большие (нужен контекст ближе к 1M) или нагрузка смешанная (код + документы + чат) — удобнее универсал GPT-5.4: один model на все задачи и контекст в 2.6 раза шире.
Если вы хотите посчитать стоимость GPT-5.4 под вашу реальную нагрузку или обсудить подключение с закрывающими документами — напишите команде Promptra напрямую в Telegram: t.me/nesterov_av. Поможем прикинуть бюджет под ваш профиль запросов и подобрать модель — флагман там, где он нужен, универсал в основе прода и более дешёвую модель там, где её достаточно. Если хотите сначала сориентироваться в ландшафте моделей целиком — загляните в обзор топ-5 LLM 2026.
Promptra
Готовы попробовать Promptra?
Один API-ключ ко всем флагманским LLM. Оплата на юр.лицо, цены в рублях по курсу ЦБ. Тестовые токены бесплатно.
Promptra
Готовы попробовать Promptra?
Один API-ключ ко всем флагманским LLM. Оплата на юр.лицо, цены в рублях по курсу ЦБ. Тестовые токены бесплатно.
