Генерация видео по API доступна из России через три топовые модели на одном OpenAI-совместимом endpoint: Google Veo 3.1, ByteDance Seedance 2.0 и Kling v3 от Kuaishou. Все три тарифицируются за секунду готового ролика, оплата идёт в рублях на российское юр.лицо с полным пакетом закрывающих документов через ЭДО. Стартовые ставки через Promptra: Seedance — от 3.58 ₽ за секунду (480p), Kling v3 Standard — от 4.52 ₽ за секунду (720p), Veo 3.1 — 28.67 ₽ за секунду (720p–1080p). Это цены 1-в-1 с прайсом провайдеров по курсу ЦБ РФ, без наценки на секунды.
Коротко, кому что: Veo 3.1 — премиум-качество и единственная из трёх с генерацией звуковой дорожки, берут под рекламу и продакшен, где картинка решает. Seedance 2.0 — баланс цены и качества, самый дешёвый вход (от 3.58 ₽/с), мультимодальный приём на входе (текст, изображение, видео, аудио). Kling v3 — сильный motion control: явное управление движением камеры и объектов, удобно когда нужна предсказуемая динамика. Ниже — полные таблицы цен из каталога, расчёт стоимости 5-секундного ролика для каждой модели, разбор text-to-video против image-to-video и как подключить видео-API из России без VPN. Все цены — на 2026-05-29.
Видео-API: голубой океан для российских команд
Прежде чем сравнивать модели, стоит сказать главное про рынок. Текстовые LLM (GPT, Claude, Gemini) через российские агрегаторы доступны давно и у многих. А вот видео-генерация по API почти никем в РФ не покрыта: конкуренты-агрегаторы либо вообще не дают доступ к Veo/Seedance/Kling по API, либо ограничиваются веб-интерфейсом с ручной выгрузкой роликов. Для команды, которой нужно встроить генерацию видео в продукт или пайплайн — в SaaS, в маркетинговую автоматизацию, в конвейер UGC-контента — это означает выбор из VPN-костылей и зарубежных карт.
Promptra даёт эти три модели через тот же OpenAI-совместимый шлюз, что и текстовые LLM, с оплатой в рублях и закрывающими документами. То есть видео-генерацию можно подключить так же, как вы подключаете чат-модель: один base_url, один ключ, оплата на юр.лицо. Отдельный договор, отдельная интеграция, отдельный валютный платёж за рубеж не нужны.
Это важный нюанс именно для бизнеса: видео-генерация дорогая по сравнению с текстом (секунда 1080p Veo стоит как сотни тысяч токенов GPT-5.4), поэтому расход обязан корректно проходить по бухгалтерии. О документах — в конце статьи.

Три модели: чем отличаются и кому что
У всех трёх моделей одна выходная модальность — видео, и общий способ тарификации — за секунду готового ролика. Различия — в качестве картинки, наличии звука, способах подачи на вход и в цене. Сведём в таблицу возможностей (данные из нашего каталога).
| Параметр | Veo 3.1 | Seedance 2.0 | Kling v3 Standard |
|---|---|---|---|
| Провайдер | ByteDance | Kuaishou | |
| Идентификатор | google/veo-3.1 | bytedance/seedance-2.0 | kwaivgi/kling-v3.0-std |
| Вход (модальности) | текст | текст, изображение, видео, аудио | текст |
| Генерация звука | да | нет | нет |
| Максимальное разрешение | 4K | 1080p | 1080p |
| Старт цены (₽/с) | 28.67 ₽ (720p) | 3.58 ₽ (480p) | 4.52 ₽ (720p) |
| Позиционирование | премиум-качество + аудио | баланс / дёшево | motion control |
Дальше — по каждой модели подробно: что это, в чём сильна, цена в рублях и долларах из каталога.
Veo 3.1 — премиум-качество и звук
Veo 3.1 — флагманская модель видео-генерации Google и самая дорогая из трёх. Её отличает топовое качество картинки и единственная среди наших видео-моделей генерация звуковой дорожки: модель умеет синтезировать к ролику звук, а не только немое видео. Это закрывает сценарии, где нужна готовая сцена со звуком за один проход — короткая реклама, презентационные вставки, сцены с речью или фоновым звуком.
Базовое разрешение — 720p и 1080p по одной ставке, отдельно есть тариф 4K. Вход — текстовый (text-to-video); для image-to-video в каталоге есть отдельный вариант google/veo-3.1-i2v по той же посекундной ставке. Цены из каталога — это прямой пересчёт официального прайса Google по курсу ЦБ.
| Разрешение | Цена Google (USD/с) | Цена Promptra (₽/с) |
|---|---|---|
| 720p | $0.40 | 28.67 ₽ |
| 1080p | $0.40 | 28.67 ₽ |
| 4K | $0.60 | 43.00 ₽ |
Источник цен — официальный прайс Gemini API / Veo. У Google есть и более дешёвый Fast-вариант Veo со значительной скидкой, но в нашем каталоге как флагман заведена именно Standard-версия с топовым качеством.
Берите Veo 3.1, когда картинка и звук решают, а бюджет на секунду вторичен: рекламные ролики, продуктовые тизеры, сцены, которые пойдут на внешнюю аудиторию. Для массового потока дешёвого контента это избыточно дорого — там уместнее Seedance.
Seedance 2.0 — баланс и самый дешёвый вход
Seedance 2.0 от ByteDance — модель «золотой середины»: качество, достаточное для большинства задач, при самой низкой стартовой цене из трёх. Секунда 480p стоит 3.58 ₽ — почти в восемь раз дешевле секунды Veo. ByteDance анонсировала Seedance как наступление «эры одного юаня за секунду», и по нашему каталогу это близко к правде на нижних разрешениях.
Ещё одна сильная сторона — самый богатый вход среди трёх моделей: Seedance принимает текст, изображение, видео и аудио. То есть в одной линейке закрываются и text-to-video, и image-to-video (bytedance/seedance-2.0-i2v), и редактирование (seedance-2.0-edit), и расширение существующего ролика (seedance-2.0-extend) — последние два по сниженной ставке video-input тарифа.
| Разрешение | Цена (USD/с) | Цена Promptra (₽/с) |
|---|---|---|
| 480p | $0.05 | 3.58 ₽ |
| 720p | $0.14 | 10.03 ₽ |
| 1080p | $0.34 | 24.37 ₽ |
Тарификация Volcengine (платформа ByteDance) исходно посчитана по токенам (46 CNY за 1M токенов на чистую генерацию), посекундные ставки по разрешениям выведены из публичного листинга doubao-seedance-2-0. Первоисточник по ценам — документация Volcengine.
Берите Seedance, когда нужен объём контента при контролируемом бюджете: UGC-конвейеры, превью, A/B-варианты роликов, внутренние демо, прототипы. Заметьте, что 1080p Seedance (24.37 ₽/с) почти догоняет по цене 1080p Veo (28.67 ₽/с) — преимущество Seedance в цене наиболее велико на 480p и 720p.
Kling v3 — motion control
Kling v3 Standard от Kuaishou — модель с упором на управление движением. Помимо обычного text-to-video, в линейке есть отдельный режим Motion Control (kwaivgi/kling-v3.0-std-motion-control), который даёт явный контроль над движением камеры и объектов в кадре. Это решает частую боль видео-генерации — непредсказуемую «болтанку» камеры: когда нужна заданная траектория облёта, плавный наезд или конкретное направление движения, motion control экономит десятки переgenераций.
Базовый Standard-режим по цене встаёт между Seedance и Veo и дешевле Veo в несколько раз.
| Режим / разрешение | Цена (USD/с) | Цена Promptra (₽/с) |
|---|---|---|
| Standard 720p | $0.063 | 4.52 ₽ |
| Standard 1080p | $0.084 | 6.02 ₽ |
| Motion Control 720p | $0.084 | 6.02 ₽ |
| Motion Control 1080p | $0.1134 | 8.13 ₽ |
Источник — официальный прайс Kling; внутренняя тарификация считается в кредитах (Standard 1080p без звука — 8 кредитов/с), Motion Control добавляет +2 кредита/с поверх базового тарифа. Image-to-video (kwaivgi/kling-v3.0-std-i2v) идёт по той же посекундной ставке, что и text-to-video Standard.
Берите Kling, когда важна предсказуемая динамика кадра: облёты товара, заданные движения камеры, анимация с контролируемой траекторией. По цене 1080p (6.02 ₽/с) Kling существенно дешевле 1080p Veo (28.67 ₽/с), хотя и без генерации звука.
Сколько стоит ролик: расчёт на 5 секунд
Посекундная ставка превращается в понятную цифру, как только её умножить на длину ролика. Возьмём типовой короткий ролик — 5 секунд — и посчитаем стоимость для каждой модели и разрешения. Арифметика прямая: ставка ₽/с × длительность в секундах.
| Модель | Разрешение | Ставка (₽/с) | Ролик 5 секунд |
|---|---|---|---|
| Seedance 2.0 | 480p | 3.58 ₽ | ≈ 17.90 ₽ |
| Kling v3 Standard | 720p | 4.52 ₽ | ≈ 22.60 ₽ |
| Kling v3 Standard | 1080p | 6.02 ₽ | ≈ 30.10 ₽ |
| Seedance 2.0 | 720p | 10.03 ₽ | ≈ 50.15 ₽ |
| Seedance 2.0 | 1080p | 24.37 ₽ | ≈ 121.85 ₽ |
| Veo 3.1 | 720p–1080p | 28.67 ₽ | ≈ 143.35 ₽ |
| Veo 3.1 | 4K | 43.00 ₽ | ≈ 215.00 ₽ |
Разброс показателен: самый дешёвый 5-секундный ролик (Seedance 480p) стоит около 18 ₽, самый дорогой (Veo 4K) — около 215 ₽, разница примерно в 12 раз. Для прикидки месячного бюджета: тысяча 5-секундных роликов на Seedance 480p — около 18 000 ₽, та же тысяча на Veo 1080p — около 143 000 ₽.
Отсюда практический вывод по экономике: подбирайте модель и разрешение под назначение ролика. Черновики, превью и массовый внутренний контент — на дешёвых тарифах Seedance/Kling; финальные ролики на внешнюю аудиторию, где важны картинка и звук — на Veo. Многие команды строят двухступенчатую схему: дешёвая модель на этапе перебора идей и раскадровки, премиальная — только на финальный рендер отобранного варианта. Сервисная комиссия Promptra (5%) при этом берётся один раз при пополнении баланса, а не с каждого ролика.

Text-to-video и image-to-video: в чём разница
У видео-моделей два базовых способа подачи запроса, и важно понимать, чем они отличаются — это влияет и на результат, и на выбор модели.
Text-to-video (текст в видео) — модель генерирует ролик с нуля по текстовому описанию сцены. Вы пишете промпт («дрон облетает горный хребет на рассвете, тёплый свет»), модель синтезирует кадры целиком. Так работают базовые google/veo-3.1, bytedance/seedance-2.0 и kwaivgi/kling-v3.0-std. Это максимальная свобода, но и максимальная непредсказуемость композиции — вы не задаёте исходную картинку.
Image-to-video (изображение в видео) — на вход подаётся стартовый кадр (картинка), и модель «оживляет» его, достраивая движение. Это удобно, когда есть готовый визуал — фото товара, сгенерированная ранее картинка, кадр из брендбука — и нужно привести его в движение, сохранив композицию. В каталоге для этого есть отдельные варианты: google/veo-3.1-i2v, bytedance/seedance-2.0-i2v, kwaivgi/kling-v3.0-std-i2v. Посекундная ставка у i2v-вариантов та же, что у базовых text-to-video.
Связка работает особенно хорошо в паре с генерацией изображений: сначала вы получаете идеальный кадр через image-модель, потом анимируете его через i2v. Про генерацию картинок по API — Nano Banana Pro и GPT Image 2 — у нас есть отдельный разбор: генерация изображений по API за рубли. Seedance вдобавок умеет принимать на вход и видео (режимы edit/extend) — редактировать и продлевать готовые ролики.

Как подключить видео-API из России
Технически видео-модели через Promptra подключаются по тому же принципу, что и текстовые: совместимый с OpenAI endpoint, меняется base_url, ключ OpenAI заменяется ключом Promptra. Разница — в том, что генерация видео асинхронная: ролик рендерится не мгновенно, поэтому работа идёт в два шага — сначала задача отправляется (submit), потом по идентификатору опрашивается её статус (task), пока видео не будет готово. В каталоге у видео-моделей для этого есть endpoints videos_submit и videos_task.
Базовый запрос на генерацию (отправка задачи):
curl https://api.promptra.ru/v1/videos/submit \
-H "Authorization: Bearer prm-xxxxxxxxxxxx" \
-H "Content-Type: application/json" \
-d '{
"model": "bytedance/seedance-2.0",
"prompt": "дрон облетает горный хребет на рассвете, тёплый свет",
"resolution": "720p",
"duration": 5
}'В ответ приходит идентификатор задачи. Затем опрашиваем её статус, пока не вернётся ссылка на готовый ролик:
curl https://api.promptra.ru/v1/videos/task/TASK_ID \
-H "Authorization: Bearer prm-xxxxxxxxxxxx"То же на Python — с простым ожиданием готовности:
import os, time, httpx
BASE = "https://api.promptra.ru/v1"
KEY = os.environ["PROMPTRA_API_KEY"] # ключ Promptra
headers = {"Authorization": f"Bearer {KEY}"}
# 1. Отправляем задачу на генерацию
submit = httpx.post(
f"{BASE}/videos/submit",
headers=headers,
json={
"model": "google/veo-3.1",
"prompt": "дрон облетает горный хребет на рассвете, тёплый свет",
"resolution": "1080p",
"duration": 5,
},
).json()
task_id = submit["id"]
# 2. Ждём готовности и забираем ссылку на ролик
while True:
task = httpx.get(f"{BASE}/videos/task/{task_id}", headers=headers).json()
if task["status"] == "completed":
print("Готово:", task["video_url"])
break
time.sleep(5)Точные имена полей в ответе зависят от конкретной модели — ориентируйтесь на фактический JSON, который вернёт endpoint. Принцип одинаков для всех трёх моделей: меняете model на нужный идентификатор (google/veo-3.1, bytedance/seedance-2.0, kwaivgi/kling-v3.0-std), а схема submit → poll → download остаётся той же.
Почему этот путь надёжнее прямого доступа через VPN и зарубежные карты, мы подробно разбирали в гайде про OpenAI API в России: там и про блокировки аккаунтов, и про риски карт, и про юридическую сторону — те же аргументы целиком применимы к видео-моделям Google, ByteDance и Kuaishou.

Какую модель выбрать: короткая шпаргалка
Свяжем всё вместе. Выбор сводится к трём вопросам: нужен ли звук, насколько важна предсказуемость движения и каков бюджет на секунду.
- Нужен звук в ролике → только Veo 3.1 (единственная из трёх генерирует звуковую дорожку).
- Нужно топовое качество картинки на внешнюю аудиторию, бюджет вторичен → Veo 3.1, при необходимости 4K.
- Нужен объём контента при минимальной цене → Seedance 2.0, особенно на 480p/720p (от 3.58 ₽/с).
- Нужен богатый вход (анимировать картинку, редактировать или продлить видео) → Seedance 2.0 (принимает текст, изображение, видео, аудио).
- Нужна предсказуемая динамика и управление камерой → Kling v3 в режиме Motion Control.
- Нужно дешёвое 1080p без звука → Kling v3 Standard (6.02 ₽/с против 28.67 ₽/с у Veo).
На практике многие команды используют не одну модель, а связку: перебирают идеи на дешёвой Seedance, финальный ролик со звуком рендерят на Veo, а сцены с заданным движением камеры — на Kling. Поскольку все три доступны через один endpoint и один баланс, переключение между ними — это смена строки model в запросе.
Оплата и документы для юр.лица
Видео-генерация — заметная статья расходов (тысячи рублей в месяц на активном использовании), поэтому для команды в компании важно, как эти траты проходят по бухгалтерии. Promptra принимает оплату на российское юр.лицо — ООО «ТРАФИК АГРЕГАТОР» (ИНН 9707022118) — с полным пакетом закрывающих документов: договор-оферта, счёт, акт, счёт-фактура, УПД. Документооборот идёт через ЭДО (Диадок, СБИС) — документы автоматически проводятся в учётной системе.
Это принципиальное отличие от прямого доступа к Google, ByteDance или Kuaishou через VPN и зарубежные карты: при таком сценарии у вас на руках нет закрывающих документов российского формата, расход на видео-генерацию сложно корректно учесть, а аккаунт живёт до первого бана. Расходы без правильно оформленной первички не принимаются к учёту бизнеса. Юридическую и бухгалтерскую сторону работы с зарубежными нейросетями мы разобрали в гайде про легальность работы с AI API на юр.лицо.
FAQ
Сколько стоит сгенерировать видео по API в рублях?
Тарификация посекундная. Через Promptra: Seedance 2.0 — от 3.58 ₽/с (480p) до 24.37 ₽/с (1080p), Kling v3 Standard — 4.52 ₽/с (720p) и 6.02 ₽/с (1080p), Veo 3.1 — 28.67 ₽/с (720p–1080p) и 43 ₽/с (4K). Ролик на 5 секунд: от ≈18 ₽ (Seedance 480p) до ≈215 ₽ (Veo 4K). Это цены 1-в-1 с прайсом провайдеров по курсу ЦБ РФ, без наценки на секунды; сервисная комиссия 5% берётся только при пополнении баланса.
Какая модель лучше — Veo, Seedance или Kling?
Зависит от задачи. Veo 3.1 — премиум-качество и единственная с генерацией звука, под рекламу и продакшен. Seedance 2.0 — самый дешёвый вход и богатый приём данных (текст, изображение, видео, аудио), под объём контента. Kling v3 — motion control, под предсказуемое движение камеры и объектов. Если нужен звук — только Veo; если нужен объём дёшево — Seedance; если нужна заданная динамика — Kling.
Можно ли генерировать видео из изображения (image-to-video)?
Да. У всех трёх моделей есть отдельные image-to-video варианты: google/veo-3.1-i2v, bytedance/seedance-2.0-i2v, kwaivgi/kling-v3.0-std-i2v. На вход подаётся стартовый кадр, модель «оживляет» его, сохраняя композицию. Посекундная ставка у i2v та же, что у базового text-to-video. Удобно в связке с генерацией изображений: сначала картинка через image-модель, потом анимация через i2v.
Какая из моделей умеет генерировать звук?
Из трёх — только Veo 3.1. Она синтезирует звуковую дорожку к ролику за один проход. Seedance 2.0 и Kling v3 генерируют немое видео — звук к ним добавляется отдельно на монтаже. Если нужна готовая сцена со звуком из одного запроса, выбирайте Veo.
Как подключить генерацию видео из России без VPN?
Через OpenAI-совместимый endpoint Promptra. Генерация видео асинхронная: задача отправляется на https://api.promptra.ru/v1/videos/submit, затем по идентификатору опрашивается статус на /videos/task/{id}, пока не вернётся ссылка на готовый ролик. В коде меняется base_url и ключ; модель указывается строкой model (google/veo-3.1, bytedance/seedance-2.0, kwaivgi/kling-v3.0-std). Прямой доступ через VPN и зарубежные карты не нужен — оплата идёт в рублях на юр.лицо.
Сколько стоит ролик на 5 секунд в 1080p?
По нашему каталогу: Kling v3 Standard 1080p — ≈30.10 ₽ (6.02 ₽/с × 5), Seedance 2.0 1080p — ≈121.85 ₽ (24.37 ₽/с × 5), Veo 3.1 1080p — ≈143.35 ₽ (28.67 ₽/с × 5). То есть в одном и том же 1080p самый дешёвый вариант — Kling (без звука, с motion control), самый дорогой — Veo (с генерацией звука и топовой картинкой).
Если вы хотите прикинуть бюджет видео-генерации под ваш объём роликов, подобрать модель под конкретный сценарий или оформить доступ на юр.лицо с закрывающими документами — напишите команде Promptra в Telegram. Поможем посчитать стоимость под ваш профиль и подобрать модель: Veo там, где нужны качество и звук, Seedance и Kling — где важнее цена и контроль движения. А чтобы выбрать ещё и текстовую модель под задачу, посмотрите разбор топ-5 LLM 2026.
Promptra
Готовы попробовать Promptra?
Один API-ключ ко всем флагманским LLM. Оплата на юр.лицо, цены в рублях по курсу ЦБ. Тестовые токены бесплатно.
Promptra
Готовы попробовать Promptra?
Один API-ключ ко всем флагманским LLM. Оплата на юр.лицо, цены в рублях по курсу ЦБ. Тестовые токены бесплатно.
