DEV Community

Promptra Team for Promptra

Posted on

Видео по API из России: Veo 3.1, Seedance 2.0 и Kling v3

Столбчатая диаграмма стоимости одной секунды видео в рублях у трёх моделей: Seedance 2.0, Kling v3 Standard и Veo 3.1, от самой дешёвой к премиальной

Генерация видео по API доступна из России через три топовые модели на одном OpenAI-совместимом endpoint: Google Veo 3.1, ByteDance Seedance 2.0 и Kling v3 от Kuaishou. Все три тарифицируются за секунду готового ролика, оплата идёт в рублях на российское юр.лицо с полным пакетом закрывающих документов через ЭДО. Стартовые ставки через Promptra: Seedance — от 3.58 ₽ за секунду (480p), Kling v3 Standard — от 4.52 ₽ за секунду (720p), Veo 3.1 — 28.67 ₽ за секунду (720p–1080p). Это цены 1-в-1 с прайсом провайдеров по курсу ЦБ РФ, без наценки на секунды.

Коротко, кому что: Veo 3.1 — премиум-качество и единственная из трёх с генерацией звуковой дорожки, берут под рекламу и продакшен, где картинка решает. Seedance 2.0 — баланс цены и качества, самый дешёвый вход (от 3.58 ₽/с), мультимодальный приём на входе (текст, изображение, видео, аудио). Kling v3 — сильный motion control: явное управление движением камеры и объектов, удобно когда нужна предсказуемая динамика. Ниже — полные таблицы цен из каталога, расчёт стоимости 5-секундного ролика для каждой модели, разбор text-to-video против image-to-video и как подключить видео-API из России без VPN. Все цены — на 2026-05-29.

Видео-API: голубой океан для российских команд

Прежде чем сравнивать модели, стоит сказать главное про рынок. Текстовые LLM (GPT, Claude, Gemini) через российские агрегаторы доступны давно и у многих. А вот видео-генерация по API почти никем в РФ не покрыта: конкуренты-агрегаторы либо вообще не дают доступ к Veo/Seedance/Kling по API, либо ограничиваются веб-интерфейсом с ручной выгрузкой роликов. Для команды, которой нужно встроить генерацию видео в продукт или пайплайн — в SaaS, в маркетинговую автоматизацию, в конвейер UGC-контента — это означает выбор из VPN-костылей и зарубежных карт.

Promptra даёт эти три модели через тот же OpenAI-совместимый шлюз, что и текстовые LLM, с оплатой в рублях и закрывающими документами. То есть видео-генерацию можно подключить так же, как вы подключаете чат-модель: один base_url, один ключ, оплата на юр.лицо. Отдельный договор, отдельная интеграция, отдельный валютный платёж за рубеж не нужны.

Это важный нюанс именно для бизнеса: видео-генерация дорогая по сравнению с текстом (секунда 1080p Veo стоит как сотни тысяч токенов GPT-5.4), поэтому расход обязан корректно проходить по бухгалтерии. О документах — в конце статьи.

Горизонтальная сравнительная схема: текстовые LLM покрыты многими российскими агрегаторами, видео-API через Veo, Seedance и Kling — почти никем, блок Promptra подсвечен терракотовым как закрывающий нишу

Три модели: чем отличаются и кому что

У всех трёх моделей одна выходная модальность — видео, и общий способ тарификации — за секунду готового ролика. Различия — в качестве картинки, наличии звука, способах подачи на вход и в цене. Сведём в таблицу возможностей (данные из нашего каталога).

Параметр Veo 3.1 Seedance 2.0 Kling v3 Standard
Провайдер Google ByteDance Kuaishou
Идентификатор google/veo-3.1 bytedance/seedance-2.0 kwaivgi/kling-v3.0-std
Вход (модальности) текст текст, изображение, видео, аудио текст
Генерация звука да нет нет
Максимальное разрешение 4K 1080p 1080p
Старт цены (₽/с) 28.67 ₽ (720p) 3.58 ₽ (480p) 4.52 ₽ (720p)
Позиционирование премиум-качество + аудио баланс / дёшево motion control

Дальше — по каждой модели подробно: что это, в чём сильна, цена в рублях и долларах из каталога.

Veo 3.1 — премиум-качество и звук

Veo 3.1 — флагманская модель видео-генерации Google и самая дорогая из трёх. Её отличает топовое качество картинки и единственная среди наших видео-моделей генерация звуковой дорожки: модель умеет синтезировать к ролику звук, а не только немое видео. Это закрывает сценарии, где нужна готовая сцена со звуком за один проход — короткая реклама, презентационные вставки, сцены с речью или фоновым звуком.

Базовое разрешение — 720p и 1080p по одной ставке, отдельно есть тариф 4K. Вход — текстовый (text-to-video); для image-to-video в каталоге есть отдельный вариант google/veo-3.1-i2v по той же посекундной ставке. Цены из каталога — это прямой пересчёт официального прайса Google по курсу ЦБ.

Разрешение Цена Google (USD/с) Цена Promptra (₽/с)
720p $0.40 28.67 ₽
1080p $0.40 28.67 ₽
4K $0.60 43.00 ₽

Источник цен — официальный прайс Gemini API / Veo. У Google есть и более дешёвый Fast-вариант Veo со значительной скидкой, но в нашем каталоге как флагман заведена именно Standard-версия с топовым качеством.

Берите Veo 3.1, когда картинка и звук решают, а бюджет на секунду вторичен: рекламные ролики, продуктовые тизеры, сцены, которые пойдут на внешнюю аудиторию. Для массового потока дешёвого контента это избыточно дорого — там уместнее Seedance.

Seedance 2.0 — баланс и самый дешёвый вход

Seedance 2.0 от ByteDance — модель «золотой середины»: качество, достаточное для большинства задач, при самой низкой стартовой цене из трёх. Секунда 480p стоит 3.58 ₽ — почти в восемь раз дешевле секунды Veo. ByteDance анонсировала Seedance как наступление «эры одного юаня за секунду», и по нашему каталогу это близко к правде на нижних разрешениях.

Ещё одна сильная сторона — самый богатый вход среди трёх моделей: Seedance принимает текст, изображение, видео и аудио. То есть в одной линейке закрываются и text-to-video, и image-to-video (bytedance/seedance-2.0-i2v), и редактирование (seedance-2.0-edit), и расширение существующего ролика (seedance-2.0-extend) — последние два по сниженной ставке video-input тарифа.

Разрешение Цена (USD/с) Цена Promptra (₽/с)
480p $0.05 3.58 ₽
720p $0.14 10.03 ₽
1080p $0.34 24.37 ₽

Тарификация Volcengine (платформа ByteDance) исходно посчитана по токенам (46 CNY за 1M токенов на чистую генерацию), посекундные ставки по разрешениям выведены из публичного листинга doubao-seedance-2-0. Первоисточник по ценам — документация Volcengine.

Берите Seedance, когда нужен объём контента при контролируемом бюджете: UGC-конвейеры, превью, A/B-варианты роликов, внутренние демо, прототипы. Заметьте, что 1080p Seedance (24.37 ₽/с) почти догоняет по цене 1080p Veo (28.67 ₽/с) — преимущество Seedance в цене наиболее велико на 480p и 720p.

Kling v3 — motion control

Kling v3 Standard от Kuaishou — модель с упором на управление движением. Помимо обычного text-to-video, в линейке есть отдельный режим Motion Control (kwaivgi/kling-v3.0-std-motion-control), который даёт явный контроль над движением камеры и объектов в кадре. Это решает частую боль видео-генерации — непредсказуемую «болтанку» камеры: когда нужна заданная траектория облёта, плавный наезд или конкретное направление движения, motion control экономит десятки переgenераций.

Базовый Standard-режим по цене встаёт между Seedance и Veo и дешевле Veo в несколько раз.

Режим / разрешение Цена (USD/с) Цена Promptra (₽/с)
Standard 720p $0.063 4.52 ₽
Standard 1080p $0.084 6.02 ₽
Motion Control 720p $0.084 6.02 ₽
Motion Control 1080p $0.1134 8.13 ₽

Источник — официальный прайс Kling; внутренняя тарификация считается в кредитах (Standard 1080p без звука — 8 кредитов/с), Motion Control добавляет +2 кредита/с поверх базового тарифа. Image-to-video (kwaivgi/kling-v3.0-std-i2v) идёт по той же посекундной ставке, что и text-to-video Standard.

Берите Kling, когда важна предсказуемая динамика кадра: облёты товара, заданные движения камеры, анимация с контролируемой траекторией. По цене 1080p (6.02 ₽/с) Kling существенно дешевле 1080p Veo (28.67 ₽/с), хотя и без генерации звука.

Сколько стоит ролик: расчёт на 5 секунд

Посекундная ставка превращается в понятную цифру, как только её умножить на длину ролика. Возьмём типовой короткий ролик — 5 секунд — и посчитаем стоимость для каждой модели и разрешения. Арифметика прямая: ставка ₽/с × длительность в секундах.

Модель Разрешение Ставка (₽/с) Ролик 5 секунд
Seedance 2.0 480p 3.58 ₽ ≈ 17.90 ₽
Kling v3 Standard 720p 4.52 ₽ ≈ 22.60 ₽
Kling v3 Standard 1080p 6.02 ₽ ≈ 30.10 ₽
Seedance 2.0 720p 10.03 ₽ ≈ 50.15 ₽
Seedance 2.0 1080p 24.37 ₽ ≈ 121.85 ₽
Veo 3.1 720p–1080p 28.67 ₽ ≈ 143.35 ₽
Veo 3.1 4K 43.00 ₽ ≈ 215.00 ₽

Разброс показателен: самый дешёвый 5-секундный ролик (Seedance 480p) стоит около 18 ₽, самый дорогой (Veo 4K) — около 215 ₽, разница примерно в 12 раз. Для прикидки месячного бюджета: тысяча 5-секундных роликов на Seedance 480p — около 18 000 ₽, та же тысяча на Veo 1080p — около 143 000 ₽.

Отсюда практический вывод по экономике: подбирайте модель и разрешение под назначение ролика. Черновики, превью и массовый внутренний контент — на дешёвых тарифах Seedance/Kling; финальные ролики на внешнюю аудиторию, где важны картинка и звук — на Veo. Многие команды строят двухступенчатую схему: дешёвая модель на этапе перебора идей и раскадровки, премиальная — только на финальный рендер отобранного варианта. Сервисная комиссия Promptra (5%) при этом берётся один раз при пополнении баланса, а не с каждого ролика.

Столбчатая диаграмма стоимости ролика 5 секунд в рублях: Seedance 480p 17.9, Kling 720p 22.6, Kling 1080p 30.1, Seedance 1080p 121.9, Veo 1080p 143.4, Veo 4K 215, столбцы от низкого к высокому с подписями

Text-to-video и image-to-video: в чём разница

У видео-моделей два базовых способа подачи запроса, и важно понимать, чем они отличаются — это влияет и на результат, и на выбор модели.

Text-to-video (текст в видео) — модель генерирует ролик с нуля по текстовому описанию сцены. Вы пишете промпт («дрон облетает горный хребет на рассвете, тёплый свет»), модель синтезирует кадры целиком. Так работают базовые google/veo-3.1, bytedance/seedance-2.0 и kwaivgi/kling-v3.0-std. Это максимальная свобода, но и максимальная непредсказуемость композиции — вы не задаёте исходную картинку.

Image-to-video (изображение в видео) — на вход подаётся стартовый кадр (картинка), и модель «оживляет» его, достраивая движение. Это удобно, когда есть готовый визуал — фото товара, сгенерированная ранее картинка, кадр из брендбука — и нужно привести его в движение, сохранив композицию. В каталоге для этого есть отдельные варианты: google/veo-3.1-i2v, bytedance/seedance-2.0-i2v, kwaivgi/kling-v3.0-std-i2v. Посекундная ставка у i2v-вариантов та же, что у базовых text-to-video.

Связка работает особенно хорошо в паре с генерацией изображений: сначала вы получаете идеальный кадр через image-модель, потом анимируете его через i2v. Про генерацию картинок по API — Nano Banana Pro и GPT Image 2 — у нас есть отдельный разбор: генерация изображений по API за рубли. Seedance вдобавок умеет принимать на вход и видео (режимы edit/extend) — редактировать и продлевать готовые ролики.

Схема двух режимов генерации: сверху text-to-video — прямоугольник «текстовый промпт» стрелкой в «модель» и в «видео»; снизу image-to-video — «стартовый кадр» плюс «промпт» стрелками в «модель» и в «видео», подписи на русском

Как подключить видео-API из России

Технически видео-модели через Promptra подключаются по тому же принципу, что и текстовые: совместимый с OpenAI endpoint, меняется base_url, ключ OpenAI заменяется ключом Promptra. Разница — в том, что генерация видео асинхронная: ролик рендерится не мгновенно, поэтому работа идёт в два шага — сначала задача отправляется (submit), потом по идентификатору опрашивается её статус (task), пока видео не будет готово. В каталоге у видео-моделей для этого есть endpoints videos_submit и videos_task.

Базовый запрос на генерацию (отправка задачи):

curl https://api.promptra.ru/v1/videos/submit \
 -H "Authorization: Bearer prm-xxxxxxxxxxxx" \
 -H "Content-Type: application/json" \
 -d '{
 "model": "bytedance/seedance-2.0",
 "prompt": "дрон облетает горный хребет на рассвете, тёплый свет",
 "resolution": "720p",
 "duration": 5
 }'
Enter fullscreen mode Exit fullscreen mode

В ответ приходит идентификатор задачи. Затем опрашиваем её статус, пока не вернётся ссылка на готовый ролик:

curl https://api.promptra.ru/v1/videos/task/TASK_ID \
 -H "Authorization: Bearer prm-xxxxxxxxxxxx"
Enter fullscreen mode Exit fullscreen mode

То же на Python — с простым ожиданием готовности:

import os, time, httpx

BASE = "https://api.promptra.ru/v1"
KEY = os.environ["PROMPTRA_API_KEY"] # ключ Promptra
headers = {"Authorization": f"Bearer {KEY}"}

# 1. Отправляем задачу на генерацию
submit = httpx.post(
 f"{BASE}/videos/submit",
 headers=headers,
 json={
 "model": "google/veo-3.1",
 "prompt": "дрон облетает горный хребет на рассвете, тёплый свет",
 "resolution": "1080p",
 "duration": 5,
 },
).json

task_id = submit["id"]

# 2. Ждём готовности и забираем ссылку на ролик
while True:
 task = httpx.get(f"{BASE}/videos/task/{task_id}", headers=headers).json
 if task["status"] == "completed":
 print("Готово:", task["video_url"])
 break
 time.sleep(5)
Enter fullscreen mode Exit fullscreen mode

Точные имена полей в ответе зависят от конкретной модели — ориентируйтесь на фактический JSON, который вернёт endpoint. Принцип одинаков для всех трёх моделей: меняете model на нужный идентификатор (google/veo-3.1, bytedance/seedance-2.0, kwaivgi/kling-v3.0-std), а схема submit → poll → download остаётся той же.

Почему этот путь надёжнее прямого доступа через VPN и зарубежные карты, мы подробно разбирали в гайде про OpenAI API в России: там и про блокировки аккаунтов, и про риски карт, и про юридическую сторону — те же аргументы целиком применимы к видео-моделям Google, ByteDance и Kuaishou.

Схема асинхронного потока генерации видео: прямоугольник «отправка задачи (submit)» стрелкой в «рендер на стороне модели», далее «опрос статуса (task)» по кругу до готовности и «скачать ролик», подписи на русском, терракотовый акцент на финальном шаге

Какую модель выбрать: короткая шпаргалка

Свяжем всё вместе. Выбор сводится к трём вопросам: нужен ли звук, насколько важна предсказуемость движения и каков бюджет на секунду.

  • Нужен звук в ролике → только Veo 3.1 (единственная из трёх генерирует звуковую дорожку).
  • Нужно топовое качество картинки на внешнюю аудиторию, бюджет вториченVeo 3.1, при необходимости 4K.
  • Нужен объём контента при минимальной ценеSeedance 2.0, особенно на 480p/720p (от 3.58 ₽/с).
  • Нужен богатый вход (анимировать картинку, редактировать или продлить видео)Seedance 2.0 (принимает текст, изображение, видео, аудио).
  • Нужна предсказуемая динамика и управление камеройKling v3 в режиме Motion Control.
  • Нужно дешёвое 1080p без звукаKling v3 Standard (6.02 ₽/с против 28.67 ₽/с у Veo).

На практике многие команды используют не одну модель, а связку: перебирают идеи на дешёвой Seedance, финальный ролик со звуком рендерят на Veo, а сцены с заданным движением камеры — на Kling. Поскольку все три доступны через один endpoint и один баланс, переключение между ними — это смена строки model в запросе.

Оплата и документы для юр.лица

Видео-генерация — заметная статья расходов (тысячи рублей в месяц на активном использовании), поэтому для команды в компании важно, как эти траты проходят по бухгалтерии. Promptra принимает оплату на российское юр.лицо — российское юр.лицо — с полным пакетом закрывающих документов: договор-оферта, счёт, акт, счёт-фактура, УПД. Документооборот идёт через ЭДО (Диадок, СБИС) — документы автоматически проводятся в учётной системе.

Это принципиальное отличие от прямого доступа к Google, ByteDance или Kuaishou через VPN и зарубежные карты: при таком сценарии у вас на руках нет закрывающих документов российского формата, расход на видео-генерацию сложно корректно учесть, а аккаунт живёт до первого бана. Расходы без правильно оформленной первички не принимаются к учёту бизнеса. Юридическую и бухгалтерскую сторону работы с зарубежными нейросетями мы разобрали в гайде про легальность работы с AI API на юр.лицо.


Promptra — Russian LLM API aggregator. One OpenAI-compatible endpoint to all flagship models: OpenAI (GPT-5.5, GPT-5.4), Anthropic (Claude Opus 4.7, Sonnet 4.6), Google (Gemini 3.1 Pro, 3.5 Flash), DeepSeek V4 Pro, Qwen 3.6 Plus.

Provider prices 1-to-1 at CBR rate — no markup on tokens. Ruble billing per contract, full closing documents through EDI. No VPN — legal B2B service in Russia.

Try: promptra.ru · model catalog · docs

Top comments (0)