API (Application Programming Interface) — это способ, которым одна программа обращается к другой и получает от неё данные или результат, не зная, как та устроена внутри. Простыми словами, API — это официант в ресторане: вы (одна программа) не заходите на кухню готовить сами, а говорите официанту, что хотите; он передаёт заказ на кухню (другую программу) и приносит вам готовое блюдо. Меню — это список того, что можно попросить; заказ — это запрос; блюдо — это ответ. API нейросети (LLM API) устроен так же: ваше приложение отправляет на адрес провайдера текст запроса и имя модели, а в ответ получает сгенерированный нейросетью текст — и всё это без открытия сайта-чата, прямо из кода.
Запрос «что такое API» в 2026 году входит в число базовых вопросов всех, кто только начинает разбираться в разработке и автоматизации. Эта статья — спокойное объяснение на состояние 2026-05-29, без жаргона и без воды. Разберём, что такое API на бытовой аналогии, как устроен один вызов (адрес, ключ, запрос, ответ, формат JSON), чем API нейросети отличается от обычного, как сделать первый запрос к языковой модели на Python и через curl, как безопасно хранить ключи и зачем API нейросетей нужен бизнесу. Если по ходу встретятся незнакомые слова про нейросети — рядом есть отдельный разбор что такое нейросеть простыми словами.
Сразу зафиксируем главное, чтобы не путаться дальше. Аббревиатура API расшифровывается как Application Programming Interface — «интерфейс программирования приложений». Слово «интерфейс» тут ключевое: это граница, точка соприкосновения, через которую две программы договариваются между собой. У человека интерфейс к программе — это кнопки и экран; у программы интерфейс к другой программе — это API. Вам не нужно знать, как устроена чужая программа внутри: достаточно знать, что ей отправить и что она вернёт.
Что такое API простыми словами: аналогия с официантом
Представьте ресторан. Вы сидите за столиком и хотите поесть. У вас есть два пути. Первый — пойти на кухню, найти повара, разобраться, где лежат продукты, и приготовить блюдо самому. Это долго, и вас, скорее всего, на кухню не пустят. Второй путь — подозвать официанта, заказать по меню и через несколько минут получить готовое блюдо. Вы не знаете и не хотите знать, как именно его готовили, какая на кухне плита и сколько там поваров. Вам важен результат. Подробнее — миграция с OpenAI SDK на Promptra за 10 минут.
API — это и есть официант. Он стоит между вами (вашей программой) и кухней (чужой программой или сервисом) и выполняет три роли. Во-первых, он даёт меню — список того, что вообще можно попросить. Во-вторых, он принимает заказ в понятном формате и несёт его на кухню. В-третьих, он приносит результат обратно. Кухня при этом остаётся закрытой: вы не вмешиваетесь в её внутренние процессы, а она не пускает вас к плите. Это разделение и есть смысл API — чёткая граница между «что я прошу» и «как это делается».
Зачем такая прослойка вообще нужна? Затем, что она позволяет программам пользоваться чужими возможностями, не переписывая их у себя. Приложению с прогнозом погоды не нужно ставить метеостанции по всей стране — оно дёргает API метеосервиса и получает готовые данные. Интернет-магазину не нужно строить собственный банк — он обращается к API платёжной системы, и та проводит оплату. Вашему боту не нужно обучать собственную нейросеть за миллионы долларов — он вызывает API готовой модели и получает ответ. Везде один принцип: одна программа просит, другая делает, API — посредник между ними.
Эта идея окружает нас повсюду, просто мы её не замечаем. Когда приложение такси показывает машины на карте — оно берёт карту через API картографического сервиса. Когда на сайте есть кнопка «войти через Google» — сайт общается с Google через API. Когда курс валют на странице обновляется сам — это запрос к API биржи или банка. По сути, современный интернет — это тысячи программ, которые постоянно обмениваются данными через API, как посетители и кухни через официантов.

Как устроен один запрос: адрес, ключ, запрос и ответ
Теперь спустимся на уровень ниже и посмотрим, из чего состоит один вызов API. В вебе подавляющее большинство API работают по протоколу HTTP — тому же, по которому ваш браузер открывает сайты. Один вызов — это пара «запрос → ответ»: ваша программа шлёт запрос на сервер и получает ответ. Разберём по частям, что входит в эту пару. Терминов будет немного, и все они простые.
Endpoint (адрес, или «конечная точка»). Это URL, по которому живёт нужная функция API, — куда именно отправлять запрос. Выглядит как обычный веб-адрес, например https://api.примерсервиса.ru/v1/weather. У одного API часто несколько endpoint-ов под разные задачи: один для погоды, другой для курса валют, третий для отправки сообщения. В аналогии с рестораном endpoint — это конкретная позиция в меню, на которую вы показываете пальцем. Кусочек /v1 в адресе — это версия API; провайдеры выпускают новые версии, не ломая старые, поэтому номер версии часто стоит прямо в URL.
Метод запроса. HTTP различает типы действий. Самые частые — GET (получить данные, ничего не меняя: «покажи погоду») и POST (отправить данные и что-то создать или вычислить: «обработай этот текст»). Для запросов к нейросетям почти всегда используется POST, потому что вы отправляете на сервер свой текст и просите что-то с ним сделать.
API-ключ (авторизация). Это строка-секрет, по которой сервис понимает, кто к нему обратился и с чьего счёта списывать оплату. Ключ кладут в заголовок запроса — обычно Authorization: Bearer ВАШ_КЛЮЧ. Без ключа платный API просто не ответит: вернёт ошибку 401 («не авторизован»). Ключ — это одновременно пропуск и счёт за услуги, поэтому относиться к нему надо как к паролю (подробнее — в разделе про безопасность ниже). В аналогии с рестораном ключ — это ваша клубная карта, по которой официант понимает, что заказ настоящий и кому выставить счёт.
Тело запроса (request body). Это сами данные, которые вы отправляете, — что конкретно вы просите. Для нейросети это ваш вопрос и параметры: какую модель использовать, какой текст обработать, насколько «творческим» должен быть ответ. Тело почти всегда передают в формате JSON — о нём отдельно ниже.
Ответ (response). То, что сервер возвращает. У ответа есть код состояния (статус) — короткое число, которое сразу говорит, как всё прошло: 200 — успех, 401 — проблема с ключом, 404 — неверный адрес или несуществующий ресурс, 429 — слишком много запросов или кончился баланс, 500 — ошибка на стороне сервера. А ещё у ответа есть тело — те самые данные, которые вы запросили, тоже обычно в JSON.
Сложим всё вместе в одну картину. Ваша программа берёт адрес (endpoint), прикладывает ключ (авторизация), формирует тело запроса (что просим) и отправляет это методом POST. Сервер обрабатывает запрос и присылает ответ с кодом состояния и данными. Это полный цикл одного вызова API. Всё остальное — детали поверх этой простой схемы.

Пара слов про JSON
JSON (JavaScript Object Notation) — это текстовый формат для обмена данными, на котором «разговаривают» почти все современные API. Он устроен как набор пар «ключ: значение» и читается без труда даже человеком. Пример ответа метео-API:
{
"city": "Москва",
"temperature": 18,
"condition": "облачно",
"humidity": 67
}Здесь city, temperature, condition, humidity — это поля (ключи), а справа от двоеточия — их значения. Программа легко разбирает такой текст и достаёт нужное значение по имени поля. Почему именно JSON стал стандартом? Он компактный, человекочитаемый и одинаково понятен любому языку программирования — что Python, что JavaScript, что Go разберут его одинаково. Когда вы будете читать ответ от API нейросети, вы увидите ровно такой же JSON, просто с другими полями.
Что такое API нейросети (LLM API)
Теперь главное для нашей темы. API нейросети — это тот же HTTP-интерфейс «запрос → ответ», только на кухне работает не повар, а большая языковая модель (LLM). Вы отправляете на endpoint провайдера текстовый запрос и имя модели, нейросеть его обрабатывает и возвращает сгенерированный текст. Никакого сайта-чата, никакого браузера — всё происходит внутри вашего кода. Если коротко: API нейросети — это способ обратиться к ChatGPT, Claude или Gemini напрямую из программы, а не печатать вручную в окне чата.
Здесь важно развести два разных способа пользоваться нейросетью, потому что новички их часто путают:
- Веб-чат (ChatGPT в браузере, claude.ai, приложение Gemini) — это продукт для человека. Вы заходите на сайт, логинитесь и общаетесь в окне. Удобно для разовых задач, но работает только «руками» одного пользователя.
- API — это доступ для программы. Ваш код, бот, сайт или скрипт обращается к модели по HTTP и получает ответ в JSON. Это нужно, когда нейросеть должна работать автоматически, на потоке и без человека за клавиатурой.
Чат — это официант, который обслуживает лично вас за столиком. API — это служба доставки той же кухни, которая может принимать тысячи заказов от вашего приложения одновременно. Разница между этими двумя режимами разобрана подробнее в материале что такое нейросеть простыми словами — там же про то, чем LLM отличается от ИИ в целом.
У API нейросети есть две особенности, которых нет у обычного API погоды или курса валют, и их стоит понять заранее.
Оплата за токены. Языковая модель не берёт фиксированную плату за запрос. Она считает токены — кусочки слов, на которые разбивается текст. Тарифицируются отдельно входные токены (ваш запрос) и выходные (ответ модели), причём выход обычно в несколько раз дороже входа. Поэтому стоимость вызова зависит не от их количества, а от длины текста в токенах. Грубо: один токен — это примерно 0.75 слова для английского и чуть меньше для русского. Это прямое практическое следствие: чем длиннее запрос и ответ, тем дороже вызов.
Ответ не детерминирован. Обычный API погоды на один и тот же запрос вернёт один и тот же ответ. Нейросеть на один и тот же запрос может ответить чуть по-разному каждый раз — она выдаёт наиболее вероятный вариант, а не единственно правильный. Из этого же следует, что модель может уверенно ошибиться или «придумать» факт (это называют галлюцинацией), поэтому ответы по важным вопросам нужно перепроверять.
Ещё один удобный факт: большинство провайдеров и агрегаторов используют OpenAI-совместимый формат запроса. Это значит, что код обращения к GPT, Claude и Gemini выглядит практически одинаково — меняется в основном имя модели в одном поле. Благодаря этому стандарту переключиться с одной нейросети на другую можно правкой одной строки, не переписывая программу. Как это устроено и как перевести существующий код — в гайде миграция на Promptra: меняем base_url в OpenAI SDK.
Первый запрос к нейросети по API: пошагово
Перейдём от теории к практике и сделаем первый вызов LLM API. Понадобятся всего три вещи: адрес endpoint, API-ключ и сам запрос. Покажем на двух способах — curl (проверка прямо из терминала, без программирования) и Python (минимальная программа). В примерах используется адрес и формат Promptra — российского агрегатора, через который один ключ даёт доступ ко всем моделям с оплатой в рублях; почему для России это удобнее прямой регистрации, разберём ниже.
Шаг 1. Получить ключ и адрес
Прежде чем что-то вызывать, нужен API-ключ. У провайдера или агрегатора это строка вида prm-.... Адрес endpoint для запросов к чату — https://api.promptra.ru/v1/chat/completions. Как именно получить рабочий ключ из России (и почему прямая регистрация у OpenAI или Google не проходит) — подробно расписано в отдельном гайде как получить API-ключ OpenAI, Claude и Gemini из России.
Шаг 2. Проверить вызов через curl
curl — это утилита командной строки, которая умеет отправлять HTTP-запросы. Она есть почти в любой системе и идеальна для первой проверки: можно убедиться, что ключ и адрес работают, ещё до написания кода. Вот минимальный запрос к нейросети:
curl https://api.promptra.ru/v1/chat/completions \
-H "Authorization: Bearer prm-xxxxxxxxxxxx" \
-H "Content-Type: application/json" \
-d '{
"model": "openai/gpt-5.5",
"messages": [{"role": "user", "content": "Объясни, что такое API, в двух предложениях"}]
}'Разберём по строкам, чтобы было понятно, что здесь что:
- Первая строка — endpoint, адрес, куда уходит запрос.
-H "Authorization: Bearer prm-..."— заголовок с вашим ключом (авторизация).-H "Content-Type: application/json"— говорим серверу, что тело запроса в формате JSON.-d '{...}'— само тело запроса: полеmodel(какую нейросеть использовать) и полеmessages(ваше сообщение). Рольuserозначает, что это говорит пользователь.
В ответ придёт JSON примерно такого вида (сокращённо):
{
"choices": [
{
"message": {
"role": "assistant",
"content": "API — это интерфейс, через который одна программа обращается к другой..."
}
}
],
"usage": { "prompt_tokens": 14, "completion_tokens": 28, "total_tokens": 42 }
}Текст ответа модели лежит в choices[0].message.content. Поле usage показывает, сколько токенов потрачено — по нему считается стоимость. Если вы это увидели — поздравляем, первый вызов API нейросети сделан. Если вместо ответа пришла ошибка: 401 — проблема с ключом (проверьте, что нет лишних пробелов при копировании), 404 — неверный адрес или имя модели, 429 — кончился баланс или сработал лимит частоты.
Шаг 3. Тот же вызов на Python
Теперь то же самое из программы. Самый простой путь — официальный openai SDK: это готовая библиотека, которая берёт на себя формирование HTTP-запроса, и работает она не только с OpenAI, но и с любым OpenAI-совместимым адресом. Установка — pip install openai, дальше пять строк:
from openai import OpenAI
client = OpenAI(
api_key="prm-xxxxxxxxxxxx", # ваш ключ
base_url="https://api.promptra.ru/v1", # адрес API
)
resp = client.chat.completions.create(
model="openai/gpt-5.5", # имя модели
messages=[
{"role": "user", "content": "Объясни, что такое API, в двух предложениях"}
],
)
print(resp.choices[0].message.content)Что здесь происходит: мы создаём клиента, передав ему адрес и ключ, затем вызываем chat.completions.create с именем модели и сообщением, а в конце печатаем текст ответа из resp.choices[0].message.content. Это ровно тот же запрос, что мы делали через curl, только обёрнутый в удобную библиотеку — она сама подставит заголовки и разберёт JSON.
Чтобы спросить другую нейросеть — Claude или Gemini вместо GPT, — меняется только одна строка model:
resp = client.chat.completions.create(
model="anthropic/claude-sonnet-4.6", # или "google/gemini-3.1-pro-preview"
messages=[{"role": "user", "content": "Объясни, что такое API-ключ"}],
)
print(resp.choices[0].message.content)Ни адрес, ни ключ, ни структура запроса не меняются — только идентификатор модели. В этом и проявляется OpenAI-совместимый формат: один и тот же код работает с разными нейросетями. То же самое доступно в Node.js, Go и любом языке, где есть OpenAI SDK, — параметры называются почти одинаково.

API-ключи и безопасность: коротко о главном
API-ключ — это деньги и доступ в одной строке. Если он утечёт в публичный репозиторий, лог или скриншот, им сможет воспользоваться кто угодно, и расход уйдёт с вашего баланса. Поэтому несколько базовых правил, которые стоит усвоить с первого же ключа.
Не зашивайте ключ прямо в код. Строка api_key="prm-..." в исходнике — первое, что попадает в git и утекает наружу при публикации. Вместо этого держите ключ в переменных окружения. Официальный openai SDK читает их автоматически: ключ берётся из OPENAI_API_KEY, а адрес — из OPENAI_BASE_URL. Тогда в коде секрета вообще нет:
# файл.env — обязательно добавьте его в.gitignore
OPENAI_API_KEY=prm-xxxxxxxxxxxx
OPENAI_BASE_URL=https://api.promptra.ru/v1Сразу добавьте .env в .gitignore. Самая частая утечка — случайно закоммиченный файл с ключом. Заведите .gitignore со строкой .env до первого коммита. Для шаблона держите рядом .env.example с пустыми значениями — он показывает структуру, но не содержит секрета.
Не пересылайте ключ в мессенджерах и не выкладывайте в скриншотах. Ключ, отправленный «на минутку» в чат, остаётся в истории навсегда. Если ключ всё-таки засветился — считайте его скомпрометированным и перевыпустите.
Следите за балансом и расходом. Резкий скачок трат — первый признак утечки. В первые дни после подключения имеет смысл заглядывать в дашборд, чтобы заметить аномалию. Подробный разбор хранения ключей и получения доступа — в гайде как получить API-ключ.
Зачем бизнесу API нейросетей
Для одного человека нейросеть — это «спросить у чата». Для бизнеса всё интереснее: модель встраивают в продукт или процесс через API, и она работает не для одного пользователя, а обрабатывает тысячи запросов автоматически, без человека в цикле. Вот типовые сценарии, которые в 2026 году уже стали рутиной.
Поддержка клиентов. Чат-боты первой линии отвечают на типовые вопросы, разбирают обращения по темам, подсказывают оператору готовый черновик ответа. Запросы повторяются, поэтому часто хватает недорогой модели.
Работа с документами. Суммаризация договоров и отчётов, извлечение полей из счетов и анкет, генерация описаний товаров для маркетплейса, черновики писем. Модель с большим контекстным окном «прочитает» документ на сотни страниц за один вызов.
Разработка ПО. Автодополнение кода, ревью, генерация тестов, объяснение чужих проектов. Это самый зрелый сценарий — команды подключают сильную модель и заметно ускоряют рутину.
Поиск по своим данным (RAG). Модель отвечает на вопросы, опираясь на базу знаний компании: регламенты, документацию, переписку. Так строят внутренние «корпоративные ассистенты», которые знают именно ваш бизнес.
Почему именно API, а не веб-чат? Чат — для человека и разовых задач. API — для масштаба: нейросеть срабатывает автоматически на каждый заказ, обращение, загруженную фотографию. И платите вы только за фактический объём — за обработанные токены, — а не фиксированную подписку.
Ключевой практический момент — стоимость зависит от выбранной модели, и разброс огромный. Сравните цену за 1 млн токенов вход/выход (цены каталога Promptra, 1-в-1 с провайдером по курсу ЦБ на 27.05.2026, 71.668 ₽/$):
| Модель | Вход ₽ / 1М | Выход ₽ / 1М | Когда брать |
|---|---|---|---|
| GPT-5.5 | 350 | 2150 | Флагман: сложный reasoning, агенты |
| Claude Opus 4.7 | 350 | 1790 | Сложный код, долгие рассуждения |
| Claude Sonnet 4.6 | 210 | 1070 | Баланс качества и цены |
| Gemini 3.1 Pro | 140 | 860 | Мультимодал с аудио, дёшево |
| DeepSeek V4 Pro | 30 | 60 | Массовый поток, код и логика |
Разрыв между выходом флагмана (GPT-5.5, 2150 ₽) и недорогой модели (DeepSeek V4 Pro, 60 ₽) — больше чем в тридцать раз. Вывод простой: дорогой флагман — для задач, где цена ошибки высока; дешёвая модель — для массового однотипного потока. У DeepSeek V4 Pro в каталоге действует промо −75% до 31.05.2026 (30/60 ₽); базовый тариф после окончания промо — около 120/240 ₽ (производная ставка от USD ≈ $1.74/$3.48).
Для разработчика в России есть отдельный нюанс, не связанный с самой технологией. Напрямую оплатить зарубежного провайдера (OpenAI, Anthropic, Google) картами российских банков нельзя, а серые схемы ненадёжны и не дают документов для бухгалтерии. Сами модели и их API при этом работают — упирается всё именно в платёж. Чистое решение для бизнеса — подключаться к зарубежным моделям через российский LLM-агрегатор: один API-ключ сразу ко всем моделям, оплата в рублях на юр.лицо, цена на токены 1-в-1 с провайдером по курсу ЦБ, без VPN. У Promptra это оплата в рублях по договору, полный пакет закрывающих документов (Диадок, СБИС, 1С-ЭДО) — договор-оферта, счёт, акт, счёт-фактура, УПД. Сервисная комиссия 5% берётся только при пополнении баланса, а не с каждого запроса. Если хотите начать с самой популярной линейки моделей — посмотрите страницу ChatGPT (GPT) API за рубли.
FAQ
Что такое API простыми словами?
API (Application Programming Interface) — это способ, которым одна программа обращается к другой, чтобы получить данные или результат, не зная внутреннего устройства этой программы. Аналогия — официант в ресторане: вы делаете заказ по меню (запрос), он несёт его на кухню (другую программу) и приносит готовое блюдо (ответ). Вам не нужно знать, как блюдо готовили. Так приложения пользуются чужими возможностями: погодой, оплатой, картами, нейросетями — каждый раз через API-посредника.
Что такое API нейросети?
API нейросети (LLM API) — это интерфейс, через который ваше приложение обращается к языковой модели по HTTP, минуя сайт-чат. Вы отправляете на адрес провайдера текст запроса и имя модели, нейросеть его обрабатывает и возвращает сгенерированный текст в формате JSON. От обычного API он отличается двумя вещами: оплата идёт за токены (кусочки слов, отдельно за вход и выход), а ответ не детерминирован — модель выдаёт наиболее вероятный вариант и может ошибаться. Через API нейросеть встраивают в боты, сайты и автоматизации.
Чем API отличается от веб-чата (ChatGPT)?
Веб-чат — это продукт для человека: вы заходите на сайт, логинитесь и печатаете вопросы руками. API — это доступ для программы: код обращается к той же модели по HTTP и получает ответ автоматически, в машинном формате. Чат удобен для разовых задач одного пользователя; API нужен, когда нейросеть должна работать на потоке — обрабатывать тысячи запросов без человека за клавиатурой. Это две двери к одной и той же модели: чат — для рук, API — для кода.
Что такое API-ключ и зачем он нужен?
API-ключ — это строка-секрет, по которой сервис понимает, кто отправил запрос и с чьего баланса списывать оплату. Ключ кладут в заголовок запроса (Authorization: Bearer ВАШ_КЛЮЧ), и без него платный API не ответит — вернёт ошибку 401. Ключ — это одновременно пропуск и счёт, поэтому к нему относятся как к паролю: не публикуют в репозитории, не пересылают в мессенджерах, хранят в переменных окружения. Если ключ утёк — его перевыпускают.
Как сделать первый запрос к API нейросети?
Нужны три вещи: адрес endpoint, API-ключ и текст запроса. Самый быстрый способ проверить — curl из терминала: отправляете POST на https://api.promptra.ru/v1/chat/completions с заголовком авторизации и телом, где указаны поля model (имя модели) и messages (ваш вопрос). В ответ приходит JSON, текст лежит в choices[0].message.content. То же самое из кода делается официальным openai SDK на Python в пять строк — нужно передать клиенту base_url и api_key, затем вызвать chat.completions.create.
Сколько стоит пользоваться API нейросети?
Зависит от модели и объёма: провайдеры берут плату за токены — отдельно за входные (ваш запрос), отдельно за выходные (ответ), причём выход обычно в несколько раз дороже. В каталоге Promptra (цены 1-в-1 с провайдером по курсу ЦБ, 71.668 ₽/$) за 1 млн токенов вход/выход: Gemini 3.1 Pro — 140/860 ₽, Claude Sonnet 4.6 — 210/1070 ₽, GPT-5.5 — 350/2150 ₽, DeepSeek V4 Pro — 30/60 ₽. Один и тот же сценарий на разных моделях различается по цене в десятки раз, поэтому выбор модели под задачу так же важен, как сам факт подключения. Сервисная комиссия 5% берётся только при пополнении баланса.
API — это, если убрать сложность, способ для одной программы попросить другую сделать работу и вернуть результат, не вмешиваясь в её внутренности. Для нейросетей это значит, что ChatGPT, Claude или Gemini можно вызвать прямо из кода — отправить текст и получить ответ. Сделать первый вызов можно за пять минут одним запросом через curl или Python. Если хотите подключить API нейросетей под конкретную задачу, посчитать стоимость в рублях и получить доступ с закрывающими документами без VPN — напишите команде напрямую в promptra.ru, разберём ваш сценарий.
Источники
Цены на модели — из каталога Promptra (1-в-1 с провайдером по курсу ЦБ РФ на 27.05.2026, 71.668 ₽/$); первоисточники можно перепроверить:
- OpenAI API Pricing — GPT-5.5 и линейка OpenAI.
- Anthropic Platform Pricing — Claude Opus 4.7, Sonnet 4.6.
- Google Gemini API Pricing — Gemini 3.1 Pro.
- DeepSeek API Pricing — DeepSeek V4 Pro и промо-условия.
- Курс ЦБ РФ на 27.05.2026 — 71.668 ₽/USD, cbr.ru.
