Прозрачные и понятные тарифы: оплачивайте только фактически использованный объем. Никаких подписок или скрытых комиссий.

Стоимость рассчитывается за каждую 1 000 “токенов” (единиц измерения для языковых моделей). Токеном может быть как целое слово, так и его часть или даже знак препинания. Цена различается для токенов “запроса” (что вы отправляете модели) и токенов “ответа” (что возвращает модель).

Почему не считать просто символы?

Современные модели оптимизированы именно под работу с токенами, обеспечивая большую экономию. Так, GPT-4o при создании фразы «Привет! Как я могу помочь?» потребляет лишь 8 токенов, хотя в строке содержится 26 символов. Получается, что расчёт по токенам оказывается более чем в три раза дешевле, чем по количеству символов.

Подробная информация о стоимости каждого тарифа

Услуга

Стоимость

Vector Store

10,00 ₽за 1 ГБ в день (первые 10 МБ - бесплатно)

Языковые модели (LLM)

Ценообразование производится на основании 1 000 токенов. В аудиомоделях эта же «порция» — 1 000 токенов — примерно соответствует одной минуте.

ПровайдерМодельЗапросОтвет
gigachat

Особенности

Поддерживает мультимодальные запросы: текст, изображения, аудио. Оптимизирован для работы с длинным контекстом и может использовать встроенные "умения" — расширения, позволяющие выполнять прикладные задачи (анализ данных, генерация кода и др.). Есть поддержка русского языка на нативном уровне, а также интеграция с внешними сервисами через плагины.

GigaChat1.00001.0000
GigaChat-21.00001.0000
GigaChat-2-Max1.00001.0000
GigaChat-Plus1.00001.0000
GigaChat-Pro1.00001.0000
openai

Особенности

Для некоторых моделей появилась возможность "кэшировать" токены запроса. Стоимость на такие токены в два раза ниже, чем на обычные. Кэширование происходит автоматически. Пример: вам нужно регулярно анализировать содержание новостей для последующей категоризации. Вы посылаете один и тот же запрос: "В зависимости от содержания новости ответь, к какой категории она принадлежит: политика, экономика, спорт, и тд. Вот сама новость: ...". Первая часть запроса всегда одинаковая, отличается только сам текст новости. Именно его и будет автоматически кэшировать API. На данный момент в кэш попадают запросы от 1024 токенов и больше

OpenAI: o1-pro14.190056.7600
OpenAI: GPT-4.5 (Preview)7.095014.1900
OpenAI: GPT-4 32k5.676011.3520
OpenAI: GPT-4 32k (older v0314)5.676011.3520
OpenAI: o11.41905.6760
OpenAI: o1-preview (2024-09-12)1.41905.6760
OpenAI: GPT-42.83805.6760
OpenAI: GPT-4 (older v0314)2.83805.6760
OpenAI: o30.94603.7840
OpenAI: GPT-4 Turbo0.94602.8380
OpenAI: GPT-4 Turbo Preview0.94602.8380
OpenAI: GPT-4 Turbo (older v1106)0.94602.8380
OpenAI: GPT-4o (extended)0.56761.7028
OpenAI: ChatGPT-4o0.47301.4190
OpenAI: GPT-4o (2024-05-13)0.47301.4190
o1-preview1.00001.0000
gpt-4o1.00001.0000
OpenAI: GPT-4o Search Preview0.23650.9460
OpenAI: GPT-4o (2024-11-20)0.23650.9460
OpenAI: GPT-4o (2024-08-06)0.23650.9460
OpenAI: GPT-4.10.18920.7568
OpenAI: o4 Mini High0.10410.4162
OpenAI: o4 Mini0.10410.4162
OpenAI: o3 Mini High0.10410.4162
OpenAI: o3 Mini0.10410.4162
OpenAI: o1-mini (2024-09-12)0.10410.4162
OpenAI: GPT-3.5 Turbo 16k0.28380.3784
OpenAI: GPT-3.5 Turbo (older v0613)0.09460.1892
OpenAI: GPT-3.5 Turbo 16k (older v1106)0.09460.1892
OpenAI: GPT-3.5 Turbo Instruct0.14190.1892
OpenAI: GPT-4.1 Mini0.03780.1514
OpenAI: GPT-3.5 Turbo0.04730.1419
OpenAI: GPT-3.5 Turbo 16k0.04730.1419
o1-mini0.10000.1000
gpt-4o-mini0.10000.1000
OpenAI: GPT-4o-mini Search Preview0.01420.0568
OpenAI: GPT-4o-mini (2024-07-18)0.01420.0568
OpenAI: GPT-4.1 Nano0.00950.0378
anthropic

Особенности

Также, как и OpenAI, есть взможность отправлять повторяющуюся часть запросов в кэш. В отличие от OpenAI, это не происходит автоматически, а требует дополнительных настроек при отправке запроса. Рекомендуем обратиться к официальной документации. Запись в кэш не бесплатная (как у OpenAI), зато использование кэша в 10 раз дешевле, чем обычные токены

Anthropic: Claude 3 Opus (self-moderated)1.41907.0950
Anthropic: Claude 3 Opus1.41907.0950
Anthropic: Claude v2.1 (self-moderated)0.75682.2704
Anthropic: Claude v2.10.75682.2704
Anthropic: Claude v2 (self-moderated)0.75682.2704
Anthropic: Claude v20.75682.2704
Anthropic: Claude v2.0 (self-moderated)0.75682.2704
Anthropic: Claude v2.00.75682.2704
Anthropic: Claude 3.7 Sonnet0.28381.4190
Anthropic: Claude 3.7 Sonnet (thinking)0.28381.4190
Anthropic: Claude 3.7 Sonnet (self-moderated)0.28381.4190
Anthropic: Claude 3.5 Sonnet (self-moderated)0.28381.4190
Anthropic: Claude 3.5 Sonnet0.28381.4190
Anthropic: Claude 3.5 Sonnet (2024-06-20) (self-moderated)0.28381.4190
Anthropic: Claude 3.5 Sonnet (2024-06-20)0.28381.4190
Anthropic: Claude 3 Sonnet (self-moderated)0.28381.4190
Anthropic: Claude 3 Sonnet0.28381.4190
Anthropic: Claude 3.5 Haiku (self-moderated)0.07570.3784
Anthropic: Claude 3.5 Haiku0.07570.3784
Anthropic: Claude 3.5 Haiku (2024-10-22) (self-moderated)0.07570.3784
Anthropic: Claude 3.5 Haiku (2024-10-22)0.07570.3784
Anthropic: Claude 3 Haiku (self-moderated)0.02370.1182
Anthropic: Claude 3 Haiku0.02370.1182
google

Особенности

Тарификация разная в зависимости от размера запроса. Если запрос меньше 128К токенов, то применяется одна цена. Если больше, то другая. Для модели Gemini 2.0 отдельная цена на запросы с аудио

Google: Gemini 2.5 Pro Preview0.11820.9460
Google: Gemini 1.5 Pro0.11820.4730
Google: Gemini 2.5 Flash Preview (thinking)0.01420.3311
Google: Gemini Pro Vision 1.00.04730.1419
Google: Gemini 2.5 Flash Preview0.01420.0568
gemini-1.5-pro0.05000.0500
Google: Gemini 2.0 Flash0.00950.0378
Google: Gemini 2.0 Flash Lite0.00710.0284
Google: Gemma 2 27B0.00950.0284
Google: Gemini 1.5 Flash 0.00710.0284
Google: Gemma 3 27B0.00950.0189
Google: Gemini 1.5 Flash 8B0.00350.0142
gemini-2.0-flash-exp0.01000.0100
gemini-1.5-flash0.01000.0100
Google: Gemma 3 12B0.00470.0095
Google: Gemma 2 9B0.00190.0057
Google: Gemma 3 4B0.00190.0038
deepseek

Особенности

Инновационные модели с фокусом на эффективность

deepseek-chat1.00001.0000
deepseek-reasoner1.00001.0000
DeepSeek: DeepSeek Prover V20.04730.2062
DeepSeek: R10.04730.2062
DeepSeek: DeepSeek V3 03240.02550.1041
DeepSeek: R1 Distill Llama 70B0.00950.0378
DeepSeek: R1 Distill Qwen 1.5B0.01700.0170
DeepSeek: R1 Distill Qwen 32B0.01140.0170
DeepSeek: R1 Distill Qwen 14B0.01420.0142
DeepSeek-Coder-V20.00380.0114
DeepSeek: R1 Distill Llama 8B0.00380.0038
01-ai
01.AI: Yi Large0.28380.2838
aetherwiing
Aetherwiing: Starcannon 12B0.07570.1135
ai21
AI21: Jamba 1.6 Large0.18920.7568
AI21: Jamba 1.5 Large0.18920.7568
AI21: Jamba Instruct0.04730.0662
AI21: Jamba Mini 1.60.01890.0378
AI21: Jamba 1.5 Mini0.01890.0378
aion-labs
AionLabs: Aion-1.00.37840.7568
AionLabs: Aion-1.0-Mini0.06620.1324
AionLabs: Aion-RP 1.0 (8B)0.01890.0189
alfredpros
AlfredPros: CodeLLaMa 7B Instruct Solidity0.07570.1135
all-hands
OpenHands LM 32B V0.10.24600.3216
allenai
OLMo 7B Instruct0.00760.0227
alpindale
Goliath 120B0.62080.8869
Magnum 72B0.37840.5676
amazon
Amazon: Nova Pro 1.00.07570.3027
Amazon: Nova Lite 1.00.00570.0227
Amazon: Nova Micro 1.00.00330.0132
anthracite-org
Magnum v2 72B0.28380.2838
Magnum v4 72B0.14190.2129
arcee-ai
Arcee AI: Maestro Reasoning0.08510.3122
Arcee AI: Virtuoso Large0.07090.1135
Arcee AI: Caller Large0.05200.0804
Arcee AI: Coder Large0.04730.0757
Arcee AI: Virtuoso Medium V20.04730.0757
Arcee AI: Arcee Blitz0.04260.0709
Arcee AI: Spotlight0.01700.0170
cognitivecomputations
Dolphin 2.9.2 Mixtral 8x22B 🐬0.08510.0851
cohere
Cohere: Command R+0.28381.4190
Cohere: Command R+ (04-2024)0.28381.4190
Cohere: Command A0.23650.9460
Cohere: Command R+ (08-2024)0.23650.9460
Cohere: Command0.09460.1892
Cohere: Command R0.04730.1419
Cohere: Command R (03-2024)0.04730.1419
Cohere: Command R (08-2024)0.01420.0568
Cohere: Command R7B (12-2024)0.00350.0142
eleutherai
EleutherAI: Llemma 7b0.07570.1135
eva-unit-01
EVA Llama 3.33 70B0.37840.5676
EVA Qwen2.5 72B0.37840.5676
EVA Qwen2.5 32B0.24600.3216
gryphe
MythoMax 13B0.00610.0061
inception
Inception: Mercury Coder Small Beta0.02370.0946
infermatic
Infermatic: Mistral Nemo Inferor 12B0.07570.1135
inflection
Inflection: Inflection 3 Productivity0.23650.9460
Inflection: Inflection 3 Pi0.23650.9460
jondurbin
Airoboros 70B0.04730.0473
liquid
Liquid: LFM 40B MoE0.01420.0142
Liquid: LFM 3B0.00190.0019
Liquid: LFM 7B0.00090.0009
mancer
Mancer: Weaver (alpha)0.10640.1064
meta-llama
Meta: Llama 3.1 405B (base)0.18920.1892
Meta: Llama 3.2 90B Vision Instruct0.11350.1135
Meta: Llama 2 70B Chat0.08510.0851
Meta: Llama 3.1 405B Instruct0.07570.0757
Meta: Llama 4 Maverick0.01610.0568
Meta: Llama 3 70B Instruct0.02840.0378
Meta: Llama 4 Scout0.00760.0284
Meta: Llama 3.1 70B Instruct0.00950.0265
Meta: Llama 3.3 70B Instruct0.00950.0237
Meta: LlamaGuard 2 8B0.01890.0189
Llama Guard 3 8B0.00190.0057
Meta: Llama 3 8B Instruct0.00280.0057
Meta: Llama Guard 4 12B0.00470.0047
Meta: Llama 3.2 11B Vision Instruct0.00460.0046
Meta: Llama 3.1 8B Instruct0.00190.0028
Meta: Llama 3.2 3B Instruct0.00090.0019
Meta: Llama 3.2 1B Instruct0.00050.0009
microsoft
WizardLM-2 8x22B0.04730.0473
Microsoft: Phi 4 Reasoning Plus0.00660.0331
Microsoft: Phi-3 Medium 128K Instruct0.00950.0284
Microsoft: Phi 40.00660.0132
Microsoft: Phi 4 Multimodal Instruct0.00470.0095
Microsoft: Phi-3 Mini 128K Instruct0.00950.0095
Microsoft: Phi-3.5 Mini 128K Instruct0.00280.0085
minimax
MiniMax: MiniMax-010.01890.1041
mistral
Mistral: Ministral 8B0.00950.0095
mistralai
Mistral Medium0.26010.7663
Mistral Large 24110.18920.5676
Mistral Large 24070.18920.5676
Mistral: Pixtral Large 24110.18920.5676
Mistral Large0.18920.5676
Mistral: Mixtral 8x22B Instruct0.03780.1135
Mistral: Codestral 25010.02840.0851
Mistral: Saba0.01890.0568
Mistral Small0.01890.0568
Mistral: Codestral Mamba0.02370.0237
Mistral Tiny0.02370.0237
Mistral: Mixtral 8x7B Instruct0.00760.0227
Mistral: Mistral 7B Instruct v0.20.01890.0189
Mistral: Mistral 7B Instruct v0.10.01040.0180
Mistral: Mistral Small 3.1 24B0.00470.0142
Mistral: Mistral Small 30.00570.0114
Mistral: Ministral 8B0.00950.0095
Mistral: Pixtral 12B0.00950.0095
Mistral: Mistral Nemo0.00280.0066
Mistral: Mistral 7B Instruct0.00260.0051
Mistral: Mistral 7B Instruct v0.30.00260.0051
Mistral: Ministral 3B0.00380.0038
neversleep
NeverSleep: Llama 3 Lumimaid 70B0.37840.5676
NeverSleep: Lumimaid v0.2 70B0.14190.2129
Noromaid 20B0.07090.1419
NeverSleep: Lumimaid v0.2 8B0.00890.0709
NeverSleep: Llama 3 Lumimaid 8B (extended)0.00890.0709
NeverSleep: Llama 3 Lumimaid 8B0.00890.0709
nothingiisreal
Mistral Nemo 12B Celeste0.07570.1135
nousresearch
Nous: Hermes 3 405B Instruct0.07570.0757
Nous: Hermes 2 Mixtral 8x7B DPO0.05680.0568
Nous: Hermes 3 70B Instruct0.01140.0284
NousResearch: Hermes 2 Pro - Llama-3 8B0.00240.0038
nvidia
NVIDIA: Llama 3.3 Nemotron Super 49B v10.01230.0378
NVIDIA: Llama 3.1 Nemotron 70B Instruct0.01140.0284
perplexity
Perplexity: Sonar Pro0.28381.4190
Perplexity: Sonar Reasoning Pro0.18920.7568
Perplexity: Sonar Deep Research0.18920.7568
Perplexity: R1 17760.18920.7568
Perplexity: Sonar Reasoning0.09460.4730
Perplexity: Sonar0.09460.0946
Perplexity: Llama 3.1 Sonar 70B Online0.09460.0946
Perplexity: Llama 3.1 Sonar 8B Online0.01890.0189
pygmalionai
Pygmalion: Mythalion 13B0.05320.1064
qwen
Qwen: Qwen-Max 0.15140.6054
Qwen: Qwen VL Max0.07570.3027
Qwen: Qwen-Plus0.03780.1135
Qwen: Qwen2.5 VL 32B Instruct0.08510.0851
Qwen 2 72B Instruct0.08510.0851
Qwen: Qwen2.5 VL 72B Instruct0.02370.0709
Qwen: Qwen VL Plus0.01990.0596
Qwen: Qwen2.5-VL 72B Instruct0.05680.0568
Qwen2.5 72B Instruct0.01140.0369
Qwen: Qwen3 30B A3B0.00950.0284
Qwen: Qwen3 32B0.00950.0284
Qwen: QwQ 32B Preview0.00850.0255
Qwen: Qwen3 14B0.00660.0227
Qwen: QwQ 32B0.01420.0189
Qwen: Qwen-Turbo0.00470.0189
Qwen: Qwen2.5-VL 7B Instruct0.01890.0189
Qwen2.5 Coder 32B Instruct0.00570.0170
Qwen: Qwen3 8B0.00330.0131
Qwen: Qwen3 235B A22B0.00950.0095
Qwen2.5 7B Instruct0.00470.0095
Qwen: Qwen2.5 Coder 7B Instruct0.00090.0028
raifle
SorcererLM 8x22B0.42570.4257
sao10k
Sao10k: Llama 3 Euryale 70B v2.10.14000.1400
Fimbulvetr 11B v20.07570.1135
Sao10K: Llama 3.3 Euryale 70B0.06620.0757
Sao10K: Llama 3.1 Euryale 70B v2.20.06620.0757
Sao10K: Llama 3 8B Lunaris0.00190.0047
scb10x
Typhoon2 70B Instruct0.08320.0832
Typhoon2 8B Instruct0.01700.0170
sophosympatheia
Midnight Rose 70B0.07570.0757
thedrummer
TheDrummer: Anubis Pro 105B V10.07570.0946
TheDrummer: Skyfall 36B V20.04730.0757
Rocinante 12B0.02370.0473
Unslopnemo 12B0.04260.0426
thudm
THUDM: GLM Z1 Rumination 32B 0.02270.0227
THUDM: GLM Z1 32B0.02270.0227
THUDM: GLM 4 32B0.02270.0227
undi95
Toppy M 7B0.07570.1135
ReMM SLERP 13B0.05320.1064
x-ai
xAI: Grok 3 Beta0.28381.4190
xAI: Grok Vision Beta0.47301.4190
xAI: Grok Beta0.47301.4190
xAI: Grok 2 Vision 12120.18920.9460
xAI: Grok 2 12120.18920.9460
xAI: Grok 3 Mini Beta0.02840.0473