Craft AI Modules の AIトークンとコスト

Craft AI Modulesのコストは、AIモデルの使用量に応じてAIトークンという単位で計算されます。このページでは、コスト計算の仕組みと各モデルのコストについて説明します。

利用可能なモデルの一覧については、利用可能なモデル一覧をご確認ください。

AIトークンとは

AIトークンは、Craft AI Modulesにおけるコスト計算の基準単位です。

Craft AI Modulesでは、契約プランに応じて月間AIトークン消費量の上限が設けられています
利用する機能やモデルによって、消費するAIトークン数のレート（AIトークンレート）が異なります
各モデルの利用コストは、プロバイダのコスト（USD）をAIトークンに換算して計算されます

計算例

たとえばAIトークンレートが入力3、出力25のモデルがあった場合、10,000トークンのテキスト入力と2,000トークンのテキスト出力をすると次のように計算されます。

入力のAIトークン数
- 計算：3 × 10,000 = 30,000 AIトークン
出力のAIトークン数
- 計算：25 × 2,000 = 50,000 AIトークン
合計AIトークン数
- 30,000 + 50,000 = 80,000 AIトークン

トークン数について

AIモデルで処理される入力・出力のトークン数は、Vertex AI側の仕様に準拠します。詳しくはVertex AIのドキュメントをご確認ください。

Vertex AI Platform のコスト

Geminiモデル

モデル	項目	AIトークンレート	AIトークン単位
Gemini 2.5 Flash Lite	入力（テキスト、画像、動画）（1M Token）	1	トークン
Gemini 2.5 Flash Lite	テキスト出力（回答と推論）（1M Token）	4	トークン
Gemini 2.5 Flash	入力（テキスト、画像、動画）（1M Token）	3	トークン
Gemini 2.5 Flash	テキスト出力（1M Token）	25	トークン
Gemini 2.5 Flash	画像出力（1M Token）	300	トークン
Gemini 2.5 Pro	入力（テキスト、画像、動画、音声）≤0.2M Token	12.5	トークン
Gemini 2.5 Pro	入力（テキスト、画像、動画、音声）>0.2M Token	25	トークン
Gemini 2.5 Pro	テキスト出力（回答と推論）≤0.2M Token	100	トークン
Gemini 2.5 Pro	テキスト出力（回答と推論）>0.2M Token	150	トークン
Gemini 3 Flash Preview	入力（テキスト、画像、動画）	5	トークン
Gemini 3 Flash Preview	入力（音声）	10	トークン
Gemini 3 Flash Preview	テキスト出力（回答と推論）	30	トークン
Gemini 3.1 Pro Preview	入力（テキスト、画像、動画、音声）≤0.2M Token	20	トークン
Gemini 3.1 Pro Preview	入力（テキスト、画像、動画、音声）>0.2M Token	40	トークン
Gemini 3.1 Pro Preview	テキスト出力（回答と推論）≤0.2M Token	120	トークン
Gemini 3.1 Pro Preview	テキスト出力（回答と推論）>0.2M Token	180	トークン
Gemini 3.1 Flash-Lite Preview	入力（テキスト、画像、動画）	2.5	トークン
Gemini 3.1 Flash-Lite Preview	入力（音声）	5	トークン
Gemini 3.1 Flash-Lite Preview	テキスト出力（回答と推論）	15	トークン
Gemini 3.5 Flash	入力（テキスト、画像、動画、音声）	15	トークン
Gemini 3.5 Flash	テキスト出力（回答と推論）	90	トークン
Gemini 3.1 Flash Lite	入力（テキスト、画像、動画）	2.5	トークン
Gemini 3.1 Flash Lite	入力（音声）	5	トークン
Gemini 3.1 Flash Lite	テキスト出力（回答と推論）	15	トークン
Gemini 3.1 Flash Image	入力（テキスト、画像、動画）	5	トークン
Gemini 3.1 Flash Image	テキスト出力	30	トークン
Gemini 3.1 Flash Image	画像出力	600	トークン
Gemini 3 Pro Image	画像出力	1200	トークン

Embeddingモデル

Gemini Embeddings

項目	AIトークンレート	AIトークン単位
入力（1,000個の入力トークン）	1.5	トークン
出力（1,000個の入力トークン）	0	トークン

Text Embeddings

項目	AIトークンレート	AIトークン単位
入力（1,000文字）	0.5	文字
出力（1,000文字）	0	文字

Multimodal エンベディング

項目	AIトークンレート	AIトークン単位
テキスト（入力1,000文字）	4	文字
画像（画像入力）	1000	画像1枚

Rerank

項目	AIトークンレート	AIトークン単位
ドキュメントのランク付け（クエリ1000件あたり）	10000	1クエリ

参考資料

料金の計算元となるプロバイダの料金については、次の公式ドキュメントをご確認ください。

Gemini、Embeddingモデルの料金：Vertex AI での AI モデルの構築とデプロイの費用 | Google Cloud
Rerankの料金：Vertex AI Search の料金 | Google Cloud