Craft AI Modules の AIトークンとコスト
Craft AI Modulesのコストは、AIモデルの使用量に応じてAIトークンという単位で計算されます。このページでは、コスト計算の仕組みと各モデルのコストについて説明します。
利用可能なモデルの一覧については、利用可能なモデル一覧をご確認ください。
AIトークンとは
AIトークンは、Craft AI Modulesにおけるコスト計算の基準単位です。
- Craft AI Modulesでは、契約プランに応じて月間AIトークン消費量の上限が設けられています
- 利用する機能やモデルによって、消費するAIトークン数のレート(AIトークンレート)が異なります
- 各モデルの利用コストは、プロバイダのコスト(USD)をAIトークンに換算して計算されます
計算例
たとえばAIトークンレートが入力3、出力25のモデルがあった場合、10,000トークンのテキスト入力と2,000トークンのテキスト出力をすると次のように計算されます。
-
入力のAIトークン数
- 計算:3 × 10,000 = 30,000 AIトークン
-
出力のAIトークン数
- 計算:25 × 2,000 = 50,000 AIトークン
-
合計AIトークン数
- 30,000 + 50,000 = 80,000 AIトークン
トークン数について
AIモデルで処理される入力・出力のトークン数は、Vertex AI側の仕様に準拠します。詳しくはVertex AIのドキュメントをご確認ください。
Vertex AI Platform のコスト
Geminiモデル
| モデル | 項目 | AIトークンレート | AIトークン単位 |
|---|---|---|---|
| Gemini 2.5 Flash Lite | 入力(テキスト、画像、動画)(1M Token) | 1 | トークン |
| Gemini 2.5 Flash Lite | テキスト出力(回答と推論)(1M Token) | 4 | トークン |
| Gemini 2.5 Flash | 入力(テキスト、画像、動画)(1M Token) | 3 | トークン |
| Gemini 2.5 Flash | テキスト出力(1M Token) | 25 | トークン |
| Gemini 2.5 Flash | 画像出力(1M Token) | 300 | トークン |
| Gemini 2.5 Pro | 入力(テキスト、画像、動画、音声)≤0.2M Token | 12.5 | トークン |
| Gemini 2.5 Pro | 入力(テキスト、画像、動画、音声)>0.2M Token | 25 | トークン |
| Gemini 2.5 Pro | テキスト出力(回答と推論)≤0.2M Token | 100 | トークン |
| Gemini 2.5 Pro | テキスト出力(回答と推論)>0.2M Token | 150 | トークン |
| Gemini 3 Flash Preview | 入力(テキスト、画像、動画) | 5 | トークン |
| Gemini 3 Flash Preview | 入力(音声) | 10 | トークン |
| Gemini 3 Flash Preview | テキスト出力(回答と推論) | 30 | トークン |
| Gemini 3.1 Pro Preview | 入力(テキスト、画像、動画、音声)≤0.2M Token | 20 | トークン |
| Gemini 3.1 Pro Preview | 入力(テキスト、画像、動画、音声)>0.2M Token | 40 | トークン |
| Gemini 3.1 Pro Preview | テキスト出力(回答と推論)≤0.2M Token | 120 | トークン |
| Gemini 3.1 Pro Preview | テキスト出力(回答と推論)>0.2M Token | 180 | トークン |
| Gemini 3.1 Flash-Lite Preview | 入力(テキスト、画像、動画) | 2.5 | トークン |
| Gemini 3.1 Flash-Lite Preview | 入力(音声) | 5 | トークン |
| Gemini 3.1 Flash-Lite Preview | テキスト出力(回答と推論) | 15 | トークン |
Embeddingモデル
Gemini Embeddings
| 項目 | AIトークンレート | AIトークン単位 |
|---|---|---|
| 入力(1,000個の入力トークン) | 1.5 | トークン |
| 出力(1,000個の入力トークン) | 0 | トークン |
Text Embeddings
| 項目 | AIトークンレート | AIトークン単位 |
|---|---|---|
| 入力(1,000文字) | 0.5 | 文字 |
| 出力(1,000文字) | 0 | 文字 |
Multimodal エンベディング
| 項目 | AIトークンレート | AIトークン単位 |
|---|---|---|
| テキスト(入力1,000文字) | 4 | 文字 |
| 画像(画像入力) | 1000 | 画像1枚 |
Rerank
| 項目 | AIトークンレート | AIトークン単位 |
|---|---|---|
| ドキュメントのランク付け(クエリ1000件あたり) | 10000 | 1クエリ |
参考資料
料金の計算元となるプロバイダの料金については、次の公式ドキュメントをご確認ください。
- Gemini、Embeddingモデルの料金:Vertex AI での AI モデルの構築とデプロイの費用 | Google Cloud
- Rerankの料金:Vertex AI Search の料金 | Google Cloud