本記事はFIXERが提供する「cloud.config Tech Blog」に掲載された「【AWS GenU】1クリックデプロイの罠?放置で数万円溶かさないためのコスト注意点」を再編集したものです。
はじめに
AWS GenU(Generative AI Use Cases on AWS)は、AWSが公開している生成AIのサンプルアプリケーションです。社内向けのチャットボットやRAG(社内文書検索)などの機能を、公式サイトからCloudFormationで1クリックデプロイできるのが特徴です。
手軽に試せるのは非常にありがたいのですが、コスト面で事前に知っておきたいポイントがいくつかあったのでまとめます。
特に以下のような状況の方におすすめです。
・GenUをPoCで立ててみたけど、裏側のコスト構造がよく分からない
・RAG機能を有効にしたけど、裏側で何が動いているかよく分かっていない
・複数部署でGenUを使いたいけど、コスト按分ってどうするの?と悩んでいる
前提
本記事は以下の知識をお持ちの方を対象としています。
1. AWSの基本的なサービス(CloudFormation、S3など)をなんとなく理解している
2. GenUの存在を知っている、またはデプロイしたことがある
3. Amazon BedrockやRAG(検索拡張生成)の概念をざっくり理解している
GenUのコスト構造を調べてみた
GenUをRAG機能付きでデプロイして検証していたのですが、料金体系を調べてみると「これ、放置したらけっこうかかるのでは?」ということに気づきました。
Bedrock(LLM)のほうはトークン課金なので、使わなければほぼゼロなんですよね。ただ、RAGを有効にしたときに裏側でデプロイされるOpenSearch Serverlessのほうは、使っていなくても固定費がかかり続けるという仕組みになっています。
「サーバーレスなのになんで?」と思った方、自分もまったく同じことを思いました。
1. RAGを有効にすると発生する「固定費」の罠
OpenSearch Serverlessはゼロスケールではない
GenUでRAG機能(社内文書をアップロードして検索・回答させる機能)を有効にすると、裏側でAmazon OpenSearch Serverlessのコレクションが自動的にデプロイされます。
「サーバーレス」と聞くとLambdaみたいにリクエストがないときは課金ゼロになるイメージがありますが、OpenSearch Serverlessはそうではありません。インデックスの保持と検索のために**OCU(OpenSearch Compute Unit)**というものが常時稼働していて、アクセスがゼロでも課金が止まらないんです。
最小構成でも月額2〜5万円
AWS公式の料金ページ(※1)によると、OpenSearch Serverlessには「標準モード」と「開発テストモード」があり、最小OCU数が異なります。
| モード | 最小OCU数 | 構成 |
| 標準モード | 2 OCU | インデックス用 0.5×2(プライマリ+スタンバイ)+ 検索用 0.5×2(HAレプリカ) |
| 開発テストモード | 1 OCU | インデックス用 0.5 + 検索用 0.5(冗長スタンバイなし) |
OCUの時間単価は**$0.24/OCU時間**(米国東部バージニア北部リージョンの場合)です。ざっくり月額を計算すると以下のようになります。
| モード | 月額(730時間) |
| 開発テストモード(1 OCU) | 約 $175(≒ 約2万6千円) |
| 標準モード(2 OCU) | 約 $350(≒ 約5万3千円) |
※リージョンによって料金は異なります。
「ちょっと試しただけ」のつもりが、1ヶ月放置するだけでこの金額です。S3のデータ格納やデータ転送量も加わるので、実際にはもう少し高くなることもあります。
2. OpenSearch Serverlessの「タグ付け・コスト管理」の落とし穴
部署ごとのコスト按分ができない問題
コストの問題に気づくと、次に「せめてどの環境がいくらかかっているか把握したい」と思いますよね。AWSでは普通、リソースにタグを付けてCost Explorerでプロジェクトごとにコストを可視化します。
ただ、OpenSearch Serverlessではこれがうまくいきません。
従来のプロビジョンド型OpenSearchならドメイン単位でタグを付けてコスト配分ができたのですが、Serverlessの場合はOCUがアカウント・リージョン単位で集約されて請求される仕様になっています。コレクションごとにタグを付けても、Cost Explorer上では**タグキーなし(untagged)**として表示されてしまうことがあります。
複数部署で使いたい場合は要注意
「部署ごとにGenU環境を分けてデプロイして、費用をチャージバックしたい」と考えている場合、この仕様は導入前に知っておかないとかなり困ります。
回避策としては、部署ごとにAWSアカウントを分ける(マルチアカウント戦略)か、OpenSearch Serverlessではなくプロビジョンド型を検討する、といった判断が必要になってきます。
3. コスト爆発を防ぐためにやっておくこと
注意点ばかりだとつらいので、「じゃあどうすればいいの?」という対策もまとめておきます。
A. RAGが不要なら無効にしてデプロイする
純粋にLLMとチャットしたいだけなら、デプロイ時のCloudFormationパラメータで**RAG機能を「無効」**にしましょう。これだけでOpenSearch Serverlessがデプロイされないので、固定費を丸ごとカットできます。
B. 検証が終わったらスタックごと削除する
GenUの良いところは「1クリックで立てられる=壊すのも簡単」というところです。PoCが終わったらCloudFormationコンソールからスタックをまるごと削除してしまいましょう。再度必要になったらまたデプロイし直せばOKです。
C. Bedrockのモデル選択を見直す
OpenSearch以外のコスト要因として、Bedrockで使うモデルの選択も地味に大事です。Anthropic公式のモデル情報(※2)によると、2026年3月時点での最新モデルの料金は以下の通りです。
| モデル | 入力(/1M tokens) | 出力(/1M tokens) | 特徴 |
| Claude Opus 4.6 | $5.00 | $25.00 | 最高精度、エージェント向け |
| Claude Sonnet 4.6 | $3.00 | $15.00速 | 度と精度のバランス型 |
| Claude Haiku 4.5 | $1.00 | $5.00 | 最速・安価 |
まずはHaiku 4.5やSonnet 4.6をデフォルトにして、精度が必要なときだけ上位モデルに切り替える運用がおすすめです。
D. AWS Budgetsでアラートを設定する
これは基本中の基本ですが、AWS Budgetsで予算上限とアラートを設定しておきましょう。「$50を超えたらメール通知」みたいにしておけば、放置してても早めに気づけます。
ただし、セクション2で触れた通り、OpenSearch Serverlessはタグベースのコスト配分が困難な仕様です。Budgetsでタグフィルタを使ってプロジェクト単位のアラートを設定しようとしても、OpenSearch Serverless分はフィルタに引っかからない可能性があります。アカウント全体の予算アラートとして設定しておくのが無難です。
まとめ
自分なりにポイントをまとめると以下の通りです。
1. OpenSearch Serverlessは「サーバーレス」でもゼロスケールではない。最小構成でも月額2〜5万円の固定費がかかる
タグベースのコスト按分が難しい。チャージバックしたい場合はアカウント分離を検討する
2. RAGが不要なら無効にする。検証後はスタックごと削除する
3. 「1クリックで簡単」は本当にその通りなのですが、裏側の仕組みを理解しておかないとコスト面で痛い目を見ます。
最後に
GenUのコストまわりで自分が気になったポイントをまとめてみました!
急な請求で困っている方の参考になると幸いです~。
参考
・Overview - AWS Generative AI Solution Box(GenU 1クリックデプロイ)
・※1 Amazon OpenSearch Service の料金(2026年3月17日時点)
・※2 Anthropic Claude Models Overview(2026年3月17日時点)
仲田泰都/FIXER
本記事はアフィリエイトプログラムによる収益を得ている場合があります


この連載の記事
-
TECH
AWS CDKでECSの環境変数を管理する際に気をつけるべきこと -
TECH
IAMユーザーのアクセスキーを使わず「IAMロール」を使うべき理由 -
TECH
Amazon BedrockからWeb上のコンテンツを参照する新機能「Web Crawler」 -
TECH
Amazon SESでEメールの送信機能/受信機能を作る手順 -
TECH
Terraform:変数の値が未代入でもインタラクティブな入力を回避する方法 -
TECH
ノーコードで生成AI連携! SlackからAmazon Bedrockのエージェントに質問 -
TECH
AWS CDKでGuardDutyのRDS保護を有効化しよう(として詰みかけた話) -
TECH
同世代エンジニアに刺激を受けた!JAWS-UG「若手エンジニア応援LT会」参加レポート -
TECH
AWS CDKとGitHubを使ったIaC=インフラ構成管理の基本 -
TECH
初心者向け:RDSスナップショットを別のAWSアカウントで復元する手順 -
TECH
CX視点で興味深かった「AWS Summit Japan 2024」のセッション - この連載の一覧へ


