このページの本文へ

FIXER Tech Blog - AI/Machine Learning

AIエージェントを基本から理解する ― AWS AIエージェント開発入門 Workshopより

2026年06月05日 09時00分更新

文● 柏木大空愛/FIXER

  • この記事をはてなブックマークに追加
  • 本文印刷

 本記事はFIXERが提供する「cloud.config Tech Blog」に掲載された「AWS AI Agent Workshopを経て」を再編集したものです(前編)。

はじめに

2025年、生成AIの世界で最も注目されているキーワードが「AIエージェント」です。ChatGPTが世間を席巻した2022年末からわずか数年で、AIは「質問に答えるアシスタント」から「自律的にタスクを実行するエージェント」へと急速に進化しています。

本記事では、社内で開催された「AWSによるAIエージェント開発入門ワークショップ」の内容をもとに、AIエージェントの基本的な考え方から、Strandsを用いた実装、AWS上へのデプロイまでの流れを解説します。

AIエージェントとは何か?

生成AIの進化の歴史

AIエージェントを理解するには、生成AIがどのように進化してきたかを振り返ることが重要です。

時期 技術 概要
〜2022年 言語モデル(LLM) テキスト生成・理解の基盤
2022〜2023年 RAG(検索拡張生成) 外部知識を参照して回答精度を向上
2023〜2024年 Tool Use / Function Calling 外部ツールを呼び出せるようになる
2024〜2025年 推論モデル(Reasoning Models) 複雑な問題解決、計画、多段推論が向上
2025年〜 AIエージェント 自律的にタスクを計画・実行

エージェントの本質:Plan → Action → Feedback のループ

AIエージェントの核心は、次の3つのステップを繰り返す自律的なループにあります。

AI Agentの簡易的な関係図
引用元:https://www.anthropic.com/engineering/building-effective-agents

1. Plan(計画):目標を達成するために何をすべきかを考える
2. Action(行動):ツールを呼び出したり、コードを実行したりする
3. Feedback(観察):実行結果を受け取り、次のアクションに活かす

このループを繰り返すことで、エージェントは複雑なタスクを段階的に解決していきます。

エージェントとワークフローの違い

よく混同されますが、エージェントとワークフローは明確に異なります。

ワークフロー(Workflow):人間があらかじめ定義したフローに従ってLLMが動作する(決定論的)
エージェント(Agent):LLM自身が動的に判断を下し、次のアクションを決定する(非決定論的)

ワークフローは予測可能で安定している反面、柔軟性に欠けます。エージェントは自律性が高い分、予期しない動作をする可能性もあります。用途に応じて使い分けることが重要です。

エージェントを支える技術

1. Reasoning / Chain of Thought(CoT)

 Reasoning(推論)とは、LLMに「答えを出す前に、思考過程を言語化させる」技術です。

たとえば、「9.11と9.9はどちらが大きい?」という質問に対して、単純に答えを出すだけでなく「整数部分は同じ9。小数点以下を比べると、9.11は0.11、9.9は0.90なので9.9の方が大きい」と考えさせることで、精度が劇的に向上します。

Chain of Thought(CoT)はこの手法を系統的に活用するアプローチで、複雑な数学の問題や論理パズルなど、ステップバイステップの思考が必要なタスクで特に効果を発揮します。

2. Tool Use / Function Calling

LLMは本来、学習データに含まれる知識しか持ちません。しかしFunction Calling(ツール使用)の仕組みを使うことで、LLMは外部ツールを呼び出してリアルタイムの情報や外部サービスの機能を活用できるようになります。

// ツール定義の例 
{
   "name": "get_stock_price",
   "description": "指定した株式のティッカーシンボルの株価を取得します",
    "parameters": {
         "type": "object",
         "properties": {
                "ticker": {
                         "type": "string",                           
                         "description": "株式のティッカーシンボル(例:AMZN)"
                         }
         },
         "required": ["ticker"]
         }
}

LLMはこのスキーマを見て、「株価が必要な場面ではこのツールを呼び出せばよい」と判断し、適切な引数を生成してツールを実行します。

[Tool Use の流れ]

1. LLM にタスクとツールの説明や使い方を渡す
2. LLM がツールの利用を判断し、ツール実行クエリを渡す
3. ツールが実行されて(ツール実行のための仕組みが別で必要)、結果が返る
4. 結果を LLM に渡す
3. ReAct(Reasoning + Acting)

2023年のICLR論文で提案されたReActフレームワークは、「推論(Reasoning)」と「行動(Acting)」を組み合わせたアプローチです。

エージェントは次のサイクルで動作します:

1. Thought(思考):「現在の状況から、次に何をすべきか?」
2. Action(行動):ツールを呼び出す
3. Observation(観察):ツールの実行結果を受け取る
4. Thought → Action → Observation → ... を繰り返す

このサイクルにより、エージェントは環境から情報を取得しながら柔軟にタスクを進めることができます。

4. MCP(Model Context Protocol)

2024年11月にAnthropicがオープンソースとして公開したMCP(Model Context Protocol)は、AIとツールを繋ぐための統一規格です。

よく「AIツール接続のUSB Type-C」と例えられます。これまでAIと各種サービスを繋ぐには、それぞれ個別の実装が必要でした。MCPが登場したことで、一度MCP対応のサーバーを作れば、あらゆるMCP対応クライアント(Claude、Cursor、その他のAIツール)から利用できるようになります。

APIの接続しづらさを鍵に例えた画像

MCPの接続のしやすさをtypeCに例えた画像 
引用元:https://norahsakal.com/blog/mcp-vs-api-model-context-protocol-explained/

MCPの登場により、エコシステム全体でツールの再利用性が劇的に向上しました。

主要なエージェント開発フレームワーク

2025年現在、エージェント開発のためのフレームワークは急増しています。代表的なものを整理しました。

フレームワーク 提供元 特徴
Strands Agents AWS(OSS) シンプルなAPIで短いコードから始められる
LangGraphLang Chain グラフベースの柔軟なワークフロー定義
OpenAI Agents SDK OpenAI OpenAIモデルとの親和性が高い
Claude Agent SDK Anthropic Claudeとの深い統合
Google ADK Google Geminiモデルとの連携
Microsoft AutoGen Microsoft マルチエージェント会話の設計に強み

Strands Agentsのコード例

AWSがオープンソースで公開したStrands Agentsは、最小限のコードからエージェントを作れるシンプルさが特徴です。

最もシンプルなエージェント:
python

from strands import Agent 
  agent = Agent() agent("何か面白いことを言って!")


システムプロンプトを設定したエージェント:
python

agent = Agent(     model=model,     system_prompt="""
    あなたは AcmeCorp 社の出張予約エージェントです。
    従業員が会社のポリシーに準拠した出張を予約できるよう支援してください。
    """, ) agent("あなたは何ができますか?")

カスタムツールを追加する:
python

from strands import Agent, tool
 @tool def sum(a: int, b: int) -> int:     """Adds two numbers.
    Args:
        a: first number
        b: second number
    """     return a + b
 agent = Agent(tools=[sum])

@tool デコレータをつけるだけで、Pythonの関数をエージェントが使えるツールとして登録できます。型ヒントとdocstringから自動的にJSONスキーマが生成されるため、追加の設定が不要です。

AIコーディングエージェントの進化

AIはコーディングの世界にも大きな変革をもたらしています。コーディングエージェントは4つのレベルで整理できます。

Level 1:プログラムによる補完

IDEの自動補完や構文チェックなど、従来の静的解析ツール。AIではなくルールベースのシステムです。

Level 2:インラインAI補完

GitHub Copilotに代表される、コードを書きながらAIがリアルタイムで提案するスタイル。コンテキストを理解した補完が可能です。

Level 3:自律的なエージェントコーディング

Claude Codeに代表される段階です。エージェントが自律的にコードを書き、テストし、バグを修正するサイクルを回せる。人間はハイレベルな指示を与えるだけでよいです。

Level 4:長期・並列・マルチエージェント

複数のエージェントが並列で作業し、長期にわたるプロジェクトを協調して進める段階。2025年現在、研究・実用化が急速に進んでいる領域です。

Claude CodeはAmazon Bedrockでも利用可能になっており、AWSのインフラ上でAnthropicのモデルを使ったコーディングエージェントを活用できます。

Amazon Bedrock AgentCoreとは

AWSが提供するAmazon Bedrock AgentCoreは、AIエージェントをプロダクションレベルで運用するためのインフラサービス群です。

AgentCoreのコンポーネント

Amazon Bedrock AgentCore
│
├── Runtime(実行環境)
│   エージェントのコードを安全・スケーラブルに実行
│
├── Memory(メモリ管理)
│   会話履歴や長期記憶の管理
│
├── Identity(認証・認可)
│   エージェントの権限管理とセキュリティ
│
├── Gateway(ゲートウェイ)
│   外部APIやサービスへの安全な接続
│
├── Code Interpreter(コードインタープリタ)
│   エージェントがコードを動的に実行
│
├── Browser(ブラウザ)
│   Webブラウジング機能
│
└── Observability(可観測性)
    ログ・メトリクス・トレースの収集と可視化

AgentCore Managed Harness(Preview)

2026年4月22日にプレビューとして発表されたAgentCore Managed Harnessは、エージェントのオーケストレーションコードを書かずに、設定を埋めるだけでエージェントをデプロイできる仕組みです。

「どのモデルを使うか」「どのツールを使うか」「メモリをどう管理するか」といった設定を記述するだけで、実行基盤がすべて自動的に構築されます。

エージェント開発のライフサイクル

エージェントの開発は、4つのステップで進めるのが推奨されています。

Step 1:要件定義

最初に明確にすべきことは:

何を自動化・改善したいのか?(ユースケースの特定)
成功の基準は何か?(精度、速度、コスト)
どのくらいのリスクが許容されるか?(人間の確認ステップが必要か)

ポイント:エージェントが間違えたときに何が起きるかを考え、適切なヒューマン・イン・ザ・ループの設計が重要です。

Step 2:PoC(概念実証)

まず小さく試すことが鉄則です。

・利用可能なツールとモデルを選定する
・シンプルなプロトタイプを素早く構築する
・想定通りに動くかを評価する

Step 3:プロダクション化

PoCが成功したら、本番環境への投入に向けて以下を整備します:

信頼性:エラーハンドリング・リトライ・フォールバック
スケーラビリティ:負荷に応じたスケーリング
セキュリティ:認証・認可・入力検証
コスト管理:トークン使用量の最適化

Step 4:運用と改善

プロダクションに出してからが本番です。

観察:ログやトレースでエージェントの動作を監視
評価:定期的にパフォーマンスを評価
改善:失敗ケースを分析してプロンプトやツールを改善

エージェントの評価方法

エージェントの品質を測るためには、体系的な評価が必要です。

1. データセット作成:期待する入力と出力のペアを収集する
2. LLM-as-a-Judge:別のLLMを評価者として使う(人手評価のスケーリング)
3. 人間による評価:重要な判断は最終的に人間が確認する

LLM-as-a-Judgeは、大量のアウトプットを効率的に評価できる手法として注目されています。ただし、評価モデル自体のバイアスに注意が必要です。

この記事は後編に続きます

柏木大空愛/FIXER
こんにちは、25卒の柏木です。趣味は本を読むことです。よろしくお願いします。

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事