
メールの下書きやちょっとした質問への回答にAIチャットボットを使ったことがありますか?もしあるなら、すでにAIの力を体験していることになります。でも、AIがもっと多くのことをできたらどうでしょう?単に質問に答えるだけでなく、次に何をすべきかを判断し、問題を論理的に解決し、さらには自分の作業を自分で見直してくれるとしたら?それがAIエージェントの世界です。
このガイドは、技術的な背景がない日常ユーザー向けに、チャットボットから始まり、AIワークフロー、そしてAIエージェントへと段階的に理解を深める構成になっています。
レベル1:大規模言語モデル(LLMs)
AIエージェントを理解するには、まず基本となる「大規模言語モデル(LLM)」について知る必要があります。ChatGPT、Google Gemini、ClaudeなどのAIチャットボットは、すべてこのLLMの上に構築されたアプリケーションです。
人間が「プロンプト」と呼ばれる入力を提供し、それに対してLLMが出力を返すという、一問一答のシンプルな仕組みです。例えば、「コーヒーチャットのお願いメールを書いて」と頼むと、丁寧なメール文が返ってきます。
ただし、LLMには次のような限界があります:
- 個人データの知識がない: LLMはあなたの予定や会社の内部情報などにはアクセスできません。
- 受動的な性質: 入力がなければ何もしません。自発的にタスクを開始することはできません。
レベル2:AIワークフロー
AIワークフローとは、人間が定義した一連のステップに基づいてAIが動作する仕組みです。たとえば「イベントについて尋ねられたらGoogleカレンダーを検索する」ように指示することができます。
この手法は、限定的ではありますが外部ツールとの連携を可能にし、少し高度な自動化を実現します。ただし、設定されたステップ以外は実行できないため、柔軟性には限界があります。
AIワークフローでは、たとえば以下のような処理が可能です:
- ニュース記事リンクの収集(Google Sheets)
- 記事要約(Perplexityなど)
- SNS投稿の作成(Claudeなど)
- 毎朝8時に自動実行
このように、一連の操作をスケジュール化して自動化できますが、最終的な品質チェックや改善は人間が行う必要があります。
レベル3:AIエージェント
AIエージェントでは、LLM自身が「考え」「行動」し、「自己改善」も行えるようになります。つまり、人間が定義したルールを超えて、自ら判断しタスクを実行できるのです。
たとえば、SNS投稿を作るという目標を与えると、AIはニュース記事の収集方法から最適なツールの選定、内容生成、さらには仕上がりの自己評価まで一貫して実施します。
このときの基盤フレームワークがReAct(Reasoning + Acting)です。これはAIが推論しながら実行するモデルで、従来のワークフローに比べて非常に柔軟です。
また、AIエージェントは反復と自己修正も可能です。例えば、自分が作成した投稿文を別のLLMにチェックさせ、必要に応じて修正し、再評価するというサイクルを人間の手を介さずに繰り返すことができます。
実例:AIエージェントの活用シーン
あるビジョンAIエージェントでは、「スキーヤー」というキーワードを受け取ると、以下のような動作をします:
- 推論:「スキーヤーとはどんな人物か?」を定義。
- 行動: 動画の中から該当する映像を自動で抽出・タグ付け・表示。
このプロセス全体がAIにより自動実行され、人間の介入は不要です。
まとめ:AIとの3つの関わり方
特徴 | レベル1:LLMs | レベル2:AIワークフロー | レベル3:AIエージェント |
---|---|---|---|
インタラクション | 人間が入力し、LLMが出力 | 定義されたルートを実行 | 目標達成のために自律的に思考・行動 |
特徴 | プロンプトに応答するだけ | 人間が手順を設計 | LLMが意思決定者 |
機能 | テキストの生成・編集 | 外部ツールと連携 | 計画、実行、自己修正 |
例 | メールの下書き作成 | 予定を確認して回答 | SNS投稿を自動生成・改善 |
要約すると:
- レベル1: プロンプト入力→出力だけの受動的なAI。
- レベル2: 指示されたワークフローを忠実に実行するが、柔軟性は限定的。
- レベル3: AIが自ら判断して最適な手法を選び、タスクを完了。反復・改善も可能。
今後の学びを深めるために
AIとの付き合い方をさらに高めたい方は、自分用のプロンプトデータベースをNotionなどで構築するのもおすすめです。今後も関連チュートリアルや解説を発信していきますので、ぜひご期待ください。