
AI エージェントを仕組みから理解する
ARANK
はじめにこんにちは、ダイニーの ogino です。この記事では、AI エージェントや MCP に入門しようとしている人向けに、エージェントの内部実装について概説します。これを理解することで、現状の AI にできることが明確になり、今後の技術動向を追う上でも役に立つはずです。本記事の要旨MCP の表層的なプロトコルには大した意味も革新性も無いので、AI エージェントを理解するにはまずコンテキストを把握しましょう。素の LLM の能力と、エージェントの実装を切り分けるAI エージェントは、自律的に判断してファイル操作や Web ブラウザなどのツールを使い分けることが可能です。しかし、その基盤となっている LLM にできるのは、テキストを入力してテキストを出力することだけに限られます。以降では「LLM にできないこと」を掘り下げ、それを補うために AI エージェントがどのように実装されているのかを見てみましょう。LLM は記憶を持たないLLM は人間のような長期記憶を持ちません。モデルのパラメータはほぼ固定されており、個別の会話を即座に学習したり記憶したりすることはありません。では、複数回のラリーをしても文脈を保って会話ができるのはなぜでしょうか? …