週替わりギークス第336回

ChatGPT、Gemini、Claude──特徴が異なるAI、どう使い分ける？

2025年12月13日 07時00分更新

文● きゅんくん

参考イメージ　Aerps.com | Unsplash

　近年なくてはならない存在になったLLM（大規模言語モデル）。

　GPTシリーズを皮切りに、様々なLLMが普及してきた。

　どんな風にどんなLLMと付き合っていったらいいのか悩むことはないだろうか。

　そこで、今回はLLMについてあれこれ考えてみたいと思う。

　あたりまえになったLLMってそもそもなんだっけというところから、筆者がどのようにAIを使い分けているかという日常の話まで、つらつらと書いてみたい。

　読者のみなさんがAIとの付き合い方を思い返すきっかけになれば幸いである。

まずはLLMの仕組みを簡単に解説

　LLM（大規模言語モデル）とは「large language model」の略だ。

　膨大な文章データを学習して、人間のような自然な文章を生成できるAI技術である。

　LLMの仕組みを簡単に説明しよう。

　LLMでは文章を文字のままでは扱えないため、最初に文章を「トークン」という小さな塊に分割する。

　塊は単語だったり、単語の一部だったり、句読点だったりする。

　たとえば、「今日は暑いですね」は「今日」「は」「暑」「い」「です」「ね」といった具合に分け、それぞれを多次元のベクトルへと変換する。

　このベクトル化の段階で、モデルは「意味が近い単語ほど似た方向のベクトルになる」ようにあらかじめ学習されている。

　「猫」と「犬」は近く、「猫」と「戦争」は遠い、というような地図のようなものが内部に形成されているわけだ。　ここから文章の理解が始まる。

　現在LLMに使われているモデル構造が登場する前のモデルは、文章を左から右へ順番に読む方式を採用していた。

　「RNN（リカレントニューラルネットワーク）」や「LSTM（Long short-term memory、長・短期記憶）」と呼ばれる方式がそれだ。

　文を一語ずつ処理するため、文の前半と後半が離れれば離れるほど関係を扱いにくかった。

　長い文脈を正しく保持できなかったのだ。　この問題を一気に解決したのが、現在のLLMに使われている「トランスフォーマー（Transformer）」というモデル構造だ。

Transformerとattentionこそ全て

　トランスフォーマーは、入力された文章全体を同時に見渡し、どの語がどの語とどれほど関係しているかを一瞬で計算できる。

　この全体を俯瞰する計算を支えているのが、「アテンション（attention）」という仕組みだ。

　アテンションでは、あるトークンが他のすべてのトークンに対して「どれくらい注目すべきか」を数値化する。

　たとえば、「私は銀行でお金をおろした」という文の「銀行」は、「お金」「おろした」と強く結びつき、「は」「私」とは弱く結びつく。この結びつきの強さを数学的な重みとして計算し、それを使って各トークンのベクトルを文脈に合わせて更新していく。

　この処理がアテンション層であり、トランスフォーマーではこの層を何段にも積み重ねている。

　層を進むごとに、各トークンは文のほかの部分から受け取る情報によって表現が少しずつ磨かれていく。モデルはこの過程で、次に来そうな語の方向性を絶えず見積もりながら、文の意味や流れ、微細なニュアンスを組み立てていく。言い換えれば、LLMは文章を読む段階からすでに“予測”をしており、その予測を手がかりとして文全体を理解しているのである。

　ただし、LLMの特徴はトランスフォーマーだけにあるわけではない。LLMは非常に大きなパラメーター数を持ち、膨大な文章を使った事前学習によって言葉の使われ方や一般的な知識を取り込んでいる。また、学習の後には微調整や人間のフィードバックが加えられ、より自然で安全な応答を返せるように仕上げられている。これらが組み合わさることで、LLMは翻訳や要約、創作など、多様なタスクをひとつのモデルでこなせるようになっている。

　実際に我々が使うのは、GPTシリーズやGeminiシリーズ、Claudeシリーズという具体的プロダクトになってくる。

　それらの違いや特徴についてまとめてみよう。