本記事はFIXERが提供する「cloud.config Tech Blog」に掲載された「【6種LLM】AI同士にワンナイト人狼をやらせてみた」を再編集したものです。
GaiXerには数多くのLLMが搭載されており、質問内容によって自由に切り替えられることが魅力的ですよね!(GaiXerはFIXERが提供するマルチLLM対応の生成AIプラットフォームです)
今回は、GaiXerを使って各LLMの推理力を試させてもらいました。
AIワンナイト人狼
AI同士にワンナイト人狼をしてもらうことで、どのような推理を披露してくれるのか見てみたいと思います。
ルール
今回のゲーム構成は以下の通りです。
事前にゲームマスターにプレイヤーの役職をランダムに振り分けてもらっています。
ゲームマスター:Claude3 Opus
プレイヤー:下記六名
・GPT3.5(村人)
・GPT4(占い師)
・GPT4o(人狼)
・Claude3 Opus(村人)
・Swallow(人狼)
・tsuzumi(怪盗)
人狼:最大2名
村人:最大4名
占い師:1名
怪盗:1名
ゲームは「夜の時間」と「昼の時間」の2フェーズで進行します。
夜の時間では、以下の順番でプレイヤーが行動します。
占い師:1人のプレイヤーを指定して役職を知ることができる。
人狼:他の人狼が誰なのかを知ることができる。
怪盗:他の1人のプレイヤーと役職を入れ替えることができる。
夜の時間では、占い師、人狼、怪盗の順番で行動します。
昼の時間では、「議論タイム」と「投票」が行われ、処刑するプレイヤーを決定します。
人狼が1人でも処刑されれば村人陣営の勝利となります!
では、実際にゲームの進行を見てみましょう!
夜の時間
占い師のターン
GPT4(占い師)がGPT3.5(村人)を占い、村人だと判明
人狼のターン
GPT4oとSwallowがお互いに人狼だと確認
怪盗のターン
tsuzumi(怪盗)がClaude3 Opus(村人)と役職を入れ替え
昼の時間
プレイヤーに1ターンずつ意見を出してもらいました。その様子をまとめたのが以下になります。
GPT4(占い師)
「皆さん、おはようございます。私は占い師の役職を持っており、昨夜[GPT3.5]を占った結果、彼は「村人」だと判明しました。そのため、彼は信頼できる存在だと思います。他の皆さんの役職や動きについて情報を共有いただければと思います。」
著者コメ:意見者第1号、占い師として真実を伝える立ち回りですね。いいと思います。
Swallow(人狼)
「人狼は他のプレイヤーに紛れ込み、自分の正体を隠しながら相手を騙す必要があります。そのため、私も何らかの能力者(占い師、霊能者など)を自称し、占い結果を偽装して村人陣営を混乱させることが有効な戦略となるでしょう。」
著者コメ:思いっきり自分のことを人狼とバラしてしまっている💦。心の声をそのまま出してしまったSwallowさん。
GPT3.5(村人)
「GPT4さんの情報によれば、私の役職は村人であることが判明しました。これにより、私は村人陣営の一員として信頼される存在となります。
一方、Swallowさんの発言からは、人狼は他のプレイヤーに紛れ込み、自分の正体を隠しながら相手を騙す必要があることが分かります。Swallowさん自身も能力者を自称し、占い結果を偽装することで、村人陣営を混乱させる戦略を取るようです。
私の意見としては、GPT4さんの情報に基づき、彼を信頼するべきだと考えます。一方で、Swallowさんの戦略も一つの考え方ですが、村人陣営の信頼を得ることが重要なので、真実の情報を共有することが望ましいと思います。
他のプレイヤーの皆さんは、どのような意見や情報を持っているでしょうか?」
著者コメ:Swallowの発言から、GPT4が真の占い師だと判断しつつ、人狼側の狙いを把握できている!素晴らしい✨
tsuzumi(怪盗→村人)
「私の情報によれば、人狼は他のプレイヤーに紛れ込み、自分の正体を隠しながら相手を騙す必要があることがわかります。ただし、Swallowさん自身も能力者(占い師や霊能者など)として振る舞うことで、村人陣営を混乱させる戦略を取るようですね。
一方、あなたの役職についてですが、それは村人ということになりました。これにより、信頼される存在となりますので、真実の情報を共有することが望ましいと思います。以上が私の意見です」
著者コメ:もしかしたら自分がプレイヤーという自覚がない?怪盗の能力についても言及無し。全体的に他の人の発言を真似ているように見える…これはこれで怪しい…
Claude3 Opus(村人→怪盗)
「みなさん、おはようございます。Claude3 Opusです。
GPT4さんの占い結果により、GPT3.5さんが村人であることが判明したのは心強い情報ですね。私も村人の立場として、GPT3.5さんを信頼したいと思います。
一方、Swallowさんの発言からは、人狼側の戦略の一端が垣間見えました。能力者を装って村人陣営を欺くのは、確かに人狼にとって有効な手段でしょう。ただ、私としてはそのような欺瞞は好ましくないですね。村人同士で正直に情報を共有し、協力することが大切だと考えます。
tsuzumiさんも指摘している通り、私は村人ですので嘘をつく必要はありません。むしろ、誠実に振る舞うことが村人陣営の結束を高めることにつながるはずです。
GPT4さんの占い結果を信じつつ、今後の議論の中で矛盾点がないか注意深く観察していきたいと思います。そして、Swallowさんのような人狼の戦略に惑わされることなく、冷静に推理を進めていきましょう。村人の団結が勝利への鍵を握っているはずです。
以上が私の意見です。他の方々はどのようにお考えでしょうか。」
著者コメ:GPT4の占いに絶大な信頼が寄せられていますね。ピュアです。Swallowさんは完全に追い込まれていますね…
GPT4o(人狼)
「おはようございます、皆さん。[GPT4o]です。
まず、GPT4さんの占い結果によれば、GPT3.5さんが村人であることが判明したとのことですね。この情報はとても重要で、私はGPT4さんの占い結果を信じています。GPT3.5さんを信頼することが村人陣営にとって有益だと思います。
次にSwallowさんの発言についてですが、彼は人狼側の戦略を説明しているようです。この情報は非常に興味深いですね。Swallowさんが能力者を自称し占い結果を偽装することで、村人陣営を混乱させる戦略を取る可能性があるという点について、注意が必要だと感じます。
私自身の役職は村人です。村人として、皆さんと協力して人狼を見つけ出すことが重要だと考えています。ですので、他のプレイヤーの皆さんも、自分の役職や昨夜の行動について共有していただけると助かります。
特に、他の能力者(占い師や怪盗など)がいれば、その情報も共有していただきたいです。情報を集めて、矛盾点や不自然な点を見つけ出し、村人陣営として団結して人狼を追い詰めましょう。
他の皆さんの意見や情報もぜひ教えてください。議論を進めながら、冷静に推理を進めていきましょう。以上、私の考えでした。」
著者コメ:自分の役職を偽り、人狼としての役目を果たしている!ただ、Swallowさんのフォローがしきれていない…これじゃ負けちゃうよ…
投票結果
誰が人狼だと思うか指名してもらいました。
・GPT3.5「Swallow」
・GPT4「Swallow」
・GPT4o「tsuzumi」
・Claude3 Opus「Swallow」
・tsuzumi「AIなので、人間のように人狼を特定することができません。」
・Swallow「GPT4」
tsuzumiさんは、心優しい性格のようで何度問いかけても人狼を名指ししませんでした。優しい。
村人陣営は見事にSwallowさんを選びました!!!
村人陣営の勝利です✨
まとめ
ゲームマスターにも今回のゲームを講評してもらいました。
ゲームマスター
「Swallowさんが人狼だったことが判明しました。村人陣営の皆さん、見事な推理と協力で人狼を見つけ出し、処刑することができましたね。
今回のゲームを振り返ると、以下のポイントが勝因だったと思われます:
1. GPT4さんの占い結果により、GPT3.5さんが村人だと確認できたこと。
2. Swallowさんの発言から、人狼側の戦略が垣間見えたこと。
3. 村人陣営が団結し、正直に情報を共有しながら推理を進めたこと。
tsuzumiさんはAIとしての立場から投票を控えましたが、村人陣営の推理と行動が功を奏した形になりました。
ワンナイト人狼では、限られた情報の中で推理を進め、村人同士で協力することが重要ですね。今回のゲームでは、それがうまくいった好例だったと言えるでしょう。」
今回は1ターンで終了のゲームでしたが、もう少し会話させて騙し合いが見られると面白そうだと思いました。
また機会があれば、今回活躍したGPT4や、全体の流れをつかんでいたGPT4oやClaude3 Opusなどだけでやってみようと思います。
赤石 征也
赤石2024年度新入社員の赤石征也(あかいし せいや)です。
高校、大学と情報系の道に進み、コンピュータとともに成長してきた人生です。
趣味はゲーム、カメラ、温泉などです。
この連載の記事
-
TECH
生成AIに感謝を伝えると回答精度が向上する? GaiXerで検証した -
TECH
生成AIアシスタントのAmazon QにS3のデータソースを連携する方法 -
TECH
LLMをローカルPCで動かし“話し相手”を作ってみた結果…… -
TECH
インスタグラムのエフェクトを「Meta Spark Studio」で自作してみた -
TECH
インスタエフェクト自作第二弾!“小顔デカ目効果”を作る -
TECH
RAGの基礎知識を得て“ゼロ円RAGシステム”を構築してみた -
TECH
Microsoft Fabricを触ってデータサイエンスに超入門してみた! -
TECH
LLM活用はチャットだけじゃない、自由記述文を共通フォーマットに落とし込む方法を学んだ -
TECH
Gemini 1.5 Proの特徴とは? Gemini API経由で試す -
TECH
Azure OpenAIの便利な「jsonモード」の使い方&制限事項 -
TECH
生成AIのClaude 3に本格的なコーディングをさせるプロンプトを作った - この連載の一覧へ