このページの本文へ

前へ 1 2 3 4 次へ

新清士の「メタバース・プレゼンス」 第64回

自分好みのAIチャット相手を簡単に作れる「Dify」が面白い

2024年05月20日 07時00分更新

文● 新清士 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

ノードベースでさらに複雑な処理が可能

 さらに、もうひとつ踏み込んで話題になっているのが「ワークフロー」です。画像生成AIでは「ComfyUI」がノードベースでの処理を可能にするため、視覚的にプログラミングをするように手順を決められることからかなり複雑な処理ができるように発展しているのですが、LLMの世界にもそういう技術が登場してきているのです。一つ一つの処理を定義したノードをつなぎ合わせていくことで、複雑な作業をさせることができます。

ワークフローの例

 単純なサンプルですが、このワークフローでは外部サービスを組み合わせて、LLMに複雑な動作をさせています。それぞれの四角がノードで、左から右へと処理が進んでいきます。ユーザーが単語を入力すると、その単語をプロンプトにしてDALL-E 3で画像を生成、さらにその単語をWikipediaで検索して該当する項目があった場合、LM StudioのCommand R+がその単語を説明する内容を100字以内に要約して、テキストと画像を一緒に出力するという仕組みです。もちろんチャットボットと同様にアプリ化して実行することができます。ChatGPTにおける「GPTs」のようなものをこれまでよりも簡単に作れてしまうわけです。

 かつ、このアプリがどれだけ使われたか、どのくらいトークンを使っているかといった統計データもちゃんと取ってくれて、APIの使用量からコストも推計してくれるので、サービスとしての費用感もわかりやすくなっています。当然のようにハルシネーションも起こすのですが、回答に対して、ポジティブやネガティブの評価を行っていくと、どの程度の割合でミスをするのかを確認するといった使い方もできそうです。

 そういう意味でも、非常にユーザーフレンドリーなアプリです。事業化時にリリースする最終的なプロダクトは、手打ちして自前で組み込んだほうが望ましいということも考えられますが、
プロトタイプの開発までは便利です。我々がおもちゃにするにもうってつけです(笑)。

Dify環境で生成した明日来子さん

 これをローカル環境と組み合わせれば、雑なAITuberが作れてしまうんじゃないかという期待は抱かせるものがありますね。この連載から、AITuber「明日来子ちゃん」が生まれてくる日は近いかもしれません。

 

筆者紹介:新清士(しんきよし)

1970年生まれ。株式会社AI Frog Interactive代表。デジタルハリウッド大学大学院教授。慶應義塾大学商学部及び環境情報学部卒。ゲームジャーナリストとして活躍後、VRマルチプレイ剣戟アクションゲーム「ソード・オブ・ガルガンチュア」の開発を主導。現在は、新作のインディゲームの開発をしている。著書に『メタバースビジネス覇権戦争』(NHK出版新書)がある。

前へ 1 2 3 4 次へ

カテゴリートップへ

この連載の記事
ピックアップ