このページの本文へ

新清士の「メタバース・プレゼンス」 第64回

自分好みのAIチャット相手を簡単に作れる「Dify」が面白い

2024年05月20日 07時00分更新

文● 新清士 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

AIと著作権に詳しいLLMキャラ爆誕

 これにより、明日来子さんをAIと著作権に詳しいチャットボットへと拡張してみます。試しに、文化庁が3月に公開した「AIと著作権に関する考え方について(考え方)」PDFをナレッジに登録してみます。テキスト登録後、ベクトル情報と全文検索を可能にするハイブリッド検索に設定します。埋め込みモデルはOpenAIの「text-embedding-3-large」と最ランクモデルにはCohereの「rerank-multilingual-v3.0」を使いました。そうするとテキスト全体への解析が行われ、自動的にコンテキストとして使用可能なデータへと分けられます。

 それをコンテキストとして登録するだけで、明日来子さんは、考え方を著作権とAIについての専門家として振る舞いはじめます。

テキストをナレッジへと登録する設定画面

登録されたデータは、LLMで扱えるデータとして分割して処理される

コンテキストに分析済みのPDFを設定すると、明日来子さんは、専門的なデータを参照しながら、説明をするようになる。画面では著作権法の30条の4の解説をしてもらっている。LM Studioで動作させているが、もちろん、オンラインLLMのAPIを使っても同じことができる

 チャットボットにLLMを設定し、RAGを組み込むまでに必要だった時間は30分程度。慣れれば10分程度でできてしまう簡単さです。この環境は何よりもトライ&エラーを簡単にすることが可能です。非エンジニアであっても手軽にローカル環境でチャットボットのプロトタイプが開発でき、その修正作業を進めることができるようになりました。その点からも、注目されるようになったわけです。チャットボットをウェブサイトに埋め込むためのウィジェット作成などにも対応してくれていて、「ちょっと面倒くさいな」というところをすべてやってくれます。

「AIと著作権」に詳しい明日来子さんをアプリ化した状態。ただし、普通にハルシネーションを起こしていい加減なことも言うので、そのままチャットの発言を信用するのは危険です……

カテゴリートップへ

この連載の記事
ピックアップ