このページの本文へ

AI検索「Perplexity」はクロール禁止のサイトから情報を取っているのか

2024年07月09日 13時15分更新

文● 田口和裕

　AI駆動の検索エンジン「Perplexity」がrobots.txtを無視して情報を収集しているのではないかという指摘が6月に報道されていた。現在の状況はどうなのか、実際にPerplexityで検証した。

robots.txtとは

　robots.txtは、ウェブサイト管理者がサーチエンジンのクローラーやボット（ウェブページを自動的に巡回して情報を収集するプログラム）に対して、サイトのどの部分にアクセスしてよいかを指示するテキストファイルだ。通常、ウェブサイトのルートディレクトリに置かれ、「https://www.example.com/robots.txt」のようなURLでアクセスできる。

　このファイルの主な目的は、サイトの特定部分をクロールから除外したり、サーバーの負荷を軽減したり、プライバシーや機密情報を保護したりすることだ。

　ただし、robots.txtは「紳士協定」的な性質を持つ。ボットがこの指示に従うかは任意で、法的拘束力はない。主要な検索エンジンは通常これらの指示を尊重するが、Perplexityはrobots.txtで拒否されているサイトのURLを入力すると、そのコンテンツを読み取って要約を提供するケースが報告されている。

実際に検証してみる

　例えば米Wiredのサイトを例に見てみよう。ブラウザーのアドレスバーに「https://www.wired.com/robots.txt」と入力するとrobots.txtがそのまま表示される。

　下の方にスクロールしていくと、Perplexityボットのアクセスを禁じるコードが記述されているのがわかる。

　もちろんPerplexity以外のAI系ボットもすべて塞がれている。

　実際、ChatGPTにWiredの記事のURLを直接入力してみるとこのように拒否される。

ChatGPT

　Gemini、Claude.aiも同様だ。

Gemini

Claude.ai

　だが、Perplexityで試すと回答の生成を始めた。とはいえ、よく見ると8つの外部サイトも同時に見に行っている。つまり米Wiredの記事はタイトルだけを参照しており、内容は別のクロールを許されているサイトから取得している、という解釈もギリギリ可能だ。　

Perplexity

　しかし「この記事を詳細に訳して」というプロンプトを入れるとWiredにアクセスして日本語訳を生成した。「Source」に表示されているリンクをクリックすると該当記事が表示されるが、一応「要約」ではある。

Perplexity

　しかし、とどめに「要訳ではなくて逐字（逐語）訳をお願いします」と入れると、しっかりWiredの記事全文の翻訳を開始した。

Perplexity

Perplexityの見解

　この問題について、PerplexityのCEO、Aravind Srinivas氏は、同社が意図的にrobots.txtを無視しているわけではないと説明している。

　氏によると「Perplexityは自社のウェブクローラーだけでなく、サードパーティのクローラーも利用しており、問題のクローラーはこのサードパーティのものである可能性がある」とのことだ。

　また、氏はrobots.txtが法的な枠組みではないと指摘し、AIの出現により新たな関係性が必要だと示唆した。さらに、出版社との「収益分配」契約の作業を進めていると述べ、業界との協力を模索する姿勢を示している。

　ただし、サードパーティのクローラー会社の名前は明かされておらず、具体的な対策についても明確な回答は避けられている。

新たな枠組みが求められている

　この問題は単にrobots.txtの遵守だけでなく、AIの発展に伴うデータ利用の倫理、著作権法の再考、そして新たなビジネスモデルの必要性など、より広範な課題を提起している。

　実際、ユーザーの利便性という点から見るとrobot.txtの遵守はマイナスに働くことがほとんだ。

　今後、AI企業、出版社、そして法規制当局が協力して、デジタルコンテンツの公平な利用と保護のための新たな枠組みを構築していくことが求められるだろう。この過程で、ユーザーの利便性とコンテンツ創作者の権利のバランスをどう取るかが、重要な論点となるはずだ。

■関連サイト

Perplexity.ai

ツイートする

カテゴリートップへ

AIオススメ記事

2024年11月25日

AI

3DモデリングにAI革命の兆し　1枚のイラストから3Dデータが完成
2024年12月09日

AI

画像生成AIの進化が早すぎる　2024年に起きたことまとめ
2024年12月02日

AI

イラストに強すぎる画像生成AIモデル　SDXL系「NoobAI-XL」の衝撃
2024年11月18日

AI

グーグルのAIがいきなり「死んでください」と言ってきたという報告
2024年11月18日

AI

あなたの作業を超効率化する、すごいAIサービス10選【2024年最新版】
2024年12月09日

AI

AI、人間超えた説　OpenAIの従業員が「AGIを達成した」との見方示す
2024年12月09日

AI

人気の画像生成AIツール「ComfyUI」デスクトップアプリがめっちゃラク　初心者にオススメ
2024年11月18日

AI

誰でもVTuber時代へ　フェイシャルAI技術、続々登場
2024年11月25日

AI

業界トップ級の画像生成AIツール「Recraft」　Adobeユーザーは体験する価値あり
2024年10月21日

AI

もはや実写と間違えるレベル　動画生成AI「Runway」の進化がすごい

ピックアップ

sponsored
ポータブルゲーミングスピーカー「TQ-PG300」

パイオニアの小型ゲーミングスピーカー、想像を超える没入感でめちゃくちゃ驚きなんですけど！
PCパーツ
12月14日（土）12時から、秋葉原の「LIFORK AKIHABARA II」で開催

ASCII主催「TOKYO Gaming-PC STREET 2」公式ガイド
sponsored
今回も医療機器認証取得で、かつ前モデルよりも薄く軽いサイズを実現！

スマートウォッチのようでこれは血圧計でもある!? 「HUAWEI WATCH D2 ウェアラブル血圧計」レビュー
sponsored
1本のサウンドバーで360立体音響が実現！

自宅で映画を見るならソニー「HT-A9000」が最高の選択だ
sponsored
「QuTS hero」はランサムウェア対策、安価なSSD／大容量HDDの導入など、中小企業オフィスでも役立つ

NASのデータ保護強化におすすめ！ QNAPのハイエンドOSが中小企業向けモデルにも対応
sponsored

狭い机という課題は「二刀流」で解決、いまあえて選ぶべき一体型パソコンが「IdeaCentre AIO 27IRH9」
sponsored
ゲーマーからクリエイター向けまで、オススメマザーを紹介！

Core Ultra 200Sで自作するならコレ！ASUSのクラス別Z890マザーボード5選
sponsored
自作の煩雑さやトラブルシューティングの手法は軽減！MSI「MAG Z890 TOMAHAWK WIFI」

光らない！ドラゴンなし！ Core Ultra 200S世代の硬派なゲーミングPC向けZ890マザーボードは、自作PC初心者にも簡単で分かりやすくておすすめ
sponsored
Backlogに招待するだけでは「使ってくれない」、ではどうする？

うまくいく！複数人チームでのプロジェクト・タスク管理立ち上げの方法
sponsored

手軽に“壁100インチ”の大画面を楽しもう！自宅が映画館になる「JMGO N1S Ultra 4K」を推す理由
sponsored
JN-38i160U-H-C9をレビュー

PS5 Proの4K/120fpsプレイを大迫力で！38型でKVM機能付きのゲーミング液晶がかなりイイ
sponsored
CyborgやThin、Clawなどが最大25%オフ！

AmazonブラックフライデーでMSIのゲーミングPCが即ポチレベルの格安価格で買えるぞ！
sponsored
リモートワーク環境はまだまだセキュリティ対策が不十分

ハイブリッドワーク中の社員PCがフィッシング詐欺被害！どうやったら防げた？
sponsored
高価格にも納得できるサウンド

7万円の高額ワイヤレスイヤホン「B&W Pi8」の音が、泣けるほど良かった
sponsored
JN-IPS27WQHDR-C65W-FLD-Tをレビュー

27型WQHDディスプレー最強格現る、昇降式・USB給電・KVM・タッチの超多機能で4万円台
sponsored
180Hzで0.5ms（GTG）のRAPID VAバネルを採用した「MAG 275CQRF QD E2」

5万円弱も納得の高速進化したゲーミングディスプレー。27インチならWQHDがおすすめなのにはワケがある
sponsored
UPS搭載で自作派・ゲーマーにも便利、防災の備えこそ、日常的に使いたい

防災用に「ポタ電」を買いたいなら、まずこの１台！　緊急時も日常でもちょうどいい「Jackery ポータブル電源 1000 New」
sponsored
Core Ultra 200搭載でAIという武器を得た2-in-1ノートPC「Summit 13 AI+ Evo A2VM」

AI PCでどれを買うか迷っている人におすすめ、ペンもタブレット機能も使える最新ノートパソコン
sponsored
インテル Core Ultra プロセッサー（シリーズ 2）を搭載した最新モデル登場

今後のPCはAI対応が当たり前になる、それならエイサーのCopilot+ PCがいいーー「Swift 14 AI」で生産性アップ
sponsored
「サイコム冬の特大キャンペーン2024」は2025年1月20日まで！

モンハンワイルズ推奨環境を満たすゲーミングPCが約20.5万円！デュアル水冷は2万円引きの祭が開宴
sponsored
ユニットコムの15.6型「STYLE-15FH128-i7-UHZX」をチェック

高コスパなBTOノートPCでホワイトモデルだと？いい色じゃないか
sponsored
Bowers＆Wilkinsの「Zeppelin Pro Edition」をレビュー

少しお金をかけて最高の音を手に入れたい人の、正解スピーカーを見つけました
sponsored
JAPANNEXTの開発中モデル＆最新注目モデルをまとめて紹介！【後編】

令和の時代にテレビ風デザイン!? ディスプレーも見た目で選ぶ時代が来たかもしれない
sponsored
Z世代が本当にほしいPCを目指して企画したモデル

推し活はかどるノートPC「LAVIE SOL」いいかも。けっこう欲しいかも。
sponsored
JAPANNEXTの開発中モデル＆最新注目モデルをまとめて紹介！【前編】

有機ELウルトラワイドに16:18の縦長ディスプレー！ワクワクが止まらないJAPANNEXTの開発中モデルを取材した
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！