サーバーログ型のアクセス解析ツールの目的:サーバーパフォーマンスの計測
「Google Analyticsのようなビーコン型のアクセス解析ツールは、簡単にいうとマーケティング担当者向けのツールということは分かりました。では、他の解析方式のツールは、システム管理者向きということなのでしょうか?」――解析方式という側面でいえば、サーバーログ型やパケットキャプチャ型のアクセス解析ツールは、システム管理者向きです。
しかし、製品でいうと、解析対象を500万PV以下に制限しているGoogle Analyticsは大規模サイトには向いていませんし(Google AdWordsの広告主は無制限)、たとえ小規模サイトでも、集計に時間がかかるGoogle Analyticsは検索キーワードの変化を瞬時に読み取り、トップページに掲出する見出しを変えて売り逃しを避けたい、といった用途には向いていません。それでもやはり、解析方式の違いが、製品の得意分野を決めてしまうのも確かです。
サーバーログ型のアクセス解析ツールは、サーバーリソースを計測し、適切なマシンスペックやシステム構成を調べたり、エラーの有無を把握して対応したりするために使います。JavaScriptもCookieも使いませんので、個々のセッションを正確には管理できません。また、ユーザーの利用環境も把握できません。そのかわり、すべてのページにJavaScriptのビーコンプログラムを組み込まなくても、アクセスを解析できるのがメリットです。Google Analyticsの元になったUrchinシリーズは、サーバーログ型のアクセス解析ツールです。
同じ指標でも、ビーコン型とサーバーログ型では、見る人の立場で意味が違ってしまいます。以下は、ASCII.jpのあるサブドメインの、時間帯別のページビューです。
Webサイトのマーケティング担当者ががこのグラフを見れば、
「9時から5時までのワーキングアワーにアクセスが多く、お昼休みと夜から翌朝にかけてのアクセスが少ないということは、勤務時間中に、仕事の調べ物のために使われているWebサイトである。媒体資料には、ビジネスパーソンにリーチするWebサイトと書こう」
と思うでしょう。一方、サーバー管理者が同じグラフを見たら、
「ページビューのピークは午前11時台なので、11時台のアクセス数を元に考えれば、パフォーマンス上の問題は起きないだろう」
と思うでしょう。
サーバーログには画像やCSS、PDFファイルなど、HTML以外へのアクセスログも残っています。Google Analyticsは基本的にHTMLが何回ユーザーに表示されたしか調べられませんが、サーバーログ型のアクセス解析ツールであれば、一番アクセスの多い画像ファイルが何かも分かります。
サーバーログ型とビーコン型アクセス解析ツールの最大の違いは、この点にあります。たとえば、「全ページの左上に表示されているロゴマーク画像が実は20KBもあり、ネットワークトラフィックを食いつぶしている」かどうかは、Google Analyticsのレポートをどんなに見ても分かりません。サーバーログ型ならではのメリットです。
ただし、サーバーログ型のアクセス解析ツールでは、個々のサーバーの指標は集計できますが、サーバーの負荷を分散させるため、1つのドメイン名に複数のサーバーを割り当てている場合、Webサイト全体の指標は分からなくなります。複数のサーバーのログを読み込む機能のあるサーバーログ型のアクセス解析ツールもありますので、運用形態に合わせて、導入時に確認するとよいでしょう。Google Analyticsのようなビーコン型のアクセス解析ツールでは、こうした手間はありません。
なお、サーバーログ型のアクセス解析ツールの多くは、Urchin 6のようにJavaScriptのビーコンに対応しています。純粋な意味での「サーバーログ型」はほとんどなくなっており、ビーコン型とサーバーログ型の境界線はかなり薄らいでいるのが現状です。