このページの本文へ

4~5割のロボットを無視するAnalyticsの解析方式 (5/6)

2009年06月15日 19時16分更新

文●中野克平/デジタルコンテンツ部編成課

  • この記事をはてなブックマークに追加
本文印刷

サーバーログ型のアクセス解析ツールの目的:サーバーパフォーマンスの計測

「Google Analyticsのようなビーコン型のアクセス解析ツールは、簡単にいうとマーケティング担当者向けのツールということは分かりました。では、他の解析方式のツールは、システム管理者向きということなのでしょうか?」――解析方式という側面でいえば、サーバーログ型やパケットキャプチャ型のアクセス解析ツールは、システム管理者向きです。

 しかし、製品でいうと、解析対象を500万PV以下に制限しているGoogle Analyticsは大規模サイトには向いていませんし(Google AdWordsの広告主は無制限)、たとえ小規模サイトでも、集計に時間がかかるGoogle Analyticsは検索キーワードの変化を瞬時に読み取り、トップページに掲出する見出しを変えて売り逃しを避けたい、といった用途には向いていません。それでもやはり、解析方式の違いが、製品の得意分野を決めてしまうのも確かです。

 サーバーログ型のアクセス解析ツールは、サーバーリソースを計測し、適切なマシンスペックやシステム構成を調べたり、エラーの有無を把握して対応したりするために使います。JavaScriptもCookieも使いませんので、個々のセッションを正確には管理できません。また、ユーザーの利用環境も把握できません。そのかわり、すべてのページにJavaScriptのビーコンプログラムを組み込まなくても、アクセスを解析できるのがメリットです。Google Analyticsの元になったUrchinシリーズは、サーバーログ型のアクセス解析ツールです。

 同じ指標でも、ビーコン型とサーバーログ型では、見る人の立場で意味が違ってしまいます。以下は、ASCII.jpのあるサブドメインの、時間帯別のページビューです。

9時から5時までのワーキングアワーにアクセスが集中し、12時にアクセスが落ち込んでいる

9時から5時までのワーキングアワーにアクセスが集中し、12時にアクセスが落ち込んでいる


 Webサイトのマーケティング担当者ががこのグラフを見れば、

「9時から5時までのワーキングアワーにアクセスが多く、お昼休みと夜から翌朝にかけてのアクセスが少ないということは、勤務時間中に、仕事の調べ物のために使われているWebサイトである。媒体資料には、ビジネスパーソンにリーチするWebサイトと書こう」

と思うでしょう。一方、サーバー管理者が同じグラフを見たら、

「ページビューのピークは午前11時台なので、11時台のアクセス数を元に考えれば、パフォーマンス上の問題は起きないだろう」

と思うでしょう。

 サーバーログには画像やCSS、PDFファイルなど、HTML以外へのアクセスログも残っています。Google Analyticsは基本的にHTMLが何回ユーザーに表示されたしか調べられませんが、サーバーログ型のアクセス解析ツールであれば、一番アクセスの多い画像ファイルが何かも分かります。

 サーバーログ型とビーコン型アクセス解析ツールの最大の違いは、この点にあります。たとえば、「全ページの左上に表示されているロゴマーク画像が実は20KBもあり、ネットワークトラフィックを食いつぶしている」かどうかは、Google Analyticsのレポートをどんなに見ても分かりません。サーバーログ型ならではのメリットです。

 ただし、サーバーログ型のアクセス解析ツールでは、個々のサーバーの指標は集計できますが、サーバーの負荷を分散させるため、1つのドメイン名に複数のサーバーを割り当てている場合、Webサイト全体の指標は分からなくなります。複数のサーバーのログを読み込む機能のあるサーバーログ型のアクセス解析ツールもありますので、運用形態に合わせて、導入時に確認するとよいでしょう。Google Analyticsのようなビーコン型のアクセス解析ツールでは、こうした手間はありません。

 なお、サーバーログ型のアクセス解析ツールの多くは、Urchin 6のようにJavaScriptのビーコンに対応しています。純粋な意味での「サーバーログ型」はほとんどなくなっており、ビーコン型とサーバーログ型の境界線はかなり薄らいでいるのが現状です。

(次ページ)パケットキャプチャ型のアクセス解析ツールの目的

この連載の記事

一覧へ

この記事の編集者は以下の記事をオススメしています