Urchin 5 FAQ

+
★一般的に、下記ディレクトリのバックアップでよいかと存じます。


・Urchin環境情報 → /etc 、 /var
・プロファイルデータ → /data/report
・Urchin設定情報 → /utilにあるuconf-exportコマンドで設定情報をファイルに保存する。
  uconf-export -f <ファイル名>
  ※何かあったときに、uconf-importコマンドで設定情報を復旧できる。

★Urchinの一般的なディレクトリ構造を参照

bin:Urchinのバイナリ
data:設定ファイル、タスクスケジュールの履歴、プロファイルごとの解析DB
  conf:Urchinの設定DB
  geodata:Urchin固有のDNSとサイト固有のファイル
  history:月毎のトランザクションログとプロファイル毎の解析状況のログ
  report:プロファイル毎の解析DB
 doc:各種ドキュメント
 etc:マシン固有の設定ファイル
 htdocs:Urchin Webサーバのドキュメントルート、セッションコントロール
 lib:UIテンプレート、画像、カスタムログのフォーマットファイル、レポート設定、
   ルックアップテーブルのフィルタマピング
 util:ユーティリティ、UTMモジュールのサポートファイル
 var:Urchin Webサーバの設定、各種ログ、PIDファイル

   
+
はい、独自のパラメータをつける必要がございます。Urchinでは、utm_campaign、utm_medium、utm_sourceなどのパラメータを追加します。しかし、既存で運用されている場合は、パラメータを変更することはできません。
そのような場合は、ルックアップテーブル機能を利用しますと、現在ご利用のパラメータで解析可能です。
★Google Analyticsでは、ルックアップテーブルは使用できませんが、Urchinでは利用できます。
利用法は、下記のとおりです。
①パラメータ対応テーブルを作成します。現在のパラメータから、Urchinでレポートしたいソース、メディア対応テーブルを作成します。
例) mktid=M001  → 現在の解析用パラメータ
   #Fields:  utm_campaign    utm_medium    utm_source
    M001   Urchinpromo      cpc         google
    M002   Urchinpromo      cpc         Overture
    M003   Urchinpromo      email         news
    M004   Urchinpromo      banner      INTERLOG
②パラメータ対応テーブルをフィルタに追加します。使用するプロファイルにフィルタ(ルックアップテーブル)を追加します。

③次に、mktid=M001の”mktid=”をUrchinで認識できるようにする。 Urchinでは、”utm_id="であれば、認識できますが、”mktid=”では認識できません。
 その場合は、__utm.jsファイルのスクリプトを変更します。
  //-- mktid
   _ucid="mktid";
   urchinTracker();
  //-- END
+
訪問者数につきましては、どのレベルまでカウントするかによりまして、トラッキング方法が異なります。
★IPアドレス+UserAgentでのトラッキング(現状かと思います。)
一般のアクセス解析ソフトのトラッキング方法で、Urchinレポートでは、セッション数を訪問者数と捉えて大丈夫かと存じます。
ロボットのクローラーなども含めた、大体の訪問者数を知りたい場合は、このトラッキング方法でも充分でございます。
例)私がノートPCで会社と自宅で同一サイトに訪問した場合IPアドレス+UserAgentですと、セッション数は2となります。

★Urchin UTM これは、Urchin独自のCookeiを使用したトラッキング方法です。
UMを使用しますと、Urchinレポート画面の左メニューの
”トラフィック”と”ページ/ファイル”の間に、”訪問者とセッション”というカテゴリが追加されます。
そこで、訪問者数や初期訪問者かリピータかもレポートできます。
また、ロボットのクローラーは、セッション数や訪問者数にカウントされません。
例)私がノートPCで会社と自宅で同一サイトに訪問した場合
  UTMですと、訪問者は1でセッション数は2となります。
  しかし、会社と自宅でPCが違う場合は、訪問者は2でセッション数は2となります。
   
+
トラッキング方法により、異なります。
★トラッキング方法がIP+UserAgentの場合
 ロボットのクローラーもセッション、PVなどにカウントされます。
★UTMでトラッキングする場合
 ロボットのクローラーは、ヒット数と転送バイト数のみカウントされます。
 PV数には、カウントされません
+
フィルターを使用する方法と、トラッキング方法をUTMにする方法があります。 UTMの場合は、正確にレポートできますが、IP+UsrrAgentの場合はフィルターを使用します。しかし、IP+UsrrAgentの場合は、すべてのロボットを指定しないといけませんので、抜ける場合があります。
+
otherがカウントされている場合は、ページ数がテーブル数を超えた時に多くみられます。 「Other」を失くす(あるいは減らす)方法ですが、「DB テーブルの上限」を増やすことで対応できます。 設定変更方法としてGUIでは、下記の方法で設定変更してください。  管理画面 [構成]-[プロセス設定]-[DB テーブルの上限]で  MAX60,000に設定し、更新ボタンを押下してください。  60,000以上は、コマンドでDBテーブル数を増やすことができます。  ※DBレコード数の設定は動作環境ページを参照 プロファイルの”ストレージ/DB”タブのDB テーブルの上限は、ディフォルトで結構です。 次回から、反映されますが、過去のログが御座いましたら、ログソースで、ワイルカード(*)を使用して、解析したい過去のログファイルを複数指定して、はじめから解析して頂ければ、正常に解析できます。 既存のプロファイルを使用して、はじめから解析する場合は、一度、プロファイルのすべてのデータの削除が必要になります。  ※Urchinは、プロファイル毎に解析したタイムテーブルを持っていますので、   過去のログデータは、解析せずにスキップします。  ★プロファイルのすべてのデータの削除方法    プロファイル-”ストレージ/DB”タブ-DB のクリーニング-    ”プロファイルのすべてのデータの削除”-”すべてのデータの削除”押下。
+
Log File PathもしくはLog Formatが正しく設定されていない可能性があります。 Log Formatは、Extended Combined Log File Format(NCSA)を選択してください。 Log Settingsでもう一度ご確認ください。
+
スキップの原因ですが、プロファイル毎に解析したタイムレンジを管理していまして、解析済みタイムレンジ内のログデータはスキップします。 ★再解析方法   Urchinのユーティリティを使用して、指定日付のデータを削除して   再解析を行います。   udb-sanitizer(Urchinデータベース関連ユーティリティ)を使用します。 また、テストでプロファイルの全データを削除してよい場合は、DB/ストレージタブで、データを削除してから、再解析してください。
+
サーバ側のログフォーマットでリファラーが出力対象になっていない可能性が高いです。ログフォーマットをご確認ください。
+
フィルタパターンはGoogle Analyticsの下記サイトを参照してください。
★http://www.google.com/support/googleanalytics/bin/answer.py?answer=55572
  フィルタ種類 → 除外パターン
  フィルタ フィールド → c_ip(RAW)
  あとは、プロファイルに追加されますと除外されます。
+
除外する ディレクトリパターン /mydir の場合
  フィルタ フィールド request_directory(AUTO)
  フィルタ パターン (^/mydir/)