Urchin FAQ 基礎編

+
デモライセンスには、作成可能なプロファイル、ログソース数に下記の制限があります。
デモライセンスを使用する場合は事前に計画を立て、有効期限内に確認作業が終了できるようご対応ください。

・作成できるプロファイル数:5プロファイル
・プロファイルに割り当てられるログの数:2個
・試用期間:30日間
+
初期設定インストールディレクトリ
 Linux → /usr/local/urchin
 Windows → C:\Program Files\Urchin
●ディレクトリ構成
 ~/bin/ 実行ファイル
 ~/data/ レポート・地域データ等
 ~/doc/ ドキュメント類
 ~/etc/ 各種設定ファイル等
 ~/graphics/ 画像(Windowsのみ)
 ~/htdocs/ コンテンツ
 ~/lib/ ライブラリ等
 ~/util/ ユーティリティ類
 ~/var/ pidファイル・動作ログ等

これらのディレクトリ構造で、最もディスクスペースが多くなるディレクトリは解析データを保存する「data/」ディレクトリです。 Urchin を運用する際は、十分な容量が確保できるように設計する必要があります。
Urchin 解析データベースは、生ログデータの約10%程度の容量を必要とします。ディスクの容量を確保する場合はサイトで作成されるログと、データ保存期間を見越して計算することを推奨いたします。
+
ページビュー数、ダウンロード数、有効ヒット数、すべてのヒット等様々な単位が使用されていますが、これらの単位は、それぞれ対象となるリクエストの条件が異なります。

ページビュー数
 プロファイル設定>レポートタブで「ページビュー照合拡張子」設定項目に合致したもの
 ステータスコードが 20x, 302, 304
 "GET"または"POST"メソッドのみ
 UTM 情報が正しく記録されている(ユーザートラッキング方法が UTM の場合のみ)

ダウンロード数
 プロファイル設定>レポートタブで「ダウンロード照合拡張子」設定項目に合致したもの
 ステータスコードが 206 を除いた 20x, 302, 304
 "GET"または"POST"メソッドのみ

有効ヒット数
 全てのファイルタイプが対象。
 ステータスコードが 20x, 302, 304
 全てのメソッドが対象

すべてのヒット
 全てのファイルタイプが対象。
 エラーも含めた全ステータスコードが対象
 全てのメソッドが対象
   
+
POSIX 正規表現をサポートしています。

+
ログマネージャ(ログのプロファイル)のログファイルのパスで、ファイル名指定をワイルドカードで行なってください。
例えば、ログファイルが access20100701.logのようになっている場合は、access2010*.log とすればマッチするファイルをすべて分析します。

+
Urchin では zlib ライブラリを使用してファイルを解凍するため、Urchin のログ処理エンジンでは圧縮の種類 (bzip (.bz2)、gzip (.gz)、zip (.zip) のいずれか) にかかわらず 2GB 以上のウェブサーバー ログを処理できます。
ただし、Urchin のログ処理エンジンでは util ディレクトリの unzip/zip バイナリを使用して、各プロファイルのレポート データのバックアップやアーカイブを作成します。 このため、1 か月のレポート データが ZIP ファイルにして 2GB を超えるほど大きい場合、Urchin でバックアップやアーカイブを作成することはできず、自動バックアップと自動アーカイブを無効にしない限り、ログ処理はできません。
この場合、他の外部ユーティリティを使用して、手動でファイルをバックアップする必要があります。
+
Urchin レポートのすべてのレコードは、固定サイズのデータベースに保存されます。また、データベースを構成するファイルは 1 か月ごとに入れ替わりますので、テーブル数が不足した月末近くに「other」が出現します。 テーブル数が上限に達すると「other」のレコードにまとめられます。
テーブル数を増やすには、システム全体または個別のプロファイルの選択できますが、一度解析されたレポート結果には反映されません。 「other」を取り除くには、再解析が必要です。
上限を増やすと、使用するディスク領域が増え、大きいデータベースからデータを取得するため、Urchin レポート インターフェースでのレポート ビューの表示に時間がかかるようになりますので、ご了承ください。

+
クエリ パターンは、[上記のコンテンツ] のレポートには表示されず、 [ページ クエリ パラメータ] のレポートに表示されます。
[上記のコンテンツ] のレポートにすべてのページとクエリ パターンを表示するには、次のフィルタを使用してデータの表示方法を変更します。
注: このフィルタを適用したプロファイルは処理時間が長くなります。
  また、固有のページ名が増えるため、データベースの制限を超える場合があります。
 次の設定で新しいプロファイル フィルタを作成します。

フィルタの種類: アドバンス
フィルタ A: request_stem (AUTO) ? 引用 A (.*)
フィルタ B: request_query (AUTO) ? 引用 B (.*)
出力先: request_stem (AUTO) - 構成 $A1/$B1
フィールド A は必須: はい
フィールド B は必須: はい
出力フィールドを上書き: はい
大文字と小文字の区別: いいえ

+
画面右上の [構成] をクリックします。
内部トラフィックを除外するプロファイルの横にある [編集] アイコンをクリックします。
[フィルタ] タブをクリックします。
[+ (追加)] アイコンをクリックします。
[サンプル フィルタ] プルダウン メニューから [内部トラフィックの除外] を選択します。

  フィルタ種類 → 除外パターン
  フィルタ フィールド → client_ipaddress(RAW) 
  フィルタパターン → 内部IPアドレスを指定 
   ★IPアドレスの指定方法  ⇒ 参照ページ
[完了] をクリックします。
あとは、プロファイルに追加されますと除外されます。
+
自分のサイトからの参照を参照元レポートから除外するには、urchin.js ファイルを若干変更する必要があります。
テキスト エディタでファイルを開き、次のセクションを挿入します。

//-- Referral domains to Ignore
var _uRno=new Array();
_uRno[0]=".urchin.com";

上記の例では、.urchin.com を含むヒットが参照から除外されます。 追加するドメインがある場合は、ファイルを編集して _uRno[x] 値を追加し、x の数値を自由に増やせるようにします。 次に例を示します。
//-- Referral domains to Ignore
var _uRno=new Array();
_uRno[0]=".urchin.com";
_uRno[1]=".urchin.net";
_uRno[2]=".urchinsoftware.com"

urchin.js を編集した場合は、更新後のファイルをウェブサーバーにアップロードして変更が反映されるようにする必要があります。