このサイトのアクセス解析を行いたくて awstats のローカライズを行いました。
といっても、awstats は元々日本語対応しています。
しかし、日本の検索エンジンやロボットがいまひとつ登録されていません。
そこでそれらを登録しました。
ついでに、awstats は access_log や referer_log からアクセス元を分析し、アクセス元に URL に含まれている文字列を分析し、どこの検索エンジンでどういうキーワードで検索してこのサイトにとだり着いたのか、分析してくれます。
しかし、アクセス元の検索エンジンによって、日本語の文字コードが異なり、文字コードによっては分析結果が文字化けします。
UTF8 だったら日本語のキーワードもきちんと分析されるのですが、EUC-JP や SJIS だと文字化けしてしまいます。
awstats はログ(検索文字列)の文字コード変換を行わずに分析を行うのでこうなります。
そこで、ログの文字コードを UTF8 へ変換してから分析を行うようにパッチを作りました。
この前も書いたけど、うちのサイトへは圧倒的に『九寨溝』で検索してたどり着いてます。
最近笑えた検索キーワードは『さわれる えっちな ゲーム』。どこにマッチしたんだろう?
