アクセス解析の異常値

2006年7月24日(月) 23時52分 by level
B ?

何気なく、サイトのアクセス解析結果を見ていたら以下のような箇所を見つけました。

リクエスト数: バイト数の割合 (%):        最終アクセス時刻: ファイル
------------: ------------------: -----------------------: --------
       19745:             42.38%: 2006年 7月23日 00時00分: /mozilla/rss.xml
        4279:             12.93%: 2006年 7月23日 00時00分: /mozilla/index.cgi
         ...
合計   63229:

これ、1日分のログなのですが、RSS へのアクセスが1日で2万件、全転送量の42%、全アクセス数の30%ですって?! いくらなんでもこれは異常なアクセス数です。この日だけが異常なわけではなく、ログが残っている1ヶ月間こんな調子でした。生ログを残すようにしたので、どこからアクセスされているのか調べてみようと思います。

それとも、これくらいが普通なんでしょうか?

更新

なるほどこれが普通なんですね :-)

早速生ログができていたのでざっくり調べてみました。

13971   Mozilla系
  10674 Firefox
  414   BonEcho
  56    Minefield
  484   Thunderbird
  841   Sage

3995	Fenrir Headline-Reader Plugin
117	Opera
479	MSIE
1323	FreshReader
330	NATSU-MICAN

10	Bloglines		746 subscribers
9	livedoor FeedFetcher	519 subscribers
43	Hatena RSS		310 subscribers
4	FEEDBRINGER		156 subscribers
72	Feedpath		104 subscribers
6	DELCO READER		22 subscribers
22	Netvibes		20 subscribers
58	NewsGatorOnline		18 subscribers
12	PAIPO-Bot		7 subscribers
11	NewsAlloy		4 subscribers

56      不明
        その他省略多数
22925	合計

やはり、Firefox のライブブックマークがすごいことになっていました。この中にユニークユーザがどれだけいるのかが気になりますが、あとで調べてみます。

後半のオンライン型サービスのほうは総じてお行儀がよいようです(最大の Feedpath でも20分おき)。数百人分の需要を10回程度のアクセスで代表しているわけで、トラフィック削減に大きく貢献しています(その分、サービス側にアクセスが集中するわけですが)。以前、トラフィックの無駄ということで、Bloglines からのアクセスを禁止している人がいましたが、これを見てもむしろ削減に大きく貢献していることがわかります。

最終更新: 2006年7月25日(火) 12時59分

コメント (3)

1 7/25 06:19 おおやま
(c1) [2006/07/25 06:19:27] by おおやま

 想像にしか過ぎませんが、フィードの内容だけを表示するアプリケーションの普及、フィードを収集するサイトのロボットによるアクセス、フィードからメールアドレスを取得するためのロボットのアクセスの増加等が考えられます。

 特に後者二つが特に多いんじゃないでしょうか。出典は記憶していませんが、あるブログサイトではログの解析の結果、そういったロボットによるフィードへのアクセスが 15 分毎に来ているということも書かれていました。

 当然問題視されてました。

2 7/25 08:42 くでん
(c2) [2006/07/25 08:42:24] by くでん

http://deztec.jp/design/06/06/20_rss.html
うちもRSSへのアクセスが圧倒的です。Firefoxでライブブックマークに登録されているかたも多いでしょうし、その他フィード購読ツール利用者も普通のサイトに比べてとても多いのではないかと。けど、かなり前からフィードによるトラフィックの増大は問題になってましたよね。
ttp://japan.cnet.com/news/media/story/0,2000056023,20074363-2,00.htm
ttp://www.kanzaki.com/memo/2004/12/09-1
ttp://www.remus.dti.ne.jp/~a-satomi/nikki/2004/12a.html
ttp://hotwired.goo.ne.jp/news/technology/story/20040525303.html
画像を一気に見たい!とおっしゃられていたときにも感じたのですが、ネットワーク(や他者)にがんがん負荷をかけて自分が楽をしようというのが現在の「先進的なWeb利用者」なのかなぁ?と感じています。

3 7/25 09:10 dynamis
(c3) [2006/07/25 09:10:50] by dynamis

悪質なボットについては除外した方がよいのでログはチェックしておくと良いですが、アクセス数的にはそんなものかと思います。異常じゃないです。
# 特に Firefox 関連サイトはフィードの使用者も多いでしょうしね。
私のところのサーバでは主要なボットによるアクセスは別のログに分けて統計から除外していますが、同じようなものです。

配信とかいいつつユーザが(一昔前の更新確認ソフトよりもこまめに)定期自動巡回させてるだけですからね。リーダーが gzip に対応してればまだましですが、リーダーの行儀が多少悪いからといって通常ユーザからのアクセスは遮断できません。ブロードバンド時代だから受け入れられる技術でしょうね。

トラックバック

トラックバックは検索対象外です。

この記事にリンクしているページ < >

  1. 閾値以下のデータしかありません。