blog@youzyでタグ「Baiduspider」が付けられているもの

百度、といえば、沸点!

...じゃなくて、百度といえば、ええ、baiduspiderの、あの百度です。

百度は中国国内で圧倒的なシェアを占めている検索エンジンですが、このたび日本向けサービスを始めたとのこと。

Baiduspider 再び

|

百度なる中国産検索エンジンのクローラー、Baiduspiderについては年明けに駆除を実施した

が、どうもアクセス解析を見ているかぎり相変わらずガツガツとアクセスがある。
あんれー、なんか間違ったかいなぁとちょっと見直し。
以前httpd.confに追加した設定は↓

SetEnvIf User-Agent Baiduspider robots

Order deny,allow
Deny from env=robots

んー、特に問題ない。

で、アクセス解析にはWebalizerを使っているのだが、直接Apacheのaccess_logを観察。

60.28.22.89 - - [14/Jan/2007:10:47:06 +0900] "GET /blog/2006/08/post_32.html HTTP/1.1" 403 227 "-" "Baiduspider+(+http://www.baidu.com/search/spider_jp.html)"

んー、アクセス来てるねぇ。で、403になってるねぇ。

って、いいんじゃん。403で弾かれてるからWebalizer上で出てきてても。

あー、無駄に考えてしまった。

Baiduspiderめ...

|

昨日の夜にボーっとアクセス解析見てたら、なんだか1カ所からやたらとアクセスが。
ホスト名がwww89.asd.tj.cn。cnってChinaだよなー、チャイニーズから変なことされてんのかなーと思いつつUser Agentを見ると、Baiduspider+(+http://www.baidu.com/search/spider_jp.html)だと。
spiderってことはクローラーなんでしょうなぁ、行儀悪そうですな。
ということで"Baiduspider"でググる。とまぁ、出るわ出るわ被害報告が(笑)

どうせうちのサイトなんてアクセス少ないから別に負荷云々は気にしないけれど、無性にむかついたんでココを参考にhttpd.confを編集して弾くことに。
しかし、こっから長かった(涙)

まず、自宅サーバにアクセスするためにPoderosaを立ち上げる。
ん? Poderosaがver.3のままだ。会社ではとっくにver.4にしていて使い心地が格段アップした。なのでついでにPoderosaをバージョンアップすることに。
インストーラをDLしてカツカツとインストール。さー、立ち上げようとしたら、".NET Framework ver.2が入ってないよん"だと。
そーだ、ver.4から.NET Framework ver.2が必要だったわ。っていうか今まで俺のPCに入ってなかったんだ^^;

ということで、Microsoft Update経由で.NET Framework ver.2のインストールを試みる。が、一覧に出てこない...
あれー、おっかしーなー。っつーか、俺のPCは未だにWindows XPのSP1だったんかっっっ!!
.NET Framework 2.0 必要システムを見てみるとXP SP1じゃ駄目なのね、ハイ。
SP2になるとMS謹製のファイヤーウォールとか入れられるのがウザイんでアップデートしてなかったけど、しょうがないのでSP2にする。

が、アップデートプログラムが、異常終了凸(▼▼)#
マジですか... なんか最後のところで異常終了になったんで多分大丈夫なんだろうけれど、ものすごく不安。
ていうか、MS死ね。

PCでの割れポンの録画が始まったんで再起動もできず、中途半端なまま就寝。

で、今日の朝に思い切って再起動。なんだかいつもと違う起動画面が出たが、見なかったフリしていると、無事起動。
どうやらちゃんとSP2になってるようね。よかったよかった。
で、.NET Framework入れてPoderosa立ち上げて云々かんぬん、元の目的のBaiduspider弾きを実行した、と。

あー、糞長かった。こんなこと正月にやるもんじゃねぇ。
それもこれも全てBaiduspiderが悪いんだ!
なんだか中国お手製の打倒Googleなサーチエンジンらしいが、さすが中国やることがちがう。
アタックならお手の物ってか、オイ。
相変わらず中国からのspamメールも多いし、インターネットの世界ではホント癌だな、癌。
実世界でも(ry

Techonrati

Technorati search

» リンクしているブログ