“流氓站点”是腾讯SOSO吗?

在网上看到一篇文章,说124.115.0.* 这个流氓站点可能是为腾讯SOSO的搜索引擎采集数据的。我不知道是不是这样,不过,就算你是搜索引擎,自己占那么多带宽也不对啊!那样拼命地抓就能赶Google超百度吗?要是不提高搜索算法等技术方面的硬指标的话,不过是痴人说梦而已!再有,假定它是搜索引擎的蜘蛛,也有以下的罪过:

  1. 搜索引擎的蜘蛛都打出旗号表明自己的身份,而该流氓却把自己伪装成IE6.0,跟做人一样,一点都不坦荡,这样缩头藏尾的肯定不是什么好东西。
  2. 从没见它读取robots.txt,说明它不愿遵守搜索引擎蜘蛛的规则,不尊重站长。
  3. 不分青红皂白,什么文件都抓,而且显然算法有问题,经常不断地抓同一个文件。
  4. 一点都不顾及对方的带宽,特别是抓本站的相册时,很多图片文件很占带宽,它却抓起来没完,中间毫不间歇,本人有十分宽的带宽都影响到了上网。这更是严重的自私行为,对别人缺乏起码的尊重。如果是腾讯就更说不过去了:当初他们抄袭了国外的通讯程序,而在国内推广时,不也是严重缺乏存储空间和带宽吗?现在有几个钱了,就不顾别人的死活了!

不过,今天发现它好像停了,不知道是全部停了,还是只是在本站停止这种骚扰了。如果它真的是腾讯SOSO的蜘蛛的话(这里说是如果,本人并不能确定它是不是),知道怎么对付它吗?这里教大家一小手(见下面的代码),轻轻一拨弄,不管你多大的劲,都让你从哪里来的就回哪里去,真正的“四两拨千斤”,正传的太极拳打法。:-) 这里只是一个示例,谁这样弄,结果自己负责。

RewriteEngine On
RewriteCond %{REMOTE_HOST} ^124.115.0..*$
RewriteRule ^/(.*) http://www.soso.com/ [R=301]

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注