标签归档: 网站

关于自己现有的计算机设备的思考

前段时间,惠普塔式服务器出现故障,于是切换到更小巧更节能更静音的惠普微型服务器N54L
。虽说它的显示卡更好,分辨率更高,不像以前的服务器那么粗糙,但是它的性能却是有不少的下降。当然,该服务器原本就是为了当文件服务器用的,所以CPU和内存都不太出色,而且还没有光驱!其实,打开机盖,可见当初设计时是为光驱预留了空间的,上面还有一个电源接口。可是,我费了好大力气把它拆开(因为微型,所以内部设计过于紧凑),结果发现没有多余的插槽来接数据线!我本想把原来服务器上的光驱装上的!这样,如果没有USB外置光驱的话(我只有一个15年前买的SonyCD-ROM光驱),当然是不够用的。现在装Linux都要DVD才行。当然,现在要买一个USB的外置DVD可写光驱也很便宜了,只需3000日元左右。另一个方案是用USB内存卡装。我有一个古老的1GB的内存卡,居然无法制作可启动盘,原因是无法格式化为FAT32格式,只能格式化为FAT格式,不知到为什么。

不论如何,以前曾装过Linux,虽说不是最新版,但只有先凑合用着。又费了些力气,把它设置好,并把原来的网站和数据库移植了过来。终于又顺利上线了。

之后,又在里面虚拟了一个Windows XP机器,打算做台式机用。因为现在用的苹果笔记本里装的Windows XP系统,已经“盘满为患”。所以,服务器下线也影响到外部存储。但是,虚拟机性能太差,用作台式机的话实在难受,比我十多年前买的台式机都差,于是只好先放在那里。

后来又想到用Linux服务器兼作台式机,至少上上网、收发一下电子邮件总还行吧?可能的话,还可以用于软件开发。结果上网还算勉强可以,但别指望看视频(YouTube等),速度实在不行,而且还没装声卡;收发Email更是慢得令人难以忍受。于是,只好继续用现在的苹果笔记本。又费了点时间把Samba服务器再次设置好,可以负担一部分存储的任务,让笔记本硬盘的存储压力得以减轻。

后来发现现有的Linux版本有很多限制。而如果擅自把PHP、MySQL等升级的话,又会使得现有网站程序无法正常运行!看来PHP的版本兼容性实在太差。以前也曾经有好几次升级后不得不对很多网站程序到处修修补补,这次实在暂时无此精力,于是只好先这样用着。于是想到了之前发生故障等那台塔式服务器,仔细检视了一下主板,发现似乎并无大碍。 我原以为之前的硬盘出现了问题,换一个原来的硬盘(之前用的是最初的HP塔式服务器的硬盘直接接进去的),经过尝试用USB内存卡安装无效后,由于设置好了Samba,在服务器里下载了新版Linux的安装盘镜像文件,再通过Samba在笔记本里刻录成DVD光盘,在塔式服务器里安装。结果光盘安装程序启动失败!

于是对硬件检查里一下,主要是测试了一下内存,发现内存有大量问题!把内存都拆下来,再装入一个2GB的内存条,检测正常!再装一个2GB内存条,结果还是正常。看来是另外两条512MB内存有问题。想不到内存居然也会出问题,可能是因长时间运行产生的过热所致吧?

于是再次开始安装。这次终于顺利安装好了。虽说有很多问题尚待解决,比如不能上网(!),但至少一切都正常了,而且恢复了一台功能较强大的服务器(显示卡差点),可以用来在新版Linux下调试网站程序,修复不兼容问题。而且试了一下新版操作系统,居然能认得我的佳能打印机,这样就有望用做打印服务器。

但是,我还是计划继续使用现在的微服务器,因为它又省电又静音。塔式服务器可以在需要时开机。

服务器的现状

  • 网站服务器
  • 文件服务器
  • Linux开发环境(偶尔会用到)

不成功的功能:

  • 虚拟机(Windows XP系统)
  • 台式机(Linux系统)

以后计划要做的:

  • 把操作系统升级到最新版本
  • 打印服务器
  • 私用的云服务器(用于跟iPhone等设备连接,并存储一些文件,可在各个设备上同步)
  • 流媒体服务器(用于存储和共享一些关于孩子的视频)
  • VPN服务器(用于在海外旅游时,从手机访问一些难以在当地访问的网站)

现有其他硬件设备

苹果笔记本电脑:2009年年初买的,用了6年半了,现在性能还是够用。只是几年前原厂的电池鼓了,在网上买了一个较便宜的电池(可能是代工工厂流出的),但目前在外面只能用1个小时左右,换言之,没有电源的话,基本上无法在外面使用。120GB的硬盘,分给Windows系统30GB,也基本满了。

对策:

  • 买个新的笔记本电脑:新的苹果笔记本看上去很好:更轻更薄;电池续航能力也有10个小时左右;显示屏更精细;硬盘也换成了内存式的SSD固态硬盘,存取更加快速;各接口也更先进;操作系统也更好。但CPU似乎没有显著的提高,没有光驱,而且内存条做死在主板上,无法自己扩充。内存问题应该是苹果的赚钱策略,但让人有点不爽。
  • 自己换电池,并换一个内存式SSD固态硬盘:目前的SSD硬盘还是有点贵,而且还要把原来的内容都弄到新硬盘上,因为这些麻烦而有点不太情愿。
  • 把苹果笔记本主要当台式机用,在外面使用iPhone:现在在外面主要用iPhone 5s。iPhone的很多程序其实比计算机版更好用,比如一些网上银行应用等金融、理财、投资方面的应用。缺点除了计算能力差(毕竟不是真正的计算机),无法用于软件开发等任务外,主要有两个弱点:屏幕太小,以及键盘更小。屏幕的问题是不容易解决的,虽说换一个iPhone 6s Plus的话能在一定程度上解决,但并非根本性的解决。可是由于程序更好用,用习惯了也不错。键盘的问题却是致命性的,如果写一封较长的Email,要花很大精力。我最近买了一个Logicool的小巧的蓝牙键盘Logicool iK1041,基本上解决了这一问题。又轻又薄,而且具有防水功能,在咖啡馆里把咖啡打翻在上面也不怕。虽说携带型差些,无法装入衣服口袋里,但要写一篇长文章的话,真的很好用。我这篇文章就是用该键盘在iPhone上写的。

iPad Pro还是MacBook?

苹果的新产品发布会上介绍的iPad Pro的确比较吸引人:它不但有匹敌甚至超过笔记本电脑的计算能力,而且更能配合Apple Pencil使用,能手写输入,可以快速记录,或画草图,更可以用来进行书法和绘画的创作,因为它不但毫无时滞,而且还能表现出不同粗细的笔触。同时,它能同时在一个屏幕上显示两个程序,可以一边参照资料,一边工作。还有画中画的功能,在工作时开着新闻视频或在线视频聊天窗口,一心二用。然而,尽管可以用新的附属键盘把它打扮成笔记本的样子,但受制于其iOS操作系统,它还是不是真正的计算机,对于笔记本电脑的一些十分基本的多窗口功能,它还是无法实现。这多少有点让其超强的硬件显得可惜了。

MacBook则是功能强大的笔记本电脑,同时跟以前的版本相比,又更轻更薄,在携带型上并不亚于iPad。当然,iPad能拿出来就用,而笔记本电脑则不得不先在桌上放下,打开机盖,然后才能使用。虽说听上去并没什么,但在某些情况下,这点小差别还是很重要的。而且也不能在屏幕上手写输入。这主要是对快速记录和艺术创作有影响。对于艺术家来说,就算接上了手写板,也总比不上直接在屏幕上”所见即所得”地创作吧?

对于我来说,目前基本没有艺术创作的需要,因为我缺乏这方面的才能。不过,我曾经想学习书写梵语,而梵语由于在佛教中被看得很神圣,写完了是不可以随意丢弃或放到不恰当的地方的。在这种情况下,当然是在电子设备上书写更方便,对于不再需要的作品,可以简单地删除掉。因此,在一些特定的情况下,对我这种非艺术家的用户也是很有用的。

我的职业由于是程序员,因此,笔记本电脑的软件开发能力对我来说就更重要。因此,如果二者选其一的话,我会选MacBook,之后有必要时再添一个iPad Pro。

iPhone 6s Plus?

我其实并不喜欢那么大的屏幕。现有的iPhone 5s携带性很好,也不会因为放在裤子的后兜里坐下而把它折弯,但屏幕还是有点小,尤其是用于阅读和写作时。iPhone 6s可能大小比较合适,但追求屏幕的实用性的话,也许就应该牺牲一些携带性了。还有就是iPhone 6s Plus具有iPhone 6s所没有的拍摄防抖功能。

我目前并没有换手机的紧迫性,但现有手机是有SIM锁定的,只能用Docomo的昂贵服务,而不能用不断兴起的廉价手机服务(严格说,其实也能使用租用Docomo网络的分销商的廉价手机服务),也无法在海外用其他的电信公司的卡。因此,以后可能还是要因为上述各种理由而更换手机。在这种情况下,可能就是iPhone 6s Plus了吧?

台式机?

如果能像苹果电视那样十分小巧便携,而且又不贵的话,倒是可以考虑。但现在也没有紧迫性。强调便携性也是为了方便地带到其他地方使用。

现在其实有一些这类产品,包括苹果自己也有。但尺寸小了,性能未免要有所下降。这样,就不如继续使用笔记本电脑了。因此,目前来看,只要有笔记本电脑倒是也足够了。

更换了服务器,及由此想到的

俗话说,“倒霉的时候喝凉水都塞牙”。刚发布完上一篇文章,想到要更新一下系统,就更新了一下并重新启动一次。上次重新启动是在大约半年前,当时我刚刚回到国内,Web服务器就突然不工作了。系统重启后顺利解决。之后就一直没有重启过系统。这次重启后,过了一段时间,服务器突然再次自己重启!而且,从log里找不到任何蛛丝马迹。想到现在天热,而且风扇和散热片很长时间没清理了,就决定趁此机会彻底清理一下。于是,清洗散热片,清洗风扇叶片,清洗服务器前面板,重新涂导热胶,并把这些一一装回。再次启动系统。结果第二天,我发现服务器居然是停着的!启动时,我注意到一条错误信息,说保存的记录已满。于是,赶紧到BIOS里看了一下,结果让我很惊讶:里面充满了错误记录,说CPU的电压不稳。其表现是电压突然增高,然后1秒后又恢复正常,不断地重复着这种过程。再次启动后,也是过一段时间就死机。看来麻烦大了。。。

开始,我一直以为是我做错了什么导致的,因为在我更新系统以及清洗硬件之前,系统一直持续工作。为什么偏偏在我做完这些后出问题了呢?我起初怀疑系统更新有问题,就将几个可疑的程序退回原来的版本。这样还不行,我就怀疑硬件的问题了:是我取下CPU时做错了什么吗?再次取下,发现几个触点处有点污渍,于是将其擦掉。然后是导热胶没布满CPU后盖(商品说明上让加一个米粒大小,我已经加了黄豆大小了。。。),但回忆起原来是涂满的,于是,再涂了一些,直至涂满。但问题依旧。于是,取来明亮的LED照明设备,仔细观察了一下主板上各处,终于发现有两个电容器外表不正常,有点鼓了。由于主板主要是用电容器来稳压的,看来这就是问题真正的原因了。想到它从2007年初购买回来一直24×7地持续工作到现在,不禁让我心里有一种悲戚的感觉。

事已至此,看来该服务器是难以简单地修好了,除非DIY一下把那两个电容器换了。但与此相比,还有更便捷的方法:在2010年时,通过服务器赚了一点点钱,但这台服务器死慢,于是,就进行了一项小小的设备投资,用了旧服务器一般的价格从网上拍来一台下一代的服务器。当时也是觉得一台服务器风险太大,有个备份总是好的。但鉴于服务器噪音大,耗电量多,而且系统升级后原服务器的速度突然提高了不少(看来是原来的Linux Distribution有问题),加之在新服务器上装系统后居然连不上网,由于当时比较忙,就把它搁置在一边了。这次拿出来,检查了一下,上不了网的原因居然是DNS没设置好的缘故(系统安装后上不了网的确比较荒谬)。于是,索性下载了下一个版本的操作系统,把这台服务器初步设置好了。由于这台服务器有4核的CPU(原来的为双核),而且原来的1GB内存也用旧服务器上的5GB内存换掉了,因此,系统资源比较充足。显示分辨率也由原来的1024×768提高到1280×1024。没办法,服务器的显示就是这么差(也是为了把好钢用在刀刃上吧)。可惜了我的显示器了。由于系统资源比较足,为了充分利用,就又在里面虚拟了一台Windows XP的虚拟机出来,速度还不错。我已经很长时间没有自己的台式机了。。。

之后就是恢复各个网站。于是从旧服务器里拆下硬盘,装到新服务器里。我突然想,是不是先直接这样用着再说?于是,就把原来的硬盘设置为启动盘,打开电源后,系统顺利启动!我原来一直担心长时间使用后,硬盘会出故障,因为硬盘高速转动且存在接触和摩擦。看来,硬盘倒是还好。至此,网站系统就都恢复了。只是这个系统是32位的(当初为了和在一台PC机上装的Linux环境兼容和互换),而且操作系统比新装的系统低了一个版本。看来,还是要找机会把系统移植到新的硬盘上,彻底进入64位的时代,以便充分发挥硬件的潜力。。。

但是,由此而产生的一个问题是,原来作为文件服务器的存储空间的一块ATA/IDE的硬盘下线了,因为新的服务器里没有ATA接口。。。由于旧服务器里不但有SATA接口,也有ATA接口数个,于是,决定继续利用一下旧服务器。为了不损害硬盘上的数据,就找出2008年退役的那台PC机,取下里面的那块ATA硬盘,作为启动盘。服务器倒是顺利启动了,并能凑合着安装一个Windows XP。而且,还从原来的旧硬盘里找到一些当时的文件。虽说没有太大的价值,总比没有好。另外,我顺便观察了一下那台旧PC机的主板,发现CPU附近的七八个电容器都坏了。这台PC机是在2004年初买的,在2008年搬家后因经常莫名其妙地掉电而退役的。我原来觉得计算机的硬盘是最容易坏的部件,因为它不停地高速转动和经常性的摩擦。不过,看来主板上的电解电容器更容易坏。。。另,这台DELL的PC机仅断断续续地使用了4年半主板上的电容就坏了,在此鄙视一下。与之相比,HP的旧服务器一直连续用了6年半才坏掉两个电容,相比而言,也算是可靠性高了(尽管我还是期望它能继续工作)。

这样,本次事件就暂时尘埃落定。之后就是把ATA硬盘上的文件拷贝出来。至于这两块ATA硬盘,可以买个硬盘接口到USB的变换连线来连到计算机上,作为外接硬盘使用。当然,为了美观的话,买个硬盘盒也是不错的选择。或者,我会把旧服务器甚至旧PC机的主板修好,让它们再次回归。

近来真是祸不单行啊。不过,事情都是有其两面性的,雨天有雨天的好处。通过这次服务器事故,获得的好处有:

  • 正式启用更强大的新服务器,而不是让它继续沉睡
  • 多了一台Windows XP虚拟机
  • 促使我尽快转为64位系统
  • 找出了一块旧硬盘,并找回一些旧文件
  • 在我有充足的时间时,旧服务器显露出问题,而不是在我忙得不可开交时出现,让我能有时间解决问题
  • 找到了旧服务器和旧PC机的问题所在,必要时有望修好
  • 提高了忧患意识,促使我尽快做出备份系统
  • 或多或少地锻炼了一下我对系统管理和诊断的能力(尽管我并不觉得很需要这种能力)
  • 促使我对负面事件的正面思考,不为世间之事迷惑

“要接受人生中的一切。人生中发生的事情都是中性的,无所谓好坏。事情的好坏取决于你如何解释它。因此,接受人生中的一切,就会获得内心安定的人生。”

“要信赖人生。只有能够信赖人生,才能获得幸福。什么是信赖人生呢?就是在心里有幸福的基准。如果认为获得他人的尊敬和有高收入是幸福,那么只要失去这些,就会立即变得不幸。信赖就是相信出现在自己的人生中的事情都是为了让自己幸福的。一般认为不幸的那些事情,到事后回想一下,那只是为了让自己更加幸福的一些契机而已。”

以上两段话出自《ユダヤ人大富豪の教え》。这两段话讲述了很深刻的道理。我学习佛法,自然对这些事情有自己的理解,但还是有点惊讶于犹太人和犹太民族文化的智慧。

根据道家的说法,“否极泰来”,当极端不幸的时候,一定要坚持住,因为这往往是黎明前的黑暗。此时,更应该高兴才是。而从佛法来说,哪有什么幸与不幸?一帆风顺的时候幸运吗?幸运怎么还会出生在这个世界?怎么会继续造下那么多的恶业?在祸不单行的时候不幸吗?不幸怎么会促进人们再次对事情深刻地思考?怎么会更加警醒,更加认识到在顺境里其实是如普贤菩萨所说“是日已过,命亦随减,如少水鱼,斯有何乐“,更加体会到”当勤精进,如救头然,但念无常,慎勿放逸“?另外,做恶梦算不幸吗?做美梦算幸运吗?说来说去都是空空如也。。。尽快从不管是美梦还是恶梦的梦境中醒来才是重要的,就像我那台新服务器一样。。。

禁止360蜘蛛的大量抓取

近来发现我的服务器负担很重,CPU的风扇不时地呜呜叫。打开log一看,原来是360的蜘蛛在大量地抓网页。

本来,搜索引擎的蜘蛛来抓网页,我们应该本着欢迎的态度。但是,我的服务器和带宽实在有限,而且我也不靠网站谋生,因此,我必须尽快结束它的抓取。

查了一下,它是查看robots.txt的,但不知道它是否遵守,因为要大约1天的时间才能知道。但网上有人说它忽视robots.txt。由于我不能再等,为了尽快降低服务器的负担,我以重定向的方法把这些蜘蛛的访问引向360.cn。这绝不是出于某种恶毒的心理,只是相当于拿镜子发个信号,或是像用车灯对前面的车打个信号一样,督促其注意。具体的语句如下(放在.htaccess文件或Apache的配置文件里):

RewriteCond %{REMOTE_ADDR} ^(182.118.2)
RewriteRule ^.*$ http://www.360.cn/ [R=301,L]

RewriteCond %{REMOTE_ADDR} ^(61.55.185.1)
RewriteRule ^.*$ http://www.360.cn/ [R=301,L]

RewriteCond %{REMOTE_ADDR} ^(101.226.1)
RewriteRule ^.*$ http://www.360.cn/ [R=301,L]

RewriteCond %{REMOTE_ADDR} ^(42.62.37.189)
RewriteRule ^.*$ http://www.lenet.com.cn/ [R=301,L]

最后一项是针对来自“Forest Eternal Communication Tech”(IP为42.62.37.189)的长期大量的访问。它没表明网络蜘蛛的身份,但不像是某个人的正常浏览,因此也禁止之(重定向到其公司网站)。

看着360蜘蛛轻快地完成“抓取”而出现的一片片log,心里十分畅快!服务器的负担终于降下来了。

另,我本人十分不喜欢360的各种软件产品,总是觉得所有人都应该尽快卸载掉它们。这里没有任何特别的感情色彩,纯粹是从用户的角度出发而做出的建议。

追加:又一个不读取robots.txt的YYSpider:

RewriteCond %{REMOTE_ADDR} ^(101.227.4.23)
RewriteRule ^.*$ http://www.yunyun.com/ [R=301,L]

现在为什么是个人就能弄个网络蜘蛛,而且上来就大量抓取?真是令人无奈。

法国网络流氓

记得以前看过GRE词汇,“法国流氓”有一个专门的单词。这次有一个比腾讯更流氓的:大量地试图向你的网站发肮脏的垃圾留言。

它的IP显示为ksnnnnnn.kimsufi.com。其中“nnnnnn”为随机的数字。在本站,它首先试图黑本站的CGI程序,不成功后,发现了本站的相册,就大量地发垃圾留言。前两天,我检查网站情况时意外发现大量的留言(都是留在里层,不容易发现)。同时,在网上一查,发现本站的相册网址居然在检索到的色情网站上出现,其原因就是这些垃圾留言。于是赶紧编一程序,立即将其全部删除。

把它封了后,它还是在不停地试,于是就将其解封,重定向回www.kimsufi.com,让它自己跟自己玩去吧(英语的话就是让它fuck with himself)。

设置方法(Apache服务器):

RewriteEngine on
RewriteCond %{REMOTE_HOST} .+.kimsufi.com
RewriteRule ^/(.*) http://www.kimsufi.com/ [R=301]

抽样统计了一下,从2009.03.25 00:27:50到2009.03.27 04:57:20,访问的IP和次数如下:

213.186.56.40:   261
213.186.61.112:    25
213.251.135.145:  40
91.121.11.219:      288
91.121.26.15:       285
94.23.43.216:      294
94.23.43.217:      290
94.23.43.229:     291

显示的地址:

ks23234.kimsufi.com
ks24763.kimsufi.com
ks2562.kimsufi.com
ks2992.kimsufi.com
ks369348.kimsufi.com
ks369349.kimsufi.com
ks369361.kimsufi.com

都是在法国的OVH公司(http://www.ovh.com)登录的IP。

追记(2009.04.05):

写完本文后,我就发了一封Email给OVH,反映kimsufi.com的spam的行为,但是,到今天还是没有收到任何回复。看来,哪里都一样。法国的该公司比我们中国的公司的唯一好的地方就是不会给你回一封Email,说你的投诉地址无效。但真的是“天下乌鸦一般黑”啊。kimsufi.com仍一如既往地但徒劳地试图向本站发垃圾留言,当然都被重定向会它自己了。

I emailed OVH to report the spamming behavior of simsufi.com, but I haven’t gotten any response back, and simsufi.com is still spamming this site frequently (but in vain of course).

国内网络公司盛产IT流氓

本来被soso折腾了一番,很是恶心,把两大段的IP地址屏蔽掉,以为终于清静了,不曾想今天又来了过于大量的访问。刚开始还不太多,最近两天越来越变本加厉,过去的24小时内访问11386次,过去的5分钟内访问87次(平均3.45次/秒)!而且访问的都是以图片为主的相册,跟先前的soso如出一辙。当然,它也把自己伪装成来自Windows XP的IE6的普通访问,而且从不访问robots.txt,简直让人怀疑是不是soso新开的分号。

查了一下,发现好像是来自深圳的,IP地址是:

58.61.164.*

二话不说,屏蔽之没商量。由于有好多的IP地址,估计又是一个想一口吃成胖子的做搜索引擎的梦的公司所为。

不禁要问,作为网络公司,毕竟披着一层文化的外衣,大家表面上也算斯文人吧?为什么到了看不见脸的网络上就干脆表现得像地痞流氓一样不要脸了呢?古人云:文如其人。我们搞IT的,也应该把起码的修养带到我们的程序里。

记得很久以前,在网上联系免费教英文的一个人,他听说我是程序员,就提出让我帮他编写一个大量发垃圾邮件的程序,被我立即拒绝了。虽说不是什么大不了的事,但我认为这是我们起码的职业道德。

服务器的微恙

今天早晨5点多,我就被一阵巨大的噪音吵醒,好像是吸尘器的声音。我心里想,谁这么早就在吸地?后来实在受不了了,就起来要关窗户,结果发现声音来自我的服务器!赶紧关机,就继续睡了。

今晚上下班回家,把服务器搬出来打开一看,我的天啊!前面板后面积满了灰尘,好厚啊!二话不说,赶紧使出我的绝技—-吸尘大法,瞬间就结束了战斗。

把服务器各种电缆线再接上,开机,正常启动。

看来,搞IT的尽管给人以脑力劳动者的印象,但经常也得干干体力活。。。

服务器里的灰尘照片:

server_dust.jpg

“流氓站点”果然是腾讯SOSO,及最终解决方案

这段时间以来,被各地站长深恶痛绝的“流氓站点”果然打出了SOSO的旗帜,总算敢于表明自己的身份了。它在日志里留下如下的标志:

124.115.4.190 – – [18/Jan/2008:21:48:58 +0900] “GET xxx 403 185 xxx “Sosospider+(+http://help.soso.com/webspider.htm)”

于是我到它的网站访问了一下,看到下述的回答:

4.sosospider访问给我的网站造成很大负载怎么办?

sosospider的正常访问并不会对您的网站造成很大负载。如果您发现有名为Sosospider的agent抓取影响了您正常的服务,请尽快和我们联系。您可以将信息反馈至sosospider@tencent.com,如果能够提供您网站该时段的访问日志将更加有利于我们的分析。

5.我可以拒绝sosospider访问我的站点么?

sosospider遵循robots协议。该协议的详细信息可以参考http://www.robotstxt.org/wc/robots.html(英文网站)。注意:禁止sosospider访问您的网站,将使您的网站在搜搜网页搜索引擎中无法被用户搜索到,请慎重使用。

本人评论:

4: 不会造成”很大”负载?多大算很大?

5:纯粹的谎言。我查了过去一个月的日志,该蜘蛛还是频繁地来,却从来没访问过本站的robots文件。

本来本人对搜索引擎还是相对宽容的,尤其是新兴的。有一个硅谷的新兴搜索引擎,搜索界面还没有呢就在到处抓。由于它没对本站造成什么困扰,虽然它的访问对本站没任何意义,还是由它去了。但SOSO的搜索引擎蜘蛛却一直如此恶劣,只好继续把它当流氓网站对待了。

———————————

1月27日补足:

不管怎么屏蔽和重定向,它还是大段地在我的服务器的日志里留下记录,实在烦不胜烦,于是昨天晚上干脆在路由器里把“124.115.”的IP全部过滤了。于是,日志终于又清净了,生活真美好!

“流氓站点”是腾讯SOSO吗?

在网上看到一篇文章,说124.115.0.* 这个流氓站点可能是为腾讯SOSO的搜索引擎采集数据的。我不知道是不是这样,不过,就算你是搜索引擎,自己占那么多带宽也不对啊!那样拼命地抓就能赶Google超百度吗?要是不提高搜索算法等技术方面的硬指标的话,不过是痴人说梦而已!再有,假定它是搜索引擎的蜘蛛,也有以下的罪过:

  1. 搜索引擎的蜘蛛都打出旗号表明自己的身份,而该流氓却把自己伪装成IE6.0,跟做人一样,一点都不坦荡,这样缩头藏尾的肯定不是什么好东西。
  2. 从没见它读取robots.txt,说明它不愿遵守搜索引擎蜘蛛的规则,不尊重站长。
  3. 不分青红皂白,什么文件都抓,而且显然算法有问题,经常不断地抓同一个文件。
  4. 一点都不顾及对方的带宽,特别是抓本站的相册时,很多图片文件很占带宽,它却抓起来没完,中间毫不间歇,本人有十分宽的带宽都影响到了上网。这更是严重的自私行为,对别人缺乏起码的尊重。如果是腾讯就更说不过去了:当初他们抄袭了国外的通讯程序,而在国内推广时,不也是严重缺乏存储空间和带宽吗?现在有几个钱了,就不顾别人的死活了!

不过,今天发现它好像停了,不知道是全部停了,还是只是在本站停止这种骚扰了。如果它真的是腾讯SOSO的蜘蛛的话(这里说是如果,本人并不能确定它是不是),知道怎么对付它吗?这里教大家一小手(见下面的代码),轻轻一拨弄,不管你多大的劲,都让你从哪里来的就回哪里去,真正的“四两拨千斤”,正传的太极拳打法。:-) 这里只是一个示例,谁这样弄,结果自己负责。

RewriteEngine On
RewriteCond %{REMOTE_HOST} ^124.115.0..*$
RewriteRule ^/(.*) http://www.soso.com/ [R=301]

发现一个流氓站点

今天突然发现上网速度很慢。我的带域很宽,实在想不通为什么,就到服务器上查了一下,发现从124.115.0.*的大量IP的访问,而且是毫无原由的大量访问。我以为是遭受闲得无聊的蹩脚“黑客”的攻击了,后来查了一下过去的LOG文件,发现开始时它是像蜘蛛一样采集,后来可能是陷在一个地方出不来了,在那里不断循环地访问某个没必要访问的文件。

到网上查了一下,发现好多人都深受其害,而且,还发现在某论坛,该IP段有好多的垃圾贴,主要是贴自己的一些链接。估计是什么黒帽SEO所为?既采集大家的站点来拼凑垃圾网站,又贴链接获得PR。

该段的IP地址是:

inetnum: 124.114.0.0 – 124.115.255.255
netname: CHINANET-SN
descr: CHINANET Shanxi(SN) province network
descr: China Telecom
route: 124.114.0.0/15
descr: From Shanxi(CHINANET-SN) Network of ChinaTelecom
person: Xianghong Cao
address: Shanxi provice data communication Bureau
address: 185# zhuque Road
address: Xi’an city, Shanxi provice 710061
address: CN
phone: +8629-523-3633
fax-no: +8629-522-8093
e-mail: sxic@public.xa.sn.cn
nic-hdl: XC9-AP
mnt-by: MAINT-NULL
changed: caoxianghong@263.net 19990409

但目前实际捣乱的都是: 124.114.0.*,还没见其他的。

我发现耍流氓的IP不但有124.114.0.*,还有124.115.0.*。为了用绝后患,我封掉了124.114和124.115。而且也建议大家这么做。

大家也不必到上面的邮件地址反映,根据我的经验,给那里发邮件,也是收到一封“无法送到”的回复。唉!流氓啊!

站长们,没说的,封杀之!鉴于其疯狂和变态,要本着宁可错杀一千,也绝不能漏掉一个的原则,否则你的网站迟早被拖垮。

封其IP的方法:

最简单的方法是从Apache里封(如果你是用Apache当服务器的话)。你既可以在httpd.conf配置文件里设置,又可以在.htaccess里设置。说明如下:

1. 在配置文件里设置:

打开httpd.conf编辑,将下列block如下编辑:

<Directory “/var/www/html”>
Options Indexes FollowSymLinks
AllowOverride None
Order allow,deny
Allow from all
Deny from 124.114.
Deny from 124.115.

</Directory>

2. .htaccess文件法

在网站根目录下建立或打开.htaccess文件,加入如下内容:

Order allow,deny
Allow from all
Deny from 124.114.
Deny from 124.115.

希望大家广为传播,将这段IP地址彻底废掉!

补足:鉴于大家反映上述方法封得太狠了,可将黑体字部分改为:

Deny from 124.115.0.

----

同时参阅:“流氓站点”是腾讯SOSO?

Blog的traceback可已矣

今天偶然查看了一下网站的日志,发现有一些对本博客的trackback请求。我从开始就把trackback给关闭了,突然想到应该查一下该请求的频度,就用一条命令统计了一下,发现近5天以来,一共79次,甚至有的老兄居然对不存在的网页也请求trackback!要知道本博客并非十分热门的博客,而且文章总数现在也不多(大约50篇)。这些请求显然是那些热衷于搞黒帽或灰帽SEO的人的杰作。

我感到很悲哀。这网络世界到底是怎么了?网站终究是为浏览者服务的,整天弄这些损人又不怎么利己的破事干什么?!看来,博客的trackback功能可以放心地寿终正寝了。

另外,本网站的留言本也在这5天内有102次试图粘贴网络垃圾的企图。好在我早在程序里加入自动识别并拒绝这些垃圾散布行为的代码了,否则,整天删帖毕竟是很烦人的一件事;而加注册、填写图片中的数字等防治措施则让用户很麻烦。

唉!总之现在就是这么一个世道。只要是能自由让别人留网址的功能,最好都通通关闭,否则你的网站迟早变成一个网上垃圾堆。