文摘主页
新闻聚焦
国际视点
经济观察
科技博览
校园内外
网络时代
文艺广角
体坛纵横
史海钩沉
人物写真
世间万象
生活时尚
健康提示
情感话廊
冷观热评
金台笔会

近期回顾

旧版文摘

全文检索

报刊导航

人民日报




友情链接

文摘报
(周四、日)


报刊文摘
(周一、四)






    SOS!70万邮件用户……

    人民网记者  张翼南

        

      2001年8月16日下午2点多,新浪网总工程师严援朝接到了系统管理部负责监视系统运行的工程师的紧急报告:发现公司设在北京电报局的免费邮件系统中,有一块数据盘出现故障。这时的严援朝刚刚参加完新浪开通VIP收费邮件新闻发布会回到公司后不久。

        70万邮件用户受到影响

        新浪网免费邮件系统所使用的是美国NETAPP公司的存储系统。这种应用于互联网上独立的服务系统价格昂贵,但具有很强的保护能力。一般情况下,数据盘一旦发生故障,备份磁盘就会自动启动,顶替故障盘保证服务器正常工作。但这一次,简单的备份保护并没有自动排除故障。

        这次故障所涉及的新浪免费电子邮件用户约占总数的3%,对2400多万免费电子邮件注册用户来说,3%就是70万之巨!为了避免损失扩大,新浪网立即启动了应急措施,工程师们迅速赶赴事故现场———北京电报局机房,并停止了所有邮件服务,以免造成信件丢失。设备代理商GTI公司的工程师也迅速赶来了。

        经过全面检测,整个系统所用的10多个这类服务器中,损害的设备只涉及到其中的一台。但在检测过程中发现,在这台有故障的服务器上,有两个数据盘和一个系统盘有问题,另外还有一块光纤卡也存在故障。在同一台服务器上同时有这么多部件损坏是前所未有的,这是造成自动保护机制不起作用的主要原因。16日下午,新浪在网上向网民报告故障情况,并发表致歉信。

        是黑客与病毒造成的吗?

        故障的发生引起了广大网民的猜测。时下黑客猖獗,红色代码病毒造成许多国际大公司计算机系统的瘫痪,新浪免费邮件的故障是否与此有关?

        另外,故障的发生几乎与新浪开通收费邮件同步,于是,又有人揣测这一故障是因为新浪开通收费电子邮件而故意制造的。

        此时的北京电报局机房内,各方面都在紧张忙碌。经过连夜的全面检测,证实了其余的10几台服务器可以正常运行。17日上午10时,新浪网再次向每一位用户发送了由总裁署名的正式致歉信。至此,没有受到影响的97%的免费邮件系统恢复工作。

        保护用户原始数据第一

        有故障的服务器经过16日一夜的抢修没有能恢复正常。美国NETAPP公司由全球技术支持中心的一级支持迅即转到设在新加坡的二级。17日上午,GTI从上海调来的高级工程师赶到北京电报局,NETAPP在京的工程师也赶到了,加上新浪的工程师,一时间,北京电报局云集了中外高级技术专家。电话、EMAIL、在线交流;北京、新加坡、美国……紧张的磋商一直在持续。专家们提出了一个又一个排除故障的方案,但凡是可能影响原始数据安全的方案都被新浪网否决了。

        17日下午,技术支持升级到美国。此刻大洋彼岸正值凌晨,美国的工程师从被窝里被叫了起来。

        17日晚,北京电报局聚集了新浪网总裁汪延、总工程师严援朝、美国EATPP公司中国区总裁、美国EATPP公司大中华区总裁……GTI的总裁直接和NETAPP的最高层联系要求提供顶级支持。18日凌晨,技术支持上升到最高层———美国NETAPP公司总部的设备研发中心。经过6个小时的努力,早晨6时40分左右,损坏的部分全部修复完毕。

        18日早晨7时,一直在北京海淀区万泉庄的新浪总部待命的8名系统工程师开始了系统的恢复运行。7时50分,全部系统恢复正常运行。从发现故障到解决问题,历时41小时。

        据有关方面的研究,这次故障的造成,机房的清洁度不够是一个重要因素。运行环境对于需要长期不停止地保持高速运转的设备尤为重要。

        另外,由于这次故障原因比较复杂,超出设备代理和供应商以往的经验,最后由美国NATAPP研发中心的高级工程师主持解决。从第一级技术支持逐步上升到第四级,使整个维护长达41小时,这表明目前该公司的技术响应速度还应该提高一步。

        中国让美国人大吃一惊

        18日早晨,系统恢复运行之后,新浪网与美国EATPP公司及代理商关于今后如何进一步做好设备维护的会议开始了。三方一致初步拟定了防患于未然的相关措施。

        把原定的设备3年折旧改为一年半,并且在使用两年后淘汰;与有关部门共同努力把机房的环境建设得更好一些;一旦发生故障以后,厂商及使用单位系统维护的响应和判断问题的能力需要进一步提高。

        新浪网是中国较大的门户网站之一,它的免费邮件用户总数达到了2400多万。这一次的设备故障尽管只牵涉3%的用户,却影响到高达70万个邮箱41小时不能正常使用。

        这一状况让设备提供商———美国NATAPP公司大吃一惊。中国人如此巨量、如此频繁地使用电子邮件系统远远超出了这家为全球提供相关设备的公司的预想。即便在发生故障后,在凌晨三四点钟,新浪免费邮件系统的存储量仍然相当惊人。这期间每天新注册的电子邮件用户仍然维持在5万/日左右。这对他们在其它国家的客户来说是难以想象的。

        同时,中国网民对电子邮件发生故障反映的强烈,也给了该公司以极大的震撼。这反映了电子邮件已经在现代中国人的生活中确立了不可或缺的重要地位。该公司总裁因此强烈地体会到,他们在亚洲的最重要的客户在中国,在北京。美国NATAPP公司因此承诺,今后在新浪使用的设备一旦发生问题,可以越过分级支持系统,由在美国总部的第四级技术支持直接介入。他们将进一步研究如何加强对中国市场的服务支持。 

        《人民日报海外版》 (2001年08月31日第十版)  


 返回主页

人民日报社版权所有,未经授权禁止复制或建立镜像。
E-mail:digest@peopledaily.com.cn