罗渣士断网26小时报告归咎人为错误(图)

发布 : 2024-7-06  来源 : 明报新闻网


用微信扫描二维码,分享至好友和朋友圈

加关注


明声网温哥华 微信公众号

图为2022年7月8日罗渣士断网期间, 人们在多伦多一间咖啡厅外使用其无线网络。(加新社)


【明报专讯】一份为加拿大广播及电讯管理委员会(CRTC)所做的独立审查报告指出,2022年造成1,200万加拿大人没有无线服务的罗渣士(Rogers)断网事件,系由人为失误引起,但因管理层和系统「缺陷」而导致情况更糟。

报告也表示,罗渣士在断网事件后所采取的措施「在改进罗渣士网络弹性和可靠性上令人满意,同时也解决了2022年7月断网事件的根本原因」。

罗渣士断网事件发生在2022年7月8日凌晨,持续26小时,令大量个人和企业无法使用其移动装置、家庭电话、网络服务和911紧急呼叫服务。

CRTC在2023年9月委托工程顾问公司Xona Partners对此一断网事件进行审查并找出断网原因,它也将查看自事件以来罗渣士所采取的措施是否足以防止另一起事故发生。Xona本月公布了报告摘要,但CRTC表示,整份报告含有敏感资讯,稍后会以删节的方式公布。

报告摘要指出,在断网前数周,罗渣士正在进行总计7阶段网络升级的步骤,断网事件发生在第6个阶段。报告表示:「2022年7月的断网是由于配置罗渣士IP 网络内的分发路由器时发生错误。」

报告表示,罗渣士的工作人员造成网络中断,因为他们移除将资讯定向到适当目的地的控制过滤器。没有此一过泸器,大量资讯被送至罗渣士的核心网络,造成超载并在过泸器被移除后数分钟内即使整个系统当机。

报告称,罗渣士的核心网络管理公司内部及外部客户和供应商的无线和固线数据,「由于无线和有线网络共享一个公共IP核心网络,中断的范围非常大,导致所有服务遭受灾难性损失。」

罗渣士此后已宣布将为其无线系统开发一个新的独立网络,同时在旧的核心网络上保留固线服务。

报告表示,由于升级的前5个阶段都进行顺利,「风险评估演算法降低了第6阶段的风险等级」。这意味著执行升级工作的罗渣士员工不必进行额外的检查和核准手续,即使这样做「并不合乎业界常规」。罗渣士表示,自此该公司安装了一个新的风险评估演算法,以解决此一问题。

Xona的摘要报告也表示,如果罗渣士有「超载防护机制」,限制流入核心网络的资讯流量,「断网事件可以避免」。报告建议所有加拿大电讯公司为其核心网络实施超载保护机制。

罗渣士在断网事件后的恢复行动受挫,其中一个核心问题是该公司未能适当沟通。报告称,当核心网络当机时,远距员工无法使用罗渣士系统或网络,也无法使用其他电讯公司的网络上网,「罗渣士不得不派遣工作人员亲往远端站点以实体方式修复受影响的路由器,这延迟了网络复原工作。」此后,罗渣士的所有事件回应和危机团队成员都获得了备份的第三方网路存取权限,以「在断网期间保持通讯能力」。