返回上一页  首页 | cnbeta报时: 19:25:51
数据中心停电后 Cloudflare控制面板和API出现大面积长时间故障
发布日期:2023-11-03 16:18:06  稿源:cnBeta.COM

Cloudflare 的一次长时间故障导致其许多服务瘫痪,包括最常用的客户后台仪表板和用于管理和读取服务配置的相关应用编程接口 (API)都无法使用,不少网站一度无法管理自己的业务(包括cnBeta……)。功能全部或部分受到影响的服务的完整列表包括 Cloudflare 仪表板、Cloudflare API、Logpush、WARP / Zero Trust 设备态势、Stream API、Workers API 和警报通知系统。

Cloudflare表示:"这个问题会影响依赖于我们API基础设施的所有服务,包括Zero Trust, WARP, Cloudflared, Waiting Room, Gateway, Stream, Magic WAN, API Shield, Pages, Workers。"

"使用Dashboard/Cloudflare API的客户会受到影响,因为请求可能会失败和/或显示错误"。

客户目前在尝试登录其账户时遇到问题,并看到'Code: 10000"身份验证错误,并且在尝试访问 Cloudflare 控制面板时出现内部服务器错误。

Cloudflare 表示,服务问题不会影响通过 Cloudflare CDN 或 Cloudflare Edge 安全功能进行的缓存文件交付。

Cloudflare_outage.webp

Cloudflare 仪表板故障截屏

仪表盘和 API 问题背后是数据中心停电

主要业务停运两个小时后,该公司透露,持续的问题是由于多个数据中心停电造成的。

"Cloudflare 正在评估断电对数据中心的影响,同时服务也出现故障。我们将定期提供更新,直到问题得到解决,在我们努力缓解问题的过程中,感谢您的耐心等待。"

这是 Cloudflare 自本周以来遭遇的第二次大面积故障,第一次是在 10 月 30 日星期一,包括 Cloudflare 站点和服务(Access, CDN Cache Purge, Dashboard, Images, Pages, Turnstile, Waiting Room, WARP, Workers KV)在内的多个产品瘫痪。

正如该公司在两天后发布的事后报告中解释的那样,周一的故障是由于用于部署新的 Workers KV 版本的工具配置错误造成的。

Cloudflare 的 Matt Silverlock 和 Kris Evans 说:"客户和 Cloudflare 团队都使用 Workers KV 来管理配置数据、路由查询、静态资产捆绑、身份验证令牌和其他需要低延迟访问的数据。在此次事件中,由于 KV 使用的新部署工具中的一个错误,KV 返回了它认为有效的 HTTP 401(未授权)状态代码,而不是请求的键值对。"

美国东部时间 11 月 02 日 20:12 更新:Cloudflare 发言人透露,此次持续中断的根本原因是发电机故障导致的区域性电力问题,导致设施脱机。

"我们在俄勒冈州的多个冗余数据中心运行,为 Cloudflare 的控制平面(仪表盘、日志等)提供电力。一次区域性电力问题影响了该地区的多个设施。这些设施一夜之间无法发电。今天上午,多台发电机发生故障,导致这些设施完全断电,"发言人说。

"我们已将故障转移到灾难恢复设施,大部分服务已经恢复。这次数据中心故障影响了 Cloudflare 的仪表盘和 API,但并没有影响通过我们全球网络的流量。我们正在与我们的数据中心供应商合作,调查区域性停电和发电机故障的根本原因。我们预计将根据了解到的情况发布多篇博客,并在博客上线后与您分享。

查看网友评论   返回完整版观看

返回上一页  首页 | cnbeta报时: 19:25:51

文字版  标准版  电脑端

© 2003-2024