返回上一页  首页 | cnbeta报时: 01:13:21
大型强子对撞机需要一个新的数据库系统 以支持其耗费数PB空间的实验
发布日期:2023-09-20 03:35:27  稿源:cnBeta.COM

欧洲核子研究中心(CERN)是人类有史以来最雄心勃勃的工程和科学事业之一。大型强子对撞机(LHC)是世界上最大、能量最高的粒子加速器,科学家们用它来分析亚原子世界结构的证据--在此过程中,LHC 每年能够产生数十 PB 的数据。

2023-09-19-image-30-j_1100.webp

欧洲核子研究中心最近不得不升级其后台 IT 系统,为大型强子对撞机新的实验阶段(大型强子对撞机运行 3)做准备。预计到 2025 年底,该阶段每天将产生 1 PB 的数据。以前的数据库系统已不足以处理对撞机主要实验(如 CMS)产生的"高基数"数据。

紧凑渺子螺线管(CMS)是大型强子对撞机的通用探测器,拥有广泛的物理学计划。它包括对标准模型(包括希格斯玻色子)的研究,以及对可能构成暗物质的额外维度和粒子的搜索。欧洲核子研究中心称该实验是历史上规模最大的科学合作项目之一,有来自 54 个不同国家 241 个机构的约 5500 人参与。

从 2018 年到 2022 年,CMS 和其他大型强子对撞机实验经历了一个重要的升级阶段,现在已准备好在为期三年的"运行阶段3"数据收集期间恢复亚原子粒子的对撞。在关闭期间,欧洲核子研究中心的专家还对支持CMS的探测器系统和计算基础设施进行了大幅升级。

2023-09-19-image-28-j_1100.webp

与 CMS 合作的科学家 Brij Kishor Jashal 提到,他的团队在 30 天内收集了 30 TB 的数据,以监测基础设施的性能。他解释说,这一阶段的操作会产生更高的光度,导致数据量大幅增加。以前的后端监控系统依赖于开源时间序列数据库(TSDB)InfluxDB 和监控数据库 Prometheus,后者利用压缩算法来有效处理这些数据。

然而,InfluxDB 和 Prometheus 遇到了性能、可扩展性和可靠性问题,尤其是在处理高基数数据时。高基数性指的是重复值的普遍性以及在新实例中多次重新部署应用程序的能力。为了应对这些挑战,CMS 监控团队选择用 VictoriaMetrics TSDB 数据库取代 InfluxDB 和 Prometheus。

现在,VictoriaMetrics 既是 CMS 的后端存储,也是 CMS 的监控系统,有效解决了以前遇到的基数问题。Jashal 指出,CMS 团队目前对集群和服务的性能感到满意。虽然在可扩展性方面仍有空间,但这些服务正在 CMS 专用 Kubernetes 集群内以"高可用性模式"运行,以提供更高的可靠性保证。欧洲核子研究中心的数据中心依赖于 OpenStack 服务,该服务在一个由坚固耐用的 x86 机器组成的集群上运行。

查看网友评论   返回完整版观看

返回上一页  首页 | cnbeta报时: 01:13:21

文字版  标准版  电脑端

© 2003-2024