Google推出BigLake预览版：帮企业更容易分析数据

0 cnBeta.COM 2022-04-06 14:30:54

摘要：

在其 Cloud Data Summit 峰会上，Google 宣布推出 BigLake 预览版。通过这个新数据湖存储引擎，可帮助企业更容易分析其数据仓库（data warehouses）和数据湖（data lakes）中的数据。

BigLake 的核心是利用 Google 在运行和管理其 BigQuery 数据仓库方面的经验，并将其扩展到 Google Cloud Storage 上的数据湖，将数据湖和仓库的优点结合到一个单一的服务中，抽象出基础存储格式和系统。

值得注意的是，这些数据可以放在 BigQuery 中，也可以存放在 AWS S3 和 Azure Data Lake Storage Gen2 上。通过 BigLake，开发者将获得一个统一的存储引擎，并能够通过一个系统查询底层数据存储，而不需要移动或重复数据。

在今天的公告中，Google Cloud 的数据库、数据分析和商业智能副总裁兼总经理 Gerrit Kazmaier 表示：

在不同的数据湖和数据仓库中管理数据，会产生孤岛，增加风险和成本，特别是当数据需要移动时。BigLake允许公司统一他们的数据仓库和湖泊来分析数据，而不必担心底层的存储格式或系统，这消除了从源头上重复或移动数据的需要，减少了成本和低效率。

使用策略标签，BigLake 允许管理员在表、行和列级别上配置他们的安全策略。这包括存储在 Google Cloud Storage 的数据，以及两个支持的第三方系统，其中Google的多云分析服务 BigQuery Omni 启用了这些安全控制。然后，这些安全控制也确保只有正确的数据流入 Spark、Presto、Trino和TensorFlow等工具。该服务还与Google的Dataplex工具整合，提供额外的数据管理功能。