在今年的 WWDC 大会上,苹果公布了一个为旗下所有 OS 打造的全新文件系统 APFS。尽管它在消费者眼中并不显眼,但作为取代现有 HFS+ 的方案,APFS 的出现势必会产生深远影响。曾经参与 ZFS 文件系统开发的 Delphix 公司 CTO Adam Leventhal 以一个开发者的角度来评价 APFS,分析我们即将会迎来什么:
前言
APFS,也就是 Apple File System(苹果文件系统),它的开发从 2014 年开始,Dominic Giampaolo 为首席工程师。APFS 不基于已有的东西,而是苹果从头打造的一个独立的系统。当 Giampaolo 被问到他有没有从 BSD 的 HAMMER,Linux 的 btrfs 或 OpenZFS 这些现代文件系统那里得到设计灵感时 —— 毕竟 APFS 想要实现的和它们的部分功能很相似 —— Giampaolo 解释说为了避免受到过多影响,他虽然知道它们,但并没有深入去了解。
Giampaolo 夸赞 APFS 的测试团队“是典范性的”,这一点尤为关键。业界流传一句话是,文件系统要走向成熟需要十年时间,而就我在 ZFS 上的经验,这话多多少少是正确的。苹果想要仅凭三、四年的发展就将 APFS 推广开来,那就一定要让它加速成熟起来。
还债
当 Mac 512K 还是苹果的旗舰级产品的 1985 年,HFS 文件系统就出现在了人们的眼前。HFS+ 作为它的重要更新,于 1998 年随着拥有 4GB 硬盘的 G3 PowerMacs 一起到来。自那时候起,家用电脑的存储能力可以说已经增长了超过千倍。为了对应不同的设备,HFS+ 也被分成了多个竞争的方向(据说 iOS 团队弄了个自己的 HFS 变体,做得太隐蔽甚至 Mac OS 团队都不知道),拥有不同的功能。不得不说 HFS+ 已经变得老旧而混乱了。更重要的是,它缺少了大多数操作系统为企业打造的重要特性,如纳秒时间戳、校验和、快照、稀疏文件支持等,这些都是理论上必须要有的基础成本。APFS 填补了这个空白,顺便还加上了对大型设备的支持。
APFS 最重要的变化在于它解决了 HFS+ 不可持续的问题,这是苹果一直以来所背负的技术债务。它统一了所有的变体,带来了期盼中的特性。总的来说,苹果从代码开始重新打造了自己的文件系统。
不过在 APFS 的特性列表里,压缩功能却消失了,从理论上说它要实现并不困难。当开发团队被问到为什么不做压缩功能的时候,他们用一种苹果特有的方式 —— 既不确认也不否定 —— 表示认同,并且强烈暗示说这是值得期待的。所以如果 APFS 公共版本里拥有压缩功能,并不会让人感到奇怪。
加密
加密很明显是 APFS 的核心特性,不同的设备对它的需求也不一样。举个例子,iPhone 要求的是文件系统中存在多个密钥,而笔记本电脑则希望有基于每个用户的密钥。你在 WWDC 上可以听到很多次“创新”这个词,但 APFS 在加密方面配得上这个词。它支持文件系统中以下几种不同的加密方案:
- 不加密
- 对应元数据和用户数据的单一密钥
- 对应元数据、文件,甚至是文件一部分的多个密钥
多密钥加密机制尤其适用于移动设备,因为它的所有数据都可能会被加密,然而解锁手机本身就需要额外的密钥和额外的数据。可惜的是这个机制在 macOS Sierra 第一个 beta 上似乎并没有作用(使用 diskutil 命令指定生成一个加密的新卷时,文件系统报告说没有加密)。
关于加密,我注意和 diskutil 相关的特性:当使用 diskutil 创建一个新卷后,APFS 支持安全地即时擦写文件系统。不过 APFS 会警告你这可能导致数据损坏,除非在命令行输入“-IHaveBeenWarnedThatAPFSIsPreReleaseAndThatIMayLoseData”才能继续 —— 这可不是瞎编。这或许意味着用户可以建立一个无法从 APFS 中提取的文件系统密钥。安全擦写只需要删除密钥即可,不需要为了确保完全的清除而打乱整个硬盘。多个 iOS 文档指出这个功能需要特殊的硬件。有趣的是这对于 macOS 来说究竟意味着什么。不管怎么说,不要让 FBI 或者 NSA 知道这件事,OK?
快照及备份
APFS 带来了一个呼声相当高的文件系统特性:快照。快照功能让你能够保留文件系统特定时刻的状态,使得在修改文件系统的同时保留旧数据。它实现了这个功能,却又很高效地节省了空间。文件系统能够追踪变化,只有新的数据才会占据额外的空间。这对于备份工作来说有着相当高价值的潜力,因为你可以有效地追踪自上一次备份以来数据的变化。
ZFS 系统拥有快照功能和序列化机制,使得它可以有效地进行备份或进行远程传输。APFS 能够做到这点吗?Giampaolo 的回答是可能不行。ZFS 能够发送所有已更改的数据,而 Time Machine 则拥有类似排除列表这样的东西。这个不足是可以解决的,但我们要观察的是苹果会怎么做。APFS 目前仍不兼容 Time Machine,因为它缺乏对目录硬链接的支持,这个让人烦躁的问题可能源于 Time Machine 那被人质疑的可靠性。希望 APFS 以后能够针对 Time Machine 备份打造高效的序列化机制。
当 APFS 的开发经理 Eric Tamura 在 WWDC 上展示快照时,它所需的工具却并不包括在 macOS Sierra 的 Beta 版中。我使用 DTrace(我对苹果从 OpenSolaris 移植来这个技术越发惊讶)找到了一个被称为 fs_snapshot 的东西,希望其他人能够逆向工程找到它的确切用途。
管理
APFS 带来的另一个新特性是“空间共享”,让跨越一台设备的单个 APFS“容器”能够拥有多个“卷”(文件系统)在其中。苹果将该功能与过去静态分配硬盘空间,以支持多个 HFS+ 的实例进行对比,这显得有些华而不实。ZFS 和 btrfs 都拥有相似的概念,即一个用有嵌套文件系统的共享存储池,以实现规划与管理。
在和 Giampaolo 及 APFS 团队其它成员的谈话中,我们讨论了多个卷是如何作为一个单元让用户可以实现快照和加密等操作的。你会希望多个卷可以符合那些设置的不同策略。举个例子,当你想要每天对系统进行一次快照和备份的时候,用来在休眠时保存内存数据的 /private/var/vm/sleepimage 不该需要理会,也不该备份。
空间共享看上去更像是一个操作上的细节,而且能够改变游戏规则的新特性。你可以将它视为一个拥有快照和加密操作的特殊文件夹。添加新卷会因出现未知错误(不知道 -69625 究竟是什么意思)失败,但使用一个更大的磁盘镜像可以解决这个问题。