无论是本地硬盘还是网络云盘,我们都希望用最小的空间存储最大的数据量。为了达到这个目的,各种各样的文件压缩技术和标准也应运而生,图片里有jpeg和png,音频里有mp3和flac,视频里有rmvb和mkv,还有zip和tar等各种压缩。其实他们的最终目的是一样的:最大限度地保持数据的原始信息,同时生成最小体积的可读写文件。现在,谷歌凭借神经网络的方法又向着这个目标往前跨了一大步。
来自谷歌的一个研究团队日前凭借神经网络训练法让计算机对图片文件的压缩效率达到了新高度。据外媒报道,这种新的压缩算法效果要优于传统的jpeg压缩,在同样的清晰度下,使用神经网络算法压缩的文件体积要比jpeg更小。
团队的具体做法是:首先从互联网上随机挑选6百万张已经被压缩过的图片,并将每张图片都切割成若干个32x32大小的像素碎片,从每张图片中都挑出100个压缩效果最差的碎片输入到神经网络中进行学习。经过反复训练,告诉神经网络哪些是最差的压缩,让计算机自己学习这些最差压缩的特点。科学家们的想法是:如果计算机掌握了最差压缩的图片特点,那就能够在后续的压缩算法中有效规避,于是在保证文件压缩比的同时,能最大限度地确保图片的显示效果。
该神经网络压缩的实现方式类似于训练中的情况。计算机会将一张照片首先拆分成若干个小片段,并针对每个片段的特点进行单独压缩,随后再将所有片段组合起来形成最后的输出结果。在团队成员发表的论文中,可以看到算法的具体实现情况,其中也展示了神经网络算法在大部分压缩比例下都优于jpeg的效果。
不过谷歌也承认,人类的视觉系统或许是所有感知系统中最难把握的一个,因为有些人对某种特定的变化很敏感,而另一些又不敏感,目前还无法形成一个统一的判定标准,一张图片到底怎样才算最优的显示。
无论如何,谷歌都在努力将我们的越来越庞大的媒体数据尽量无损地压缩到最小,这在任何时候都是一件好事。