人工智能和机器学习已经成为科技行业的热门话题,而想要让它们变得更加智能就必须要提供更多的数据进行训练。NVIDIA 研究部门旗下的生成对抗网络(GAN)近日迎来一个新的里程碑,即便是在非常小的数据集情况下,依然能够让人工智能进行学习。
虽然在名字中出现了“对抗”,但 GAN AI 模型实际上使用了两个合作的网络。例如,一个生成器负责创建图像,而鉴别器则将其和参考图像进行对比,以便于评估它们是否在样式、对象和内容上匹配。此外,鉴别器通常会馈入 50,000 到 100,000 范围内的训练图像。
这种现象称为过拟合,可以部分地通过所谓的数据增强来解决,该方法仅涉及随机旋转,调整大小,裁剪或翻转图像以扩展参考数量。但是,这将创建一个生成器,该生成器将学习模仿变形的图像,而不是学习如何正确地合成样式和主题。
NVIDIA Research 的 Adaptive Data Augmentation(ADA)试图通过在不同数据点之间分布数据增强来解决这两个问题。研究人员声称,这使他们能够创建一个新的 StyleGAN2 模型,该模型能够使用比传统GAN所需的数据小10到20倍的训练数据集来学习艺术风格。