AI研究人员的一个目标是想办法让机器学习模型更容易解释,这样就可以理解它们为什么可以做出预测。Google AI的研究人员已经展示了如何建立一个能够分析烘焙食谱的可解释的机器学习模型。该机器学习模型可以开发自己的新食谱,而且建立该模型不需要任何数据科学专业知识。
Sara Robinson在谷歌云端从事人工智能工作。在大流行期间,她喜欢烘焙,并将她的AI技能转向了这个爱好。她首先收集了一组食谱的数据,并建立了一个TensorFlow模型,以吸收配料清单,并得出 "97%的面包,2%的蛋糕,1%的饼干"这样的预测。
该模型能够准确地按类型对食谱进行分类,她提出了一个新的食谱,确定这个食谱50%是饼干,50%是蛋糕。它被称为cakie。罗宾逊说,人工智能的配方很美味,味道就像她想象的那样,如果她告诉人工智能做一个蛋糕饼干混合体,会发生有趣的事情。
罗宾逊与另一位研究人员合作,用更大的数据集、新的工具和可解释的模型建立了烘焙2.0模型,让人们深入了解蛋糕、饼干和面包的制作过程。该模型提出了一种名为 "breakie"的新配方,这是一种面包饼干的混合体。研究人员使用的数据集包括16种核心成分和600种材料的配料单。
作为预处理的最后一部分,研究人员使用了一种数据增强技巧。数据增强是一种从已经拥有的数据中创建新的训练例子的方法,例如,该人工智能被设计成对食谱的食用量不敏感,因此研究人员会随机将配料量增加一倍和三倍。
机器学习模型可以预测食谱类型,并提供了一个对话,让研究人员给模型命名,他们希望模型训练多长时间,并指出在训练中使用什么输入特征。结果是一个模型能够正确地预测它所得到的食谱的类别,并为最有助于其预测的成分指定重要性的分数。