苹果公司发表四款开源新模型有助于提高未来人工智能的准确性

苹果公司已经公开分享了四个开源模型，这些模型拥有更高的查询准确性，有助于未来人工智能模型的开发。随着科技行业在人工智能方面的不断发展，苹果公司也不断提供更多关于其正在研发的技术的信息。在最新的公开版本中，苹果发布了四款开源模型。

59424-121287-58271-118725-000-lead-Siri-and-Apple-Park-xl-xl.jpg

这些指导模型被称为开源高效 LLMs 或 OpenELMs，托管在协作平台 Hugging Face 上。Hugging Face 用于托管人工智能模型，以及对其进行训练和与他人合作改进。

OpenELM 是指一个开源库，它利用进化算法将多个大型语言模型 (LLM) 结合在一起。

这四个 OpenELM 模型采用"分层缩放策略"，在变压器机器学习模型的各层中分配参数，以提高精确度。

这些模型使用 CoreNet 库进行了预训练。苹果公司提供了使用 2.7 亿、4.5 亿、11 亿和 30 亿个参数的预训练和指令调整模型。

预训练数据集由 Dolma v1.6 子集、RefinedWeb、重复 PILE 和 RedPajama 子集组合而成。这样得到的数据集约有 1.8 万亿个标记。

在本周二发布的一篇相关论文中，该项目的研究人员表示，大型语言模型的可重复性和透明度"对于推进开放式研究至关重要"。它还有助于确保结果的可信度，并允许对模型偏差和风险进行调查。

至于模型的准确性，据解释，在使用 10 亿个参数预算的情况下，OpenELM 比 OLMo 的准确性提高了 2.36%，而所需的预训练代币数量仅为 OLMo 的一半。

模型和论文的作者包括 Sachin Mehta、Mohammad Hossein Sekhavat、Qingqing Cao、Maxwell Horton、Yanzi Jin、Chenfan Sun、Iman Mirzadeh、Mahyar Najibi、Dmitry Belenko、Peter Zatloukal 和 Mohammad Rastegari。

发布这些模型的源代码是苹果公司宣传其人工智能和机器学习发展成果的最新尝试。

这并不是苹果公司第一次公开发布人工智能程序。今年10 月，苹果分享了一个名为 Ferret 的开源 LLM，它改进了模型分析图像的方式。

今年 4 月，Ferret 的新版本增加了解析应用程序截图中数据点的功能，并能大致了解应用程序的功能。此外，还发布了关于生成式人工智能动画工具和创建人工智能头像的论文。预计 6 月份的 WWDC 将包括苹果产品在人工智能方面的许多进展。