Meta 推出更高效的新型 Llama 3.3 70B 模型

Meta 已宣布其Llama系列生成式人工智能模型的最新成员： Llama 3.3 70B。在 X 上的帖子中，Meta 的生成式人工智能副总裁 Ahmad Al-Dahle 表示，纯文本 Llama 3.3 70B 以更低的成本提供了等效于 Meta 最大 Llama 模型 Llama 3.1 405B 的性能。

图片.png

Al-Dahle 写道："通过利用后训练技术的最新进展......该模型以显著降低的成本提高了核心性能。"图表显示，Llama 3.3 70B 在多项行业基准测试中的表现优于Google的 Gemini 1.5 Pro、OpenAI 的 GPT-4o 和亚马逊新发布的 Nova Pro，其中包括评估模型理解语言能力的 MMLU。 Meta 发言人通过电子邮件表示，该模型能在数学、常识、指令遵循和应用程序使用等方面有所改进。

Llama 3.3 70B（可从人工智能开发平台 Hugging Face 和包括 Llama 官方网站在内的其他来源下载）是 Meta 的最新力作，其目的是通过"开放"模型在人工智能领域占据主导地位，这些模型可用于各种应用并实现商业化。

Meta 的条款限制了某些开发者使用 Llama 模型的方式：月用户超过 7 亿的平台必须申请特殊许可。但对许多人来说，Llama 模型并非严格意义上的"开放"，这并不重要。例如，根据 Meta 的数据，Llama 的下载量已超过 6.5 亿次。

Meta 在内部也利用了 Llama。 Meta首席执行官马克-扎克伯格（Mark Zuckerberg）表示，该公司的人工智能助手Meta AI完全由Llama模型提供支持，目前已拥有近6亿月活跃用户。扎克伯格称，Meta AI有望成为全球使用人数最多的人工智能助手。

对于 Meta 来说，Llama 的"开放"性质是福也是祸。 11 月，一份报告称，中国军方研究人员使用 Llama 模型开发了一款国防聊天机器人。对此，Meta 向美国国防承包商提供了Llama模型。

Meta 还对自己是否有能力遵守欧盟为人工智能制定法律和监管框架的法律《人工智能法》表示担忧，称该法律的实施"太难以预测"。该公司面临的问题是欧盟隐私法 GDPR 中有关人工智能训练的相关规定。 Meta 利用 Instagram 和 Facebook 用户的公开数据训练人工智能模型，这些数据在欧洲受 GDPR 保障。

今年早些时候，欧盟监管机构要求 Meta 停止对欧洲用户数据的训练，同时对该公司的 GDPR 合规性进行评估。 Meta 对此做出了让步，但同时也认可了一封公开信，呼吁对 GDPR 进行"现代解释"，不要"拒绝进步"。

Meta 也未能幸免于其他人工智能实验室面临的技术挑战，它正在加强计算基础设施，以训练和服务未来几代的 Llama 模型。该公司周三宣布，将在路易斯安那州建造一个价值 100 亿美元的人工智能数据中心，这是该公司有史以来建造的最大的人工智能数据中心。

扎克伯格在今年 8 月的 Meta 第四季度财报电话会议上表示，为了训练下一套主要的 Llama 模型（Llama 4），公司需要的计算能力将是训练 Llama 3 所需的计算能力的 10 倍。

训练大型语言模型是一项成本高昂的工作。在服务器、数据中心和网络基础设施投资的推动下，Meta 公司 2024 年第二季度的资本支出从去年同期的 64 亿美元增至 85 亿美元，增幅近 33%。