Meta 发布新一代旗舰 AI 模型 Llama 4

摘要:

Meta于周六发布了其 Llama 家族的全新 AI 模型系列Llama 4。总共有四种新模型:Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。Meta 表示,所有模型都经过“大量未标记的文本、图像和视频数据”的训练,从而获得“广泛的视觉理解”。

中国DeepSeek的开放模型取得了成功,其性能与 Meta 之前的旗舰 Llama 模型相当甚至更好,这推动了 Llama 的加速开发。据说 Meta 已经组建了作战室来解密 DeepSeek 如何降低运行和部署R1和V3等模型的成本。

Scout 和 Maverick 已在Llama.com和 Meta 的合作伙伴处公开提供,包括 AI 开发平台 Hugging Face,而 Behemoth 仍在训练中。Meta 表示,其跨 WhatsApp、Messenger 和 Instagram 等应用的 AI 助手 Meta AI 已更新,可在 40 个国家/地区使用 Llama 4。目前,多模式功能仅限于美国英语版本。

一些开发人员可能对 Llama 4 许可证提出异议。

禁止在欧盟“注册”或“主要营业地点”为欧盟的用户和公司使用或分发这些模型,这可能是该地区人工智能和数据隐私法规定的治理要求的结果。(过去,Meta 曾谴责这些法律过于繁琐。)此外,与之前的 Llama 版本一样,每月活跃用户超过 7 亿的公司必须向 Meta 申请特殊许可,Meta 可自行决定授予或拒绝该许可。

Meta在一篇博文中写道: “这些 Llama 4 模型标志着 Llama 生态系统新时代的开始。这只是 Llama 4 系列的开始。”

Meta 表示,Llama 4 是其第一批使用混合专家 (MoE) 架构的模型,该架构在训练和回答查询方面具有更高的计算效率。MoE 架构基本上将数据处理任务分解为子任务,然后将其委托给较小的、专门的“专家”模型。 

例如,Maverick 总共拥有 4000 亿个参数,但在 128 位“专家”中只有 170 亿个活跃参数。(参数大致对应于模型的解决问题的能力。)Scout 拥有 170 亿个活跃参数、16 位专家和 1090 亿个总参数。

根据 Meta 的内部测试,Maverick 在某些编码、推理、多语言、长上下文和图像基准上超过了 OpenAI 的GPT-4o和Google的Gemini 2.0等模型,该公司称 Maverick最适合创意写作等“一般助理和聊天”用例。然而,Maverick 还不如Google的Gemini 2.5 Pro、Anthropic 的Claude 3.7 Sonnet和 OpenAI 的GPT-4.5等功能更强大的近期模型。

Scout 的优势在于文档摘要和大型代码库推理等任务。它的独特之处在于拥有非常大的上下文窗口:1000 万个标记。(“标记”代表原始文本的片段 — 例如,“fantastic” 一词可拆分为“fan”、“tas”和“tic”。)用简单的英语来说,Scout 可以接收图像和多达数百万个单词,从而能够处理和处理非常长的文档。

据 Meta 称,Scout 可以在单个 NVIDIA H100 GPU 上运行,而 Maverick 则需要 NVIDIA H100 DGX 系统。

Meta 尚未发布的 Behemoth 将需要更强大的硬件。据该公司称,Behemoth 拥有 2880 亿个活跃参数、16 位专家和近 2 万亿个总参数。Meta 的内部基准测试显示,在多项衡量 STEM 技能(如数学问题解决能力)的评估中,Behemoth 的表现优于 GPT-4.5、Claude 3.7 Sonnet 和 Gemini 2.0 Pro(但不是 2.5 Pro)。

值得注意的是,Llama 4 模型中没有一个是像 OpenAI 的o1和o3-mini那样的真正的“推理”模型。推理模型会核实其答案,并且通常能更可靠地回答问题,但因此比传统的“非推理”模型需要更长的时间来给出答案。

有趣的是,Meta 表示,它对所有 Llama 4 型号进行了调整,使其不再频繁地拒绝回答“有争议”的问题。据该公司称,Llama 4 会回应“有争议的”政治和社会话题,而之前的 Llama 型号不会回应。此外,该公司表示,Llama 4 的“平衡性大大提高”,它根本不会接受这些提示。

Meta 发言人表示:“你可以依靠 Lllama 4 提供有用的、基于事实的回答,而不会做出任何评判。我们正在继续提高 Llama 的响应能力,以便它能够回答更多问题,能够回应各种不同的观点,并且不会偏袒某些观点。”

这些调整是在白宫的一些盟友指责人工智能聊天机器人在政治上过于“觉醒”之际做出的。

唐纳德·特朗普总统的许多密友,包括亿万富翁埃隆·马斯克和加密与人工智能“沙皇”大卫·萨克斯,都声称流行的人工智能聊天机器人 会审查保守派观点。萨克斯曾指出,  OpenAI 的 ChatGPT 是“被编程为唤醒”的,并且在政治话题上不诚实。

事实上,人工智能中的偏见是一个棘手的技术问题。马斯克自己的人工智能公司 xAI 一直在 努力 打造一款不会偏袒某些政治观点的聊天机器人。

这并没有阻止包括 OpenAI 在内的公司调整他们的人工智能模型来回答比以前更多的问题,特别是涉及有争议话题的问题。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看评论
created by ceallan