OpenAI正打造“最强”开源模型 最早夏初发布

摘要:

4月24日消息,今年3月下旬,OpenAI宣布将在年内推出自GPT-2以来的首个"开源"语言模型。随着该公司与AI开发者社区的交流持续推进,关于这款模型的更多细节也逐步浮出水面。据知情人士透露,OpenAI研究副总裁艾丹·克拉克(Aidan Clark)正主导这项开发工作,目前仍处于初期阶段。

OpenAI计划在今年初夏发布该模型,目标是打造一个在开源推理模型中达到顶尖水平的产品。这款模型定位为推理能力模型,类似于OpenAI现有的o系列产品。

知情人士称,OpenAI正考虑为该模型采用一种高度宽松的开源许可协议,几乎不设使用或商业限制。这与Meta的Llama、谷歌的Gemma等开源模型形成对比,后者因使用条款过于繁琐而受到批评。OpenAI显然希望避免步其后尘。

目前,OpenAI面临来自包括中国AI实验室DeepSeek在内的开源策略竞争者的挑战。这些"开源"竞争者将模型提供给AI社区用于实验,在某些情况下还允许商业化使用,与OpenAI此前更为封闭的做法形成鲜明对照。

这种开放策略已被证明对部分企业极其成功。Meta在3月初宣布,Llama系列模型的累计下载量已突破10亿次。而DeepSeek也迅速积累了大量用户,并获得本土投资者的关注。

据悉,OpenAI此次推出的开源模型将支持纯文本输入输出,可在高端消费级硬件上运行。开发者还可能可以选择是否启用“推理模式”——推理功能虽能提升准确性,但会以增加延迟为代价,这与Anthropic等公司近期发布的推理模型相似。

如果此次发布反响积极,OpenAI还计划后续推出更多开源模型,可能包括更小规模的模型版本。

OpenAI首席执行官山姆·奥特曼(Sam Altman)此前曾公开表示,公司在技术开源方面“站在了历史的错误面”,并呼吁重新审视开源战略。

奥特曼在今年1月参加问答活动时指出:“我个人认为,我们需要制定一种新的开源策略。尽管并非所有OpenAI员工都认同这一观点,目前这也不是我们的首要任务,但今后我们会推出更好的模型,不过领先优势可能不像以往那样显著。”

他还表示,这款即将发布的模型将经历严格的“红队测试”和安全评估流程。知情人士透露,OpenAI将为该模型发布“模型卡片”(Model Card),即一份全面的技术文档,详尽展示模型在内部与外部基准测试、安全性评估等方面的结果。

奥特曼上月发文称:“我们会在发布前,依据‘模型准备度框架’对其进行全面评估,并在已知该模型发布后可能被修改的前提下,做更多的安全准备工作。”

尽管如此,OpenAI近年来也因对部分新模型仓促推进安全测试、未及时发布模型卡等问题,受到人工智能伦理学者的批评。奥特曼本人也曾在2023年11月被短暂罢免前,在模型安全审查方面误导高管。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看评论
created by ceallan