DeepSeek更新其R1推理AI模型 并在Hugging Face上发布

摘要:

中国AI初创公司 DeepSeek于周三上午通过微信宣布,其在开发者平台 Hugging Face上发布了其R1 推理 AI 模型的更新版本。

根据 DeepSeek 的微信公告,更新后的 R1 版本采用宽松的 MIT 许可证,这意味着它可以用于商业用途,这是一个“小”升级。

Hugging Face 代码库不包含该模型的描述,只有配置文件和权重,即指导模型行为的内部组件。

升级版 R1 的参数量高达 6850 亿,规模相当庞大,如果不进行修改,该模型很可能无法在消费级硬件上运行。

今年早些时候,DeepSeek发布 R1 模型后声名鹊起,其模型与 OpenAI 的模型形成了鲜明对比。但这家初创公司也引发了美国一些监管机构的关注,他们认为 DeepSeek 的技术构成了国家安全风险。

相关文章:

DeepSeek R1模型已完成小版本试升级

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看评论
created by ceallan