DeepSeek 这款中国人工智能模型声称在成本效率方面大大超过了美国的竞争对手,人工智能大战由此进入白热化阶段。 它的开源聊天机器人已将该应用推向了 51 个国家的 App Store 榜首位置,现在又有消息称它是在华为人工智能芯片上运行的。
该信息来自 @Dorialexander ,他表示,DeepSeek R1 LLM(大型语言模型)是在 NVIDIA H100 上进行的训练,但使用了 Ascend 910C 芯片进行推理,即使用训练好的模型生成回复。由于 Ascend 芯片不涉及训练,因此对 GPU 的功耗要求并不高。
不过,Ascend 910C 相对较低的性能限制了它在训练方面的适用性。 华为计划通过即将推出的 920C 芯片来解决这一问题,旨在与 NVIDIA 用于人工智能操作的领先芯片组 Blackwell B200 竞争。