字节跳动正在美国的限制下使用华为芯片训练新的AI模型

摘要:

据路透社报道,TikTok 的母公司字节跳动正计划开发一种新的人工智能模型,该模型将在华为 Ascend 910B 芯片上进行训练。 此举是在美国对美国公司生产的先进人工智能芯片对华出口实施限制之后采取的。

自2022年以来,美国对先进人工智能芯片的出口实施了严格的管制,迫使字节跳动寻找其他替代方案。 TikTok 的母公司已经尝试将其供应链多样化,以减少出口限制,并转向本地供应商来满足其人工智能芯片需求,以便开发自己的技术。

根据路透社的报道,字节跳动即将开展的项目涉及主要使用华为 Ascend 910B 芯片训练大型语言模型 (LLM)。 目前,字节将这些芯片用于计算密集度较低的任务,如推理(已训练好的模型可进行预测)。 然而,在这些芯片上训练一个全新的模型可能具有挑战性,因为这需要能处理大量数据的更先进的芯片,而这正是 Ascend 910B 芯片无法轻松做到的。

尽管如此,字节跳动还是向华为订购了超过 10 万颗这样的芯片,但截至 2024 年 7 月,他们只收到了不到 3 万颗。 这进一步延缓了字节舞动创造新模式的雄心。

字节跳动最出色的 LLM 是其于 2023 年 8 月推出的豆包聊天机器人。 该聊天机器人在中国颇受欢迎,月活跃用户超过1000万。 该公司最近还推出了两款能够创建视频的新机型,类似于OpenAI的Sora(后者仍未向公众推出)。

然而,字节跳动公开否认了所有关于计划推出新人工智能模式的说法。 TikTok 在华盛顿特区的发言人迈克尔-休斯(Michael Hughes)告诉路透社:"这种说法的整个前提都是错误的。"

值得注意的是,字节跳动仍是微软在亚洲最大的NVIDIA 芯片客户,因为贸易限制继续阻碍其人工智能野心。

查看评论
created by ceallan