彭博社深入剖析DeepSeek:中国AI黑马为何能引发全球关注?

摘要:

彭博社周一发文称,中国AI创业公司DeepSeek(深度求索)成立只有一年多时间,但它的AI模型已经取得了突破性进展,性能堪比世界上最出色的聊天机器人,成本却似乎远低于后者,这让美国硅谷感到震惊。

DeepSeek

彭博社指出,DeepSeek的异军突起可能与之前的一种普遍看法相悖。此前,业界普遍认为AI的未来发展需要源源不断的算力和能源投入作支撑。随着DeepSeek的创新引发的热潮不断升温,投资者开始消化它对美国竞争对手及其硬件供应商的影响,全球科技股在本月底大跌。

DeepSeek 到底是什么?

DeepSeek由量化基金幻方量化负责人梁文峰于2023年创立。该公司开发的AI模型是开源的,这意味着整个开发人员社区都可以检查和改进软件。其移动应用在1月初发布后,在美国 iPhone下载排行榜上飙升至榜首。

该应用程序与OpenAI的ChatGPT等其他聊天机器人的区别在于,在对提示做出响应之前阐明其推理。该公司声称其R1版本提供的性能与OpenAI的最新版本相当,并已向有兴趣使用该技术开发聊天机器人的个人授予许可。

DeepSeek R1与OpenAI或Meta的模型相比如何?

虽然DeepSeek并未全面披露其R1新模型的细节,但该模型的训练和开发成本似乎仅为OpenAI或Meta最强产品的一小部分。R1的效率显然要高得多,这不禁让人质疑业界是否仍需要投入大量资金去购买英伟达等公司的最新、最强大的AI加速器。这也让外界更加关注美国针对中国的先进AI芯片出口管制,因为这些管制就是为了防止中国取得像DeepSeek这样的突破。

DeepSeek表示,R1模型在几个主要基准测试中的表现接近或超越了竞争对手的模型,例如测试数学能力的AIME 2024、测试常识的MMLU和测试问答性能的AlpacaEval 2.0。它还在加州大学伯克利分校研究生开发的AI系统排名网站Chatbot Arena上名列前茅。

DeepSeek何时引发了全球关注?

自从2023年发布最早模型以来,DeepSeek就一直备受关注。去年11月,它向世界预览了旨在模仿人类思维的DeepSeek R1推理模型,为其移动聊天机器人应用提供了技术支持。再加上网页版,该聊天机器人迅速成为全球知名的廉价OpenAI替代品。硅谷知名投资人马克·安德森(Marc Andreessen)称其为“AI的斯普特尼克时刻”(源自冷战时期的历史术语,现已成为一种隐喻,用来描述某个事件或时刻引发强烈的危机感或紧迫感,促使国家、组织或个人采取行动以应对竞争或挑战)。

DeepSeek的应用图标

根据市场追踪公司App Figures的数据,截止到今年1月25日,DeepSeek移动应用已被下载160万次,并在澳大利亚、加拿大、中国、新加坡、美国和英国的iPhone应用商店中排名第一。

DeepSeek的创始人是谁?

DeepSeek创始人是梁文锋1985年出生于广东,浙江大学电子与信息工程学士和硕士学位。公开信息显示,他以1000万元人民币的注册资本创立了DeepSeek。

梁文峰在接受媒体采访时表示,进一步进步的瓶颈不是更多的融资,而是美国对获得最佳芯片的限制。他说,他的大多数顶尖研究人员都是来自中国顶尖大学的应届毕业生,并强调中国需要发展自己的国内生态系统,类似于围绕英伟达及其人工智能芯片构建的生态系统。

梁文峰指出,“更多的投资不一定会带来更多的创新。否则,大公司将包揽所有创新。”

DeepSeek在中国AI行业处于何种地位?

从阿里巴巴集团、百度到腾讯,中国的科技巨头都投入了大量资金和资源,为各自的AI模型争夺硬件和客户。和李开复的零一万物一样,DeepSeek凭借其开源策略脱颖而出。该策略旨在快速吸引最多的用户,然后在庞大用户基础上制定创收策略。

由于DeepSeek的模型更实惠,它已经在协助降低中国AI开发商的成本。在过去一年半时间里,其他规模更大的公司已经在中国打起了价格战,出现了连续的降价浪潮。

它对全球AI市场有什么影响?

DeepSeek的成功可能会促使OpenAI和其他美国AI供应商降低价格,以保持其现有领先地位。这也让人们对Meta、微软等公司的巨额支出产生质疑。这些公司已经分别承诺将在今年投入650亿美元或更多的资本支出,主要用于AI基础设施。如果效率更高的模型能够用更少的投入与现有的模型竞争,那么它就会对传统的大规模资金投入模式构成挑战。

DeepSeek崛起还引发了全球股市动荡。投资者开始抛售英伟达、阿斯麦等受益于AI服务需求激增的公司股票。科大讯飞等与DeepSeek有关的中国公司股价则出现上涨。

全球开发者已经在尝试使用DeepSeek的软件,并希望基于它开发工具。这可能加速先进AI推理模型的普及,同时也可能引发更多担忧,那就是该如何围绕着它的使用设立护栏。DeepSeek取得的进展可能促使相关法规的出台,以控制AI的开发方式。

有何短板?

DeepSeek的云基础设施可能会因其模型的突然走红而受到考验。1月27日,该公司就经历了一次短暂的大宕机。随着新老用户向其聊天机器人提出更多问题,DeepSeek将不得不应对更大的流量。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。

热门评论

>>共有0条评论,显示0
更多评论
created by ceallan