朱啸虎谈大模型终局:DeepSeek是核心 顶层应用要这样做
2月21日,朱啸虎发朋友圈,对LLM(大语言模型)进行了“终局猜想”。他认为,LLM市场的核心将是DeepSeek,类似Linux Kernel;最上面的应用必须牢牢抓住最后10-20%还需要人类交付的场景。
此外,朱啸虎认为,上面一层云服务商基于或者至少兼容DeepSeek,形成各自风格的API服务。中间层的优化或工具都会被底层的云服务和基础模型吸收下去;100% AI实现的如果没有绑定复杂的工作流都会以边际成本几乎免费的提供。
此前,朱啸虎曾表示,DeepSeek正以不可阻挡的势头崛起,犹如安卓系统在移动互联网时代的开源之路。这种迅猛发展让后续竞争者难以追赶。传统模型和数据飞轮在新的AI时代显得不再重要。DeepSeek强调高质量的训练数据,而非量的积累,尤其是在没有清晰奖励规则的领域中,优秀数据的引导尤为关键。这一观点对依赖低质量用户数据的公司构成了重要的警示。
对于闭源模型的发展前景,朱啸虎持谨慎态度。他认为,国内以及全球的闭源模型很难与像DeepSeek这样的开源平台相提并论。就算有些模型稍微优秀一点,其实际应用价值也大大缩水,因为用户更倾向于优质、开源的选择。
朱啸虎对DeepSeek的商业化问题也表达过关切。他认为,开源模型的全面实施使得商业模式尚未完全明确,现今亟需找到有效的商业化道路,以便更好地服务于用户与市场需求。