月之暗面发布k0-math推理模型 对标OpenAI o1系列

摘要:

月之暗面Kimi Chat面向全社会开放服务一周年之际,月之暗面宣布推出新一代数学推理模型k0-math。基准测试显示,Kimi k0-math的数学能力可对标全球领先的OpenAI o1系列可公开使用的两个模型:o1-mini和o1-preview。在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中,k0-math初代模型成绩超过o1-mini和o1-preview模型。


在两个难度更大的竞赛级别的数学题库OMNI-MATH和AIME基准测试中,k0-math初代模型的表现分别达到了o1-mini最高成绩的90%和83%。

同时,Kimi探索版也通过运用强化学习技术创新了搜索体验,在意图增强、信源分析和链式思考三大推理能力上实现突破。Kimi创始人杨植麟博士介绍,k0-math模型和更强大的Kimi探索版,未来几周将会分批陆续上线Kimi网页版和Kimi智能助手APP,帮助大家解决更有挑战的数学和搜索调研类任务。


据Kimi创始人杨植麟介绍,k0-math模型和更强大的Kimi探索版,未来几周将会分批陆续上线Kimi网页版和Kimi智能助手APP,帮助大家解决更有挑战的数学和搜索调研类任务。

在与新浪科技沟通中,杨植麟指出:“我认为接下来AI发展很重要的一个方向,就是让AI能够具备思考的能力,而数学产品则最适合让AI去锻炼思考能力的,所以我们推出了这个产品。”据他介绍,未来,k0-math将尝试用于K12教育等领域,同时也会直接用于Kimi搜索能力的提升,增强搜索推理能力。

近期,国内开始出现了一些AI创业公司被收购、人才回流大厂的现象,这与今年5月美国硅谷发生的事件高度相似。对于如何看待当前国内人工智能行业所处的现状这一问题?杨植麟表示,“虽然我们没有遇到人才流失的现象,但出现这样的情况也说明行业发展进入了一个新的阶段,它正从一开始很多公司在做,变成现在少一点公司在做,接下来可能大家做的东西也会逐渐不一样,我觉得这是一个可能必然的规律。”

据杨植麟介绍,Kimi其实也正聚焦把一些最重要的事情做好,公司是目前市场上主流的几个大模型公司里人数最少但人效比最高的公司。“我们不希望做那么多,把团队做那么大,也不能那么大,因为这对创新的影响是有一个致命性伤害的。”杨植麟表示。

查看评论
created by ceallan