测试发现马斯克的新AI模型不如OpenAI
埃隆·马斯克(Elon Musk)在周一发布了旗下xAI公司的最新大模型Grok 3,号称“地表最强AI”。然而,据《商业内幕》报道,初步测试显示,尽管Grok 3性能出众,但是在一些重要指标上依旧落后于OpenAI的模型。
马斯克声称,新Grok 3模型在数学、科学和编程关键指标测试上超越了OpenAI的旗舰模型GPT-4o,以及来自谷歌、DeepSeek和Anthropic的AI竞品。
一些AI研究人员和专家对Grok 3进行了初步测试,但是结果喜忧参半。计算机科学家安德烈·卡帕西(Andrej Karpathy)是OpenAI的联合创始人,曾领导特斯拉的AI业务,他提前体验Grok 3。
还差点火候
卡帕西周一在X上发帖称,Grok 3成功完成了从训练论文中查找复杂信息等任务,推理能力是“最先进的”,并强调了它解决复杂编码问题的能力。然而,与OpenAI的o1-pro模型一样,它在解决“棘手”的井字棋棋盘时遇到了困难。“我的总体印象是,这个模型的能力大约与o1-pro相当,领先DeepSeek-R1。当然我们还需要进行实际、真实的评估来进一步判断。”卡帕西称。
对于Grok 3新推出的深度搜索工具,卡帕西表示,它的深度搜索能力“大致相当于Perplexity公司的深度搜索功能,虽然很棒,但还没有达到OpenAI最近发布的深度搜索功能,后者依旧感觉更全面和可靠”。
宾夕法尼亚大学沃顿商学院专门研究AI的教授伊桑·莫利克(Ethan Mollick)表示,尽管xAI的技术进步迅速,但Grok 3并不是明显的领跑者。“这是一个非常稳定可靠的前沿模型,但无法让你停止使用当前的前沿模型。”莫利克在领英上发帖称。
莫利克指出,尽管Grok 3在某些基准测试上超过了一些OpenAI模型,但它并没有明显超越OpenAI的o3。他表示,虽然Grok 3是一个稳定可靠的模型,但OpenAI 在行业合作和企业采用方面仍然保持着强大优势。“我不确定Grok是否有很大机会成功。”他写道。
几何智能(Geometric Intelligence)创始人、长期批评AI炒作的加里·马库斯(Gary Marcus)对于Grok 3的质疑声更大。“马斯克承诺Grok 3将是史上最聪明的AI。剧透一下:它并不是。”马库斯在自媒体平台Substack上称。
马库斯表示,Grok 3发布会是在“照搬”之前的技术演示。尽管Grok 3在技术上有所进步,但与OpenAI模型相比,其表现并没有带来“颠覆性变化”。
他认为,OpenAI目前不需要担心Grok 3。“奥特曼可以暂时松一口气。Grok 3没有取得什么重大突破。”马库斯表示。他还补充说,OpenAI在算力获取和研究规模方面的主导地位仍然是该公司的一个重要护城河。(作者/箫雨)
更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。