12个国产大模型大战高考数学意外炸出个大bug - cnBeta.COM 移动版(WAP)

返回上一页首页 | cnbeta报时: 03:13:33

12个国产大模型大战高考数学意外炸出个大bug

发布日期:2024-06-09 14:42:51 稿源：量子位

继国产大模型挑战高考作文之后，是时候再战一下高考数学了。数学高考Ⅰ卷的题目，目前已经陆陆续续在网上有所公布（图片格式）。那么现在，是时候考验国产大模型们的数学能力了。有请“选手们”登场——

继国产大模型挑战高考作文之后，是时候再战一下高考数学了。

数学高考Ⅰ卷的题目，目前已经陆陆续续在网上有所公布（图片格式）。

那么现在，是时候考验国产大模型们的数学能力了。

有请“选手们”登场——

Kimi、通义千问、文心一言、豆包、智谱清言、百小应、讯飞星火、商量、腾讯元宝、天工、海螺AI、万知。

国产大模型 vs 高考数学选择题

根据数学题目类型的不同，我们先来小试牛刀一下选择题。

测评的方式是将题目（图片格式）“喂”给国产大模型们，要求它们给出相应题目的答案：

查看题目，给出第1题到第8题的答案。

接下来，我们就来一同看下国产大模型们的表现。

Kimi

通义千问

豆包

智谱清言

百小应

讯飞星火

商量

腾讯元宝

海螺AI

万知

不难看出，很多国产大模型还未做数学题，先败在了AI识图这个步骤，无法生成答案。

（PS：有几位选手测试时因为无法识别，未能完成答题，因此没有放出结果。）

那么我们最后来看下“踢馆选手”——GPT-4o。

国产大模型 vs 数学大题

鉴于一些国产大模型AI识图有点困难，我们这次直接先把这次高考的大题题目文字给copy出来，再让它们作答：

设n为正整数，数列 ( a1, a_2, cdots, a{4m+2} ) 是公差不为0的等差数列。若从中抽去项 ( ai ) 和 ( a_j ) (i < j) 后剩余的 ( 4m ) 项可被平均分为 m 组，且每组的 4 个数都能构成等差数列，则称数列 ( a_1, a_2, cdots, a{4m+2} ) 是 (i, j) - 可分数列。
(1) 写出所有的 (i, j) (1 ≤ i < j ≤ 6)，使得数列 ( a_1, a_2, a_3, a_4, a_5, a_6 ) 是 (i, j) - 可分数列；
(2) 当 ( m = 3 ) 时，证明：数列 ( a1, a_2, cdots, a{13} ) 是 (2, 13) - 可分数列；
(3) 设 ( a1, a_2, cdots, a{4m+2} ) 是 (i, j) - 可分数列。记数列 ( a1, a_2, cdots, a{4m+2} ) 中任取两个数和 i (i < j)，则数列是 (i, j) - 可分数列的概率为 ( p_n )，证明：( p_n geq frac{1}{8} )。

接下来，我们再来看下国产大模型们的表现。

Kimi

通义千问

文心一言

豆包

智谱清言

百小应

讯飞星火

商量

腾讯元宝

天工

海螺AI

万知

最后，还是有请“踢馆选手”——GPT-4o。

那么，你觉得国产大模型们，识图+解数学题，哪家比较好一点呢？

最后，关于AI智能助手，这里也有一份最新用户数据分析报告供你参考：

https://mp.weixin.qq.com/s/sYxbvown5qLBnEs7zIR6Bg

查看网友评论返回完整版观看

最新资讯

加载中...

美海军实验室推出便携式 DNA 测序设备实现战场快速识别生物武器

隐匿传播数十年拉美流行的“Oropouche”病毒或已感染940万人

罕见天体3I/ATLAS并未显露任何人工无线电信号只是自然来客

生物学家建议将未来NASA月球基地打造为“地球首道生物防线”

地表最强AI Mythos 5局部解禁

美国将允许Anthropic恢复Fable5模型的访问权限

澳大利亚收紧针对儿童的社交媒体禁令将科技公司可能面临的处罚金额提高一倍

PlayStation掌门人暗示PS6未来将有便携掌机版本

《GTA 6》放弃光盘之际美国实体游戏销量已实现增长

《GTA6》还是没有光盘实体版此前消息属于误读

Polymarket美国交易平台上线六周年化营收突破10亿美元

今日最热

加载中...

苹果被迫游说特朗普政府放行长鑫存储芯片

马斯克批评IBM“0.7纳米”芯片命名具误导性呼吁以原子数量定义制程节点

GPT-5.6来了：旗舰版碾压GPT-5.5 价格却没涨

曝苹果触控版 MacBook Ultra仍用M5系列芯片基础款iPhone 18或仅配 9GB 内存

三个月跑仅跑19单美团打假“带娃送外卖”骗局

亿万富翁投资人格兰瑟姆：比特币终将“悄无声息地走向消亡”

中国商用钠离子电池在多项指标上媲美特斯拉锂电池

富士电机两名员工从中国走私稀土至日本被抓

马斯克发声支持库克：内存价格暴涨“前所未见”

从“美德”到“恶习”：六十年流行音乐歌词道德观的变迁

中国科学家打造全球最黑汽车涂层：可喷涂、耐用、接近“黑洞”效果

返回上一页首页 | cnbeta报时: 03:13:33

文字版标准版电脑端

© 2003-2026