通义Qwen3开源新推理模型上下文可拓展至100万

0 凤凰网科技 2025-07-31 08:21:42

摘要：

7月31日，通义千问团队在公众平台发布消息，Qwen3-30B实现重大升级，全新推理模型Qwen3-30B-A3B-Thinking-2507正式发布。新模型拓展了思考能力，提升了推理的质量和深度，是一个更睿智、更敏捷、更全能的新推理模型。

新模型在推理能力、通用能力及上下文长度上有了显著提升，新模型在聚焦数学能力的AIME25评测中获85.0分，在代码能力测试LiveCodeBench v6中得分66.0，两项核心推理能力均超越Gemini2.5-Flash（thinking）、Qwen3-235B-A22B（thinking）；新模型的知识水平（GPQA、MMLU-Pro）也较上一版本进步显著；在写作（WritingBench）、Agent能力（BFCL-v3）、多轮对话和多语言指令遵循（MultiIF）等通用能力评测中，Qwen3-30B-A3B-Thinking-2507均超越Gemini2.5-Flash（thinking）、Qwen3-235B-A22B（thinking）；原生支持256K tokens，可扩展至1M tokens。

通义Qwen3开源新推理模型：数学超强、代码贼溜，上下文可拓展至100万

值得一提的是，新模型的思考长度增加，团队建议在处理高度复杂的推理任务时，设置更长的思考预算，可以充分发挥新模型潜力。

目前Qwen3-30B-A3B-Thinking-2507已在魔搭社区、HuggingFace上开源，Qwen Chat同步上线。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道，更好阅读体验，更及时更新提醒，欢迎前来阅览和打赏。

通义Qwen3开源新推理模型上下文可拓展至100万

最新资讯

今日最热