返回上一页  首页 | cnbeta报时: 03:29:52
腾讯T1登场:押注非transformer 速度、推理、价格全面对标DeepSeek
发布日期:2025-03-22 10:34:10  稿源:网易科技

昨晚深夜,腾讯宣布推出基于混合Mamba-Transformer架构的超大型推理模型“混元T1”正式版,并在腾讯云官网上线。T1是腾讯自研的强推理模型。该模型的前身是今年2月中旬在腾讯元宝APP上线的T1-Preview(Hunyuan-Thinker-1-Preview)。


据悉,技术层面,混元T1结合Mamba在长序列处理上的优势与Transformer在复杂上下文捕捉上的能力,降低了推理成本和KV-Cache占用。腾讯未披露更多技术细节,但Mamba-2研究表明,Transformer中的注意力机制与SSM(结构化状态空间模型)之间存在数学联系,这为融合模式的实现奠定了基础。

据介绍,T1的吐字速度能达到60~80 token/s,在生成效果上远快于DeepSeek R1。


此外,腾讯还表示,混元T1在多个公开数据集上的表现与DeepSeek R1和OpenAI o1相当或略胜一筹。在MMLU-pro、CEval、AIME和Zebra Logic等中英文知识和竞赛级数学、逻辑推理测试中,T1已跻身顶级大模型行列。此外,T1的基础模型Turbo S已在全球大模型竞技场中进入TOP 15。



T1正式版已在腾讯云面向API用户开放,输入价格为1元/百万tokens,输出价格为4元/百万tokens,约为DeepSeek R1标准时段价格的四分之一,接近DeepSeek R1优惠时段水平。

腾讯表示,T1未来可能更多通过元宝和其他自家业务向C端用户开放。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看网友评论   返回完整版观看

返回上一页  首页 | cnbeta报时: 03:29:52

文字版  标准版  电脑端

© 2003-2025