卷技术是美国大模型天命卷价格是中国大模型宿命？

“卷”就一个字，大模型厂商们不会说一次，它们只会用行动表示。但同样是卷，中美大模型似乎走上了两条路线。刚过去的5月，是全球“AI信息大爆炸”月份。透过众多信息会发现——

美国那边在卷技术：

OpenAI发布了迄今最像“人”的AI大模型GPT-4o；

Google全线更新了Gemini，秀出了超强AI语音助手Astra，还有对标OpenAI家GPT-4o、Sora的NotebookLM、Veo等产品；

苹果推出了首颗AI芯片M4；

微软发布了AI PC，更新了Copilot……

整体上，主打一个你追我赶、能力PK。

中国这边在卷价格：

5月11日，智谱AI把个人版GLM-3Turbo模型产品的调用价格从5元/百万tokens降至1元/百万tokens；

5月15日，字节跳动旗下的火山引擎将豆包大模型API输入价格降至0.0008元/千tokens，把中国大模型市场价格卷入“厘时代”；

5月21日，阿里云宣布将通义千问旗下9款核心模型悉数降价，其中通义千问GPT-4级核心模型Qwen-Long的API输入价格锐减至0.0005元/千Tokens，降幅高达97%；

同日，百度也宣布，文心大模型两大主力模型ERNIE Speed、ERNIE Lite免费；

5月22日，科大讯飞宣布，讯飞星火Lite API永久免费开放，讯飞星火Pro/Max API低至0.21元/万tokens。

同日，腾讯云也宣布，主力模型之一混元-lite模型即日起全面免费。

看上去，“晋西北乱成了一锅粥”，成了价格战下的国产大模型竞争局面的写照。

▲今年5月AI大模型降价情况汇总。图片来源：APPSO。

知名投资人朱啸虎就看热闹不嫌事大地说：一下子都从卷scaling law 180 度转弯变成卷价格卷免费了，说好的AGI（通用人工智能）梦想呢？

大洋彼岸在拼技术能力，中国同行在拼产品价格，两相对照，确实很容易引发“硬科技PK软应用”二元对立思维的回炉。

但与其批国产大模型在价格上卷成了麻花，不如思考下这道考题：都是大模型，为什么卷技术成了美国大模型的天命，卷价格成了中国大模型的宿命？

需要厘清的是，不是只有美国大模型才卷技术，也不是只有中国大模型才卷价格。

卷技术不是美国大模型的“专利”。在从拼参数、拼性能、拼Agent到拼价格的过程中，国产大模型也曾在复杂指令理解、知识记忆、幻觉抵御等能力上摩拳擦掌。

5月9日，阿里云就发布了号称模型性能全面赶超GPT-4-Turbo、堪称“地表最强”中文大模型的通义千问2.5，通义千问1100亿参数开源模型也在多个基准测评收获最佳成绩，超越Meta的Llama-3-70B成为开源领域最强大模型。

对大模型而言，技术能力是1，其他的都是0，没有技术支撑很难走远。

价格战这股风，也不是只吹到了国产大模型那里。硅谷AI群雄打起价格战来也不含糊。

在5月的新品发布会上，OpenAI就宣布GPT-4o支持免费试用，调用API的价格也比GPT-4-turbo降低一半，5 美元/百万tokens，拿走拿走别客气。

作为OpenAI头号对手的Google看完后，立马喊了声“跟”，秉持着“敌不动，我不动，敌若降，我也降”的态度，把当家王牌Gemini大模型系列的Gemini 1.5 Flash的价格降到了0.35美元/百万tokens。

眼看着两位带头大哥都降了，作为小弟的硅谷当红AI初创公司Anthropic和Mistral AI也跟着吆喝了起来：走过路过不要错过，API价格只要0.25美元/百万tokens了。

▲硅谷AI大模型同样在卷价格。图片来源：每日经济新闻。

白热化竞争的倒逼，大模型推理成本下降的带动，大模型技术迭代曲线放缓的牵制，都是硅谷大模型厂商降价的原因。

但整体上，中国大模型厂商在软硬件一体推进势头方面没有像美国厂商那么猛，美国大模型厂商在降价力度上也没有像中国厂商这么狠。

正因如此，很多人都担心国产大模型会陷入低层次竞争的内卷螺旋，跟OpenAI、Google的技术代差会随之继续扩大。

诸如此类的担忧不是全无道理，希望国产大模型将技术力作为竞争主轨道也是正常心态，但不能由此逆推出中国大模型卷价格就是“窝里斗”的结论，更不必就此设置起中国大模型“只擅长内耗，不擅长创新”的稻草人议题来。

抛开理性不谈，中国大模型厂商“不是跟国外卷技术，而是在国内卷价格”，有些不够正确——它没考虑到“清场式遥遥领先”狂热者的感受。

但理性地看会发现，中国大模型厂商卷价格在所难免。它们未必不想赶超OpenAI，是多重条件不允许；它们未必想卷价格，可它们首先得活下来。

对中国大模型厂商的卷价格，苛责不如试着去理解。

今年4月，工信部原部长苗圩在某论坛上说：在英伟达芯片几近断供后，中国跟美国的大模型算力差距逐渐拉大，所以和美国不要“打篮球赛”，要学会“下围棋”。

在其表达语境中，“打篮球”指的就是拼算力，那样免不了会被带着“满场乱跑”；“下围棋”指的是用好自身优势，加速大模型落地应用。

这说得很现实：受制于现实环境和发展阶段，中美大模型之间在技术上仍有不小的差距。

今年3月Sora刚问世时，华大基因CEO尹烨就曾感慨：据不完全统计，国内号称有大模型的公司已经有300多家，相信大部分还是“多小散乱”，面对ChatGPT在中文世界里（的表现），似乎尚能一战，但面对Sora的横空出世，可有一个能打的甚至是接近的吗？

说白了，技术沉淀、人才储备、融资环境上的差距是短期内难以抹平的，英伟达芯片断供更是不容忽略的掣肘因素。

▲截止2022年，全球57%的顶尖AI人才在美国，12%的在中国。数据来源：麦克波洛智库。

这时候，缩短差距的正确打开方式，自然不是以己之短博人之长，跟Open AI们比算力。

不比依托于算力的技术能力，比什么？中国互联网过去20年的弯道超车经验已经给出了答案：比应用。

多年来，美国企业擅长从0到1式技术创新，强于“硬科技”，中国企业擅长从1到n式模式创新，强于“软应用”，美国互联网是技术创新带动应用创新，中国互联网是应用创新反推技术进步，几成业界共识。

正是因为应用侧抓住了超大市场内的丰富场景带来的机遇，才有中国互联网企业在移动互联网时代的蓬勃势头。也是因为利用场景优势对冲了“跟跑者困境”，中国互联网产业才有今天的繁荣景象。

近几年，在“卡脖子”之痛的影响下，不少人动辄将底层突破和应用创新对立，将二者分别对应上“星辰大海”和“萝卜青菜”，评价创新的多个维度、多元视角也经常被压减成单一标准，那就是“有没有造出光刻机来”。

他们会将强调应用的模式创新置于硬科技的另一侧，看低模式创新的价值。

在此背景下，国产大模型“卷技术不足，卷价格有余”，俨然是有“原罪”的。

但中国大模型的发展，不能被这类杂音所困。国家信息中心专家张振翼之前就指出，美国在大模型发展中具备一定的领先优势，中国需要加强自身独特优势的探索。在他看来，中国发展大模型人工智能最大的优势，就是应用场景资源极为丰富。

而拼价格，就是拼应用的必经步骤。美团、滴滴、拼多多能成为超级应用，就离不开当年掀起的价格血战的“助攻”。

国产大模型大打价格战，也是这样：拼价格是表，拼应用是里。大模型厂商在价格上的“退”是为了寻求商业模式和用户增长上的“进”。不把价格打下来，就没法加速落地。

对阿里、腾讯、字节等巨头来说，开启降价模式背后都有一盘“以价换量”的棋：数据显示，国内AIGC用户渗透率目前只有6%。在习惯了免（白）费（嫖）的情况下，国内大量用户都是价格敏感型的。

降价经常是最有效的获客途径，没有之一。用的人越多，就越能压低均摊研发成本，越能降低推理成本。这样一来，没准能开启“降价让利-用户增多-规模效应明显-云业务增长-继续降价”的良性循环。

阿里云资深副总裁刘伟光曾说过，“AI推理的成本只有以每年10倍甚至百倍地下降，才能推动各行各业AI应用的爆发，预计未来大模型API的调用量会有成千上万倍增长。”而OpenAI CEO山姆·奥特曼最近在接受采访时就说，他相信高质量AI智能的成本将变得非常低廉，最终趋近于零。

值得注意的是，这波降价降的多是API调用价格，相当于是用降价迂回“抢人”——抢的是开发者。对大模型厂商而言，只有吸引越多的开发者，才能缔造更繁荣的应用生态、催生更多的应用创新。

而丰富的大模型应用生态，是撬动“飞轮效应”的前置条件。应用生态越完善，使用场景越多，用户规模越大，生成的新数据会反过来反哺大模型性能提升。

只有更大的使用量，才能打磨出更好的模型。就此看，卷价格未尝不是另一种“卷scaling law”。

按照国内朴实无华的商战节奏，现在是降价或免费，将来直接给开发者补贴，也不是不可能。

可以预见，这波价格战会将“百模大战”导入市场出清加速的节奏，大模型领域的格局洗牌在所难免。

▲ChatGPT生成的大模型价格战图片。

对用户而言，也许会梦回2014年，那时网约车补贴大战正酣，用户成了价格战直接受益者。

对许多AI创业公司而言，这可能意味着至暗时刻的到来——价格战开启的是淘汰赛，中小厂商不像大厂那样有充足的资金弹药，随时可能因为没法“跟”而被踢出牌桌，朱啸虎就断言，不是深度绑定大厂的模型公司基本已经出局。

但这无关“自己人卷自己人”，只是市场竞争的本相而已。

整体上看，腰尾部被淘汰，市场加速向头部集中，对中国大模型长远发展未必是坏事：不要认为大模型领域的幂律分布就等于“资本无序扩张”，事实证明，在“国际竞争中大显身手”方面，只有大企业才有大的竞争力。

中国大模型卷价格在所难免，但卷价格通向的不一定是竞争力提升——大模型核心竞争力提升，有赖于“价格下调-规模扩大-成本降低-利润提升-研发加强-技术创新”正向增强回路的跑通。

用户固然会因为免费来尝鲜，但决定他们能否长期留存的，是大模型的实际业务价值，能否高效完成任务、解决用户痛点，而非价格。

很多体验过的用户都知道，当下的不少大模型都有着很强的“不确定性”——它经常会变成CheatGPT。若这只是大模型跟C端用户相互“调戏”，那无非是提供了些笑料，可大模型应用最终得沉到行业产业场景中去。

行业场景专业度要求高、边际容错率低，必须得靠技术能力切实减少“幻觉”、避免“诱导”。

而从大模型技术能力角度看，价格战往往会呈现出两面性来：

1，行业洗牌后，用低价换来市占率提升的头部厂商能获得更丰厚的回报，也能在研发上投入更多；

2，恶性竞争下，会抑制企业利润，那些长线性创新项目投入也会受影响，进而损害长远竞争力。

这轮价格战到底会通向哪一面，也看大模型厂商们怎么选。

零一万物创始人兼CEO李开复就说，国内常看到ofo式的“疯狂降价、双输”的打法，大模型公司不会这么不理智，因为技术还是最重要的，如果技术不行，纯粹靠贴钱、赔钱做生意是行不通的。

百川智能创始人王小川也表示，百川智能不会参与降价，“千团大战、滴滴快的补贴大战，背后都带有网络效应，那种商业模式改变了生产关系，改变了司机和乘客之间、外卖员和用户之间的关系。这次价格战并没有改变生产关系，而是直接做生产力供给，是B端（企业用户）市场的价格战。”

要而言之，大模型技术能力提升才是硬道理，价格战换来的不该是在落后系统上开发应用，而应是“价格力-技术力”相互带动的正循环基础上的系统持续升级。

价格为锚、应用为先，也许能帮中国大模型完成局部赶超意义上的“弯道超车”。但局部之外的部分，只能靠技术创新去补齐。在这点上，没有捷径。

这不是说中国大模型厂商不该卷价格，而是说卷价格的进阶方向还得是卷技术——如果有些人非要怪中国大模型“就知道猛卷价格”，那一切责任在于拜登，谁让他摁下英伟达芯片断供按钮的？