通过押注AI,中国希望能开发面向全球市场,尤其是低收入国家的成本效益高的实用商业工具。当美国科技企业家彼得·蒂尔(Peter Thiel)的书《从0到1》(Zero to One)2015年在中国出版时,它击中了许多中国人心中的一种不安全感。Thiel认为,虽然中国在新兴技术的扩展和商用方面做得很出色,但真正的创新却不如美国——这里真正的创新是指从零创造出某种全新事物。以iPhone为例:加州库比蒂诺的工程师负责设计,中国深圳的工人负责制造。
在十多年的时间里,中国的决策层一直想摆脱这种印象,将追求创新融入了国家产业政策,如中国制造2025(Made in China 2025)。有些早期成果已然显现。比如2023年,深圳科技公司华为(Huawei)推出了使用本土生产芯片制造的智能手机Mate 60。这被视为一次象征性突破,证明中国即使面对美国在核心设备和高端设计软件上的严厉制裁,仍能制造出先进的半导体。不久前问世的DeepSeek-R1——只用其西方同类产品的一小部分成本打造的一款中国大语言模型——在美国科技领域掀起了轩然大波。
著名风险投资人Marc Andreessen称之为“AI的‘斯普特尼克’时刻”——其典故为苏联在20世纪中期发射世界首颗卫星“斯普特尼克”(Sputnik)后开始了美国-苏联太空竞赛。通过一个应用程序接口(API,连接不同软件应用的协议)使用DeepSeek,价格只需加州OpenAI公司开发的类似模型的1/13。
DeepSeek的横空出世将聚光灯照到了中国的人工智能(AI)生态系统——而这里的运作模式与硅谷的非常不同。虽然面向用户的应用得到了大量关注,但中国AI公司和美国AI公司不一样,它们实际上更关注如何解决大规模的工业和制造问题。这种差异映射了两国创新驱动力的差异:美国是风投资本,而中国是大型制造企业和国家机构。
技术分流
这种差异的根源是中国在全球经济中的比较优势——制造业——以及政府才是新技术的最大客户。中国政府希望研发出低成本、可扩展的AI应用,帮助这个快速发展的国家实现现代化。
在去年9月的一次例行记者会上,外交部发言人林剑表示,中国始终把科技创新摆在国家发展的核心位置。为了响应政府号召,各个AI研究实验室努力打造实际应用——让火车准点、监测鱼类资源、提供自动远程医疗服务。
北京公司智谱AI(Zhipu AI)与多地政府以及国有企业合作,部署其智能体模型,让填表和财务报告分析这类任务实现自动化。1月,总部位于杭州的科技巨头阿里巴巴(Alibaba)与北京初创公司零一万物(01.AI)成立了“产业化大模型联合实验室”,聚焦加速AI的商业和产业落地。
AI在中国能源转型中的作用也不容忽视,从大规模试点集成式智能家居,到对国家智能电网的巨额投资(约合8000亿美元)。
因此,中国政府的目标未必是引领全球的AI对话机器人领域,而是利用底层技术打造可负担、商业可行的解决方案。其应用能向其他地区出口,尤其是向低收入国家。换句话说,中国的目标不一定是“前沿AI”,而是“大众市场AI”。中国新谱写的AI蓝图呼应了它对其他技术的态度,如电动汽车和清洁能源:不做第一个创新的,而做第一个让技术实现可负担和大规模使用的。
逼不得已
技术堆栈(stack)是指一组用于开发先进AI模型的互相关联的资源,包括半导体等硬件、为该硬件优化的前沿学习算法,以及一个包含能源密集型数据中心和可预测资金流的后端。
为了稳坐AI技术的全球宝座,美国时不时对关键组件实施出口制裁。2022年10月7日,美国前总统拜登的政府发布了一系列对先进计算和半导体制造元件的出口管制措施,旨在防止中国从加州英伟达(NVIDIA)等公司采购高性能芯片。当时的国家安全顾问Jake Sullivan称之为“小院高墙”(small yard, high fence)策略:美国会在核心AI技术周围设“墙”,甚至鼓励荷兰和韩国等盟国的公司限制向中国的出口。
与此同时,中国看到了升级产业链对于经济发展的重要性,尤其是飞机和半导体等领域。从这方面看,这种竞争要求中国的努力更加紧迫、更大力度。如果美国掌握了未来技术并执意动用出口管制,那么中国就面临经济停滞的风险,以及随之而来的政治动荡。对AI霸权的争夺其实是整个地缘政治矩阵的一部分。
为应对这个局面,中国早有准备。2019年,美国将华为列入实体清单——美国商务部发布的一份贸易限制清单。这使得中国重新思考如何才能减少受到美国出口管控的摆布。中国教育部提出了多个集成攻关大平台(IRP),通过重大机构改革助力国家在易受美国制裁或出口管控的关键领域发展,包括机器人学、无人驾驶汽车和AI等。目前共有30个集成攻关大平台。
上海复旦大学的新一代集成电路技术集成攻关大平台,便是有望推动突破的国家级科研队伍。2022年的出口管制针对“节点”(node,半导体的最小单位)为14纳米或以下的芯片。芯片的节点越小,同一片区域集成的晶体管就越多,就能提升性能和效率。早在2021年,复旦新一代集成电路技术集成攻关大平台已就推出从事3-4纳米节点研究的岗位了。如今,这类高性能芯片是AI技术堆栈的驱动力。为了解决制造瓶颈,去年中国启动了第三期“大基金”,并计划在半导体生态系统投入 470亿美元。国家大基金是一个国家支持的投资计划,集中了来自公共企业和当地政府的资源。
这显示出中国通过投入大量机构、学术和科研资源以实现AI能力本土化的决心。美国限制中国获取芯片的政策,逼迫中国创造条件、找到了非传统方法。许多这些尝试不一定有成果,但不需要很多成功也能产生全球影响力。
集成攻关大平台已经成了培训工程师队伍的理想平台,填补了即使十年前仍存在的人才库空白。DeepSeek的一举成名从一定程度上来说,也是这一多年投入的成果。
前方的路
中国AI生态的未来会朝着哪个方向发展?虽然美国在短期内仍可能掌握了芯片领域的“卡脖子”优势,但中国在其他方面的准备更加充分:比如,对消耗大量电力的数据中心的需求日益旺盛。全国一体化算力网络,作为2021年启动的一个基础设施大项目的一部分,计划在土地和电力相对便宜的中国西部大面积建设数据中心。
中国独特的经济和政治生态将引领AI向着特定路径发展。中国仍面临发展问题,因此,医疗资源均衡化,准确预测天气模式,以及管理产业物流,都是比开发AI对话机器人和数字伴侣更为急迫的挑战,尤其是考虑到关于敏感话题的各种合规性要求。
中国巨大的消费市场加上制造基础,或能推动“具身AI”(embodied AI)的发展,如AI驱动的机器人、自动驾驶汽车和工业设备等。比如,当杭州公司宇树科技(Unitree Robotics)的狗狗外型的四足机器人被用于修复基础设施——利用高清摄像头抵达特定检查点并用机器臂开展修复工作——它们得到了国家新闻机构新华社的报道和赞扬。
“软件(在中国)基本不挣钱;民众认为软件都应该是开源的。软硬件结合才能有盈利。”北京大学的一位机器学习研究员表示,“所以说,AI驱动的机器人可能成为中国未来的潮流。”
在语言模型领域,中国的下一个发力点或是识别出能出口至其他新兴经济体的一系列产品。加州大学圣迭戈分校的技术哲学研究员Benjamin Bratton说,“本质上,中国能提供盒子里的AI堆栈。这是你的发电厂;这是你的基座模型;这是用于应用系统的堆栈架构——拿去吧印度,拿去吧巴西。”
为提前做好准备,中国政府落实了重大政策改革,修改经济理论,将数据视为与资本、人力和土地等同的资源。根据中国国家科研机构——信息通信研究院——去年发布的一份白皮书,目前中国占到了全球所有大语言模型的36%,仅次于美国。
但是,就算美国和中国的AI发展领跑世界其他国家,随着双方的发展各行其道,谁先谁后的问题也就不那么重要了。
原文以China made waves with Deepseek, but its real ambition is AI-driven industrial innovation标题发表在2025年2月18日《自然》的Essay版块上