龙芯CPU的布局与未来:引入大小核、冲向64核心128线程
2023年4月8日上午,龙芯中科在河南鹤壁举办信息技术自主创新峰会。会上,龙芯正式发布了新一代龙芯3D5000服务器处理器,标志着龙芯中科在服务器CPU领域进入国内领先行列。
龙芯3D5000首次使用小芯片(chiplet)技术,将两颗龙芯3C5000整合封装在一起,取得了32核心、64MB三级缓存、八通道DDR4内存的高规格,四路可达128核心,而且是百分百自主的LoongArch指令集架构,无需国外授权。
峰会上,龙芯中科公司董事长胡伟武重点介绍了龙芯CPU的技术和产品布局,以及未来规划。
一起来深入了解下!
胡伟武表示,龙芯CPU的主要特点是“一个唯一、三个不同”。
龙芯CPU是国内唯一基于自主指令系统构建、独立于Wintel/AA的开放信息技术体系,和国内多数企业直接购买国外商业IP进行芯片设计、基于x86/Arm指令系统融入国外信息技术体系、依赖境外先进工艺提升性能的做法,是完全不同的。
目前,龙芯CPU的主要IP核,都是自主研发。
其中,硬IP包括寄存器,以及内存、HT总线、PCIe/SATA/USB、网络等等的物理层,并适配从130nm到12nm等不同制造工艺。
软IP则包括CPU内核、GPU图形核心、加解密算法,以及存储、总线、网络、音频、工业等各种接口。
龙芯CPU的产品布局分为三大系列:
龙芯1号是MCU(微控制器),专门面向嵌入式应用。
龙芯2号是SoC(片上系统),面向工控、终端应用,又可以细分为龙芯2K1000LA、龙芯2K2000、龙芯2K3000三大平台,目前分别使用40nm、28nm、12nm工艺,同时结合具体引用,还可以定制专用的SoC。
龙芯3号是CPU(通用处理器),面向桌面和服务器应用,也是多数人更熟悉的,搭配自研桥片(芯片组)形成双芯片的解决方案。
该系列已经演进了三代,第一代是龙芯3A1000、龙芯3B1500,第二代是龙芯3A2000、龙芯3A3000,第三代则是龙芯3A4000、龙芯3A5000、龙芯3C5000。
胡伟武表示,龙芯CPU的设计设计基本原则是先提高单核性能,再增加核心数;先优化设计,再结合先进工艺提高性能,有些类似Intel当初的Tick-Tock策略,交替升级工艺和架构。
经过20多年的发展,龙芯CPU的单核性能已经达到国际主流水平。
在服务器领域,龙芯CPU提升单核性能的同时,结合多核、多线程、高速互连、先进封装等技术,快速形成系列化、强竞争力的产品布局。
2010年到2020年这十年,可以说是龙芯的“补课”时间,全力提升架构和单核性能。
在此期间,龙芯用同一款产品适配桌面、笔记本、服务器的不同需求,即便被客户和市场评价性能太低也坚持一步一个脚印地走下去。
在完成了足够的性能积累之后,龙芯开始全面布局服务器、桌面、移动终端等各个领域,针对性地推出不同产品,逐步枝繁叶茂。
在服务器领域,龙芯3D5000发布之后,龙芯将先后推出龙芯3C6000/3D6000,延续龙芯5000系列的12nm工艺,内核升级为LA664,前者原生16核心32线程,后者双芯封装组成32核心64线程。
再往后的2024-2025年,我们将看到龙芯3D7000/3E7000,仍旧是LA664架构核心,但升级制造工艺,分别达到32核心64线程、64核心128线程!
桌面领域,接下来将分别是龙芯3A6000/3B6000、龙芯3A7000/3B7000,与服务器端的同系列产品同工艺、同架构,只是核心数等规格略低一些。
龙芯2号家族后续将陆续迎来龙芯2K3000、龙芯2P0500、龙芯2K0300,龙芯1号家族则会有新的LS1系列,详情暂未披露。
龙芯3号系列在不同领域采用不同的内存通道设计,其中在服务器上是单片四通道内存、双片整合封装组成八个内存通道。
下一代龙芯3C6000将在片内集成PCIe高速通道,从而提升芯片间互连带宽,龙芯3D6000会同步推出。
龙芯3D7000单芯片设计,核心数量24-32个,四个内存通道。龙芯3E7000双芯片封装,规格翻番,核心数量达到48-64个,八个内存通道。
在桌面上则是双通道内存,下一代龙芯3A6000仍然是4核心,主频首次达到2.5GHz,搭配龙芯7A2000桥片,大幅提升性价比,今年上半年会流片回来,将会提供样品给合作伙伴,预计大批量的出货将在明年。
根据龙芯此前公布的白皮书,龙芯3A6000的性能评估比现在的龙芯3A5000提升多达40-60%,同时硅片面积减少10%,设计水平可对标AMD Zen2。
之后的龙芯3B6000,将首次采用大小核架构,同时集成GPU图形核心、PCIe控制器等,而与之搭配的下一代桥片龙芯7A3000,将成为一个“弱南桥”,因为它的HT总线、GPU图形核心、显存接口等模块,都将转移到CPU内部。
在笔记本上是单通道内存,主打的将是龙芯2K2000、龙芯2K3000等单片方案(也用于工控领域)。
龙芯2号家族中,龙芯2K2000在去年12月中旬官宣流片成功,并完成初步功能调试、性能测试,达到设计目标。
它采用28nm工艺,并且是境内外同步进行,境外是FD-SOI(全耗尽型绝缘层上硅)技术,境内则是体硅技术,支持USB 3.0。
龙芯2K1500可以视为它的一个变种版本,今年年初流片成功,集成两个LA264核心,主频1.0GHz,支持DDR3、PCIe 3.0、SATA 3.0,典型工作场景下功耗不高于2.8W。
还有龙芯2K0300面向嵌入式,龙芯2P0600专用于打印机。
下一代的龙芯2K3000,将升级到12nm工艺平台,集成八个LA364 CPU核心、LG200 GPGPU图形核心,总线升级支持PCIe 4.0。
龙芯1号家族在2022年经历了一次调整,从早起的SoC、MCU两种类型改为全部做MCU,更加专一。
龙芯1C102、龙芯1C103已经在去年底流片成功,均采用LA132内核,其中前者主要面向智能家居、其他物联网设备,比如智能门锁类产品、电动助力车、跑步机等。
后者主要面向电机驱动类物联网产品,比如筋膜枪、修枝机、电锯、电扳手、跳绳机、风扇、汽车电子等。
下一步将是龙芯1C201,是一款高性能的MCU,详情未知,但看编号就知道提升幅度,架构自然是全新的。
另外还有龙芯1D100,主要面向流量表解决方案。
目前,龙芯中科自主的LoongArch指令集架构,从小巧的龙芯1C103,到庞大的龙芯3D5000,已经形成了完整的系列化产品。
有了好的硬件,更要有好的软件,才能协同释放性能,便于落地商用。
为此,龙芯设计了不同的基础版操作系统,便于客户二次部署,完成基础软件体系建设,包括桌面的Loongnix_Desktop,服务器的Loongnix_Server,工控嵌入式的Loongnix_Embedded、LoongOS、LoongWorks。
其中在嵌入式领域,Loongnix_Embedded是基于桌面版深度定制,进行简化、实时化,可以跟随Linux技术路线,拥有海量软件生态支持。
LoongOS参照开源社区Yocto自主研发,LoongWorks则基于vxWorks深度定制开发,达到了相当于DOS到Windows的飞跃。
在基础软件、应用软件的生态建设上,龙芯采取了二进制翻译的做法,实现跨平台兼容,打印机、浏览器、办公与日常软件、游戏等等都可以移植。
在历史上,Linux桌面还没有成功先例,IBM、Ubuntu都尝试又失败了,而龙芯的Linux桌面生态已经局部超过x86、Arm,预计到2023年底可以全面超过!
最后简单说说大家非常关心的制造工艺问题。
如今,国际(主要是美国)的半导体工艺依然处于绝对领先,而且优势巨大,但我们也要看到,先进工艺的发展正在放缓,所带来的效益提升也越来越小,摩尔定律渐渐失去了魔力,包括成本越来越高、功耗越来越高等等,不得不通过各种新的封装工艺弥补。
我国自主工艺还落后太多,但近些年取得了长足进步,可以基本满足自主CPU的需求。
其中,28nm可满足所有工控应用需求,14nm工艺已经实现稳定量产,可满足所有生产办公类信息化应用需求,5nm刻蚀机也有了。
经过20年的发展和积累,龙芯已经在2021年基本完成了自主CPU处理器和OS系统的“补课”工作,CPU性能达到市场主流水平,而且推出了自主的LoongArch龙架构指令集,基本完成了基础软件技术体系(接下来就是软件应用体系的建设)。
“十四五”期间,龙芯将努力完成“三个转变”,包括从技术“补课”到生态建设,从政策性市场到开放市场,从跟随发展到自主发展!
胡伟武表示,当前,龙芯已经开启了生态建设的新征程,构建与Wintel体系和AA体系“三足鼎立”的自主信息体系新格局,而信创替代一定要做到体系替代,只有从指令系统层面的独立创新,才是真正的自主。
2022年,鹤壁市和龙芯中科达成全面战略合作协议,以龙芯中科为龙头、龙芯产业链为核心,吸引龙芯产业生态链上下游企业聚集,打造“全场景+一基地+五中心”的龙芯生态产业链,促进鹤壁信创产业发展。
本次峰会上,还举办了龙芯生态产业园集中签约仪式,16家产业链代表性企业进行集中签约,合力助推全国信创产业发展。
共勉!