龙芯3A6000正式发布:CPU核心IP及龙架构指令系统开放授权

摘要:

11月28日,2023龙芯产品发布暨用户大会在国家会议中心如约启幕。大会以“到中流击水”为主题,现场发布新一代通用处理器龙芯3A6000、打印机主控芯片龙芯2P0500重磅成果,并对外公布龙芯处理器核IP及龙芯自主指令系统架构授权计划。

龙芯合作伙伴、权威媒体、专家学者、主管部门领导等4000余人齐聚大会,共同见证龙芯新产品发布,共谋高水平科技自立自强。

一、打造主流通用CPU芯片:龙芯3A6000已达10代酷睿四核水平

据介绍,龙芯3A6000处理器采用龙芯自主指令系统龙架构(LoongArch),是龙芯第四代微架构的首款产品,主频达到2.5GHz,集成4个最新研发的高性能LA664处理器核(6发射双线程),支持同时多线程技术(SMT2),全芯片共8个逻辑核。

集成安全可信模块,可提供安全启动方案和国密(SM2、SM3、SM4等)应用支持。

龙芯中科董事长胡伟武强调,龙芯3A6000支持的同时多线程技术(SMT2)是主流桌面/服务器CPU的标配技术,其可以使得CPU核心在同一时刻运行多个线程,补齐了龙芯CPU原有的短板。

根据中国电子技术标准化研究院赛西实验室测试结果,龙芯3A6000在2.5GHz频率下,SPEC CPU 2006 base单线程定/浮点分值分别达到43.1/54.6分,多进程定/浮点分值分别达到155/140分;

SPEC CPU 2017 base单线程(rate1)定/浮点分值分别达到5.05/7.78分,单进程多线程(speed)定/浮点分值分别达到6.66/18.1分,多进程(rate8)定/浮点分值分别达到21.3/21.0分;Stream实测带宽超过42GB/s;Unixbench实测超7400分。

与上一代的龙芯3A5000相比,单线程通用处理性能提升了60%,多进程通用处理器性能提升了100%。

综合相关测试结果,龙芯3A6000处理器总体性能与Intel公司2020年上市的英特尔第10代酷睿四核处理器相当。

需要指出的是,对于CPU来说,提升性能主要是两条路,一个是提升主频,一个是优化内核设计。

但是由于目前国内先进制程工艺发展受限,龙芯3A6000依然是基于成熟工艺打造的,其性能的提升主要是通过设计优化来提升性能。

所以我们可以看到,3A6000性能相比上一代3A5000大幅提升的同时,主频依然保持在2.5GHz。如果后续龙芯能够用上国产先进制程工艺,那么其主频无疑将会得到进一步的提升,同时叠加设计的进一步优化,将有望进一步缩小与英特尔、AMD等先进工艺CPU的性能。

胡伟武表示:“随着达到市场主流产品水平的龙芯3A6000的正式发布,龙芯终于完成了通用处理器性能‘补课’。龙芯3A6000走出了一条基于成熟工艺,通过设计优化提升性能的道路,自主研发CPU的性能完全可以赶上并超过国际主流产品水平。”

二、CPU主要IP核均自主研发:性能没有天花板!

作为一款国产通过CPU来说,龙芯3A6000的自主可控程度也是目前国产CPU当中最高的。

早在2020年,龙芯中科基于二十年的CPU研制和生态建设积累推出了自研的龙架构(LoongArch),包括基础架构部分和向量指令、虚拟化、二进制翻译等扩展部分,近2000条指令。

更为关键的是,全新的龙架构已不再包含MIPS指令系统。龙芯表示,LoongArch架构具有完全自主、技术先进、兼容生态三方面特点。

对于龙芯来说,围绕自研的LoongArch指令集架构,不仅推出了自研的CPU的内核,其内部集成的GPU内核、加减密IP、高速传输接口IP、存储接口IP、音视频接口IP、UART等其他接口IP,以及各种规格的寄存器堆、PLL、DDR3/4-PHY、HT-PHY等硬核IP也全都是自研的。

龙芯中科副总裁张戈在会后接受芯智讯专访时进一步指出:“随着CPU功能和性能越来越强,很多时候不单单是要解决处理器内核的问题,还会涉及到很多的配套的外围关键IP。

龙芯团队经过十多年的积累,不仅仅是拥有指令集、CPU IP方面的研发能力,还包括了2D/3D GPU以及未来GPGPU、AI加速等方面的能力。

此外,在CPU与外界通信还需要大量的高速接口IP、数字模拟转换接口IP等等。这些都是我们团队自行研发完成的,而国内其他CPU设计厂商大部分都是购买了第三方的IP。”

三、桌面/服务器/移动终端全面覆盖

除了龙芯3A6000之外,龙芯中科还公布了同样基于其第四代“LA664”CPU内核的服务器CPU产品3C/D/E6000和移动终端CPU产品2K3000。

据介绍,龙芯3C6000目前已经设计完成,其单硅片16核32线程(LA664),通用处理性能得到了成倍提升。同时配备的DDR4-3200x4接口使得访存带宽比上一代3C5000成倍提高;PCle4 x 64的IO性能比上一代3C5000成数量级提高。龙芯3C6000还支持高性能国密标准加解密算法(SM4带宽>30Gbps)。

另外,为了提升芯片间的互联性能,龙芯中科还推出了自研的龙链技术( Loongson Coherent Link),对标nVlink、CXL等目前主流的片间互联技术,可以实现比PCIe等I/O总线更为高速、低延迟的片间互连。这也为龙芯后续的CPU与CPU互联、CPU与GPGPU互联、GPGPU和GPGPU互联提供高速缓存一致性协议传输。

得益于龙链技术的加持,使得LS3D6000双硅片32核64线程、LS3E6000四硅片64核128线程得以快速实现,同时支持GPUGPU、各类加速器扩展。

此外,龙芯面向笔记本/云终端的八核单硅片SoC——龙芯2K3000也已经完成了前端设计。其集成了8个自研的LA364处理器内核,单核性能接近3A5000,还集成了自研的LG200 GPGPU内核。

据介绍,龙芯的GPGPU内核LG200 可以支持图形加速、科学计算加速、AI加速等功能。具体来说,升级了图形渲染功能(OpenGL4.0),支持通用计算(支持OpenCL3.0),支持INT8张量计算加速部件。同时拥有增强架构伸缩能力,单节点性能达256GFlops-1TFlops。

值得一提的是,自今年以来,随着生成式AI的火爆,英特尔、高通、联发科等芯片大厂也纷纷推动生成式AI进入终端侧,都推出了支持端侧生成式AI大模型运行的芯片。英特尔和高通还积极推动传统PC转向AI PC。显然,这对于龙芯中科来说,也是一个机遇。

张戈告诉芯智讯:

“AI PC是一个趋势,龙芯接下来也将会把对于8bit、16bit的加速的模块给做到下一代的笔记本CPU当中。我们认为,其实这种端侧AI本身的芯片门槛并不高,我们之所以现在没有去做,也是因为这并不是我们主要投入精力的部分。像寒武纪的团队,原来原来龙芯曾是一个大团队,他们的创始人还是胡伟武老师的学生,所以这方面,其实我们应该说掌握起来难度并不大。”

四、2P0500打印机主控芯片

在本次大会上,龙芯中科还推出了一款适用于单/多功能打印机的主控SoC芯片——龙芯2P0500。

据介绍,该芯片采用异构大小核结构,集成DDR3内存、GMAC、OTG等多种功能模块,具有打印数据接收、解析和处理,打印引擎控制,扫描时序控制,数据扫描,图像处理,马达控制等功能,单芯片即可满足打印、扫描、复印等多种典型应用需求。

龙芯中科基于龙芯2P0500推出打印机、扫描仪、复印机等多种解决方案,并与国内多个主流打印机整机厂家合作,完成打印、扫描、复印等多种应用适配。

大会现场,长城信息股份有限公司、中船汉光科技股份有限公司、上海汉图科技有限公司、西安电子科技大学、恒科科技产业有限公司、宁波华高信息科技有限公司、云南南天电子信息产业股份有限公司、北京辰光融信技术有限公司、北京高德品创科技有限公司、天津光电通信技术有限公司、浙江沧田智能信息科技有限公司、大连中盈科技股份有限公司共12家打印机厂商与龙芯中科签订协议,共建国产打印机新生态。

五、已建成与X86/Arm并列的基础软件体系

作为一个发展至今才短短三年时间的LoongArch体系,在软件生态方面相比已有20年以上历史x86、Arm生态来说,无疑是非常薄弱的。因此,龙芯通过积极通过自研关键软件(比如浏览器等)以及与第三方软件厂商合作的同时,也积极通过拥抱开源软件生态来进行破局,并迅速建起了完整的LoongArch开源生态体系。

在操作系统方面,统信、麒麟等国产操作系统企业在持续兼容的基础上,均对龙芯3A6000新特性进行全面支持。

在软件方面,龙芯3A6000还完善了对软硬协同的二进制翻译的支持,可提高了龙架构的二进制翻译效率,运行更多种类的跨平台应用,满足各类大型复杂桌面应用场景。

龙芯中科董事长胡伟武在《将自主进行到底》主题报告中指出,我国信息产业的根本出路在于构建独立于X86和Arm体系之外的自主生态体系。

胡伟武在介绍基于龙芯自主指令系统龙架构的软件生态时认为,龙架构已建成与X86、Arm并列的Linux基础软件体系,得到与指令系统相关的主要国际软件开源社区的支持,得到国内统信、麒麟、欧拉、龙蜥、开源鸿蒙等操作系统,以及WPS、微信、QQ、钉钉、腾讯会议等基础应用的支持。

龙芯中科负责基础软件研发的副总裁高翔在介绍龙架构的开源软件工作时表示,龙架构已得到国际开源软件社区的广泛支持,成为与X86、ARM并列的开源软件世界顶层指令集架构。

Linux内核、GCC编译工具链、LLVM编译器、Go语言、Rust语言、QEMU系统、V8 JavaScript引擎、.NET编程框架、FFmpeg音视频编解码加速库等大量重要的开源软件社区都已经以较高级别和较完善的程度实现对龙架构的支持。

基于这些开源软件社区发布的软件版本,可以直接构建龙架构的操作系统发行版。

龙芯中科秉持开放、合作的开源生态建设理念,累计向近200个国际开源软件项目社区贡献超百万行源码。大量国内外开发者也加入龙架构的开源生态建设中,为开源社区龙架构版本开发做出重要贡献。龙架构的基础软件发展已经深度融入国际开源软件生态体系。

胡伟武表示:“随着龙芯3A6000的性能达到市场主流产品水平,基于龙架构的基础软件生态的基本建成,龙芯也将开启生态建设新征程——构建独立于X86体系和Arm体系的自主信息技术体系。”

五、CPU内核IP及龙架构指令系统开放授权,拓展硬件生态

胡伟武在大会报告中指出,在政策性市场带动下,基于龙架构的自主体系基本形成,但各环节仍比较薄弱。一枝独秀不是春、百花齐放春满园,龙芯中科将秉承共建、共商、共享的理念,与合作伙伴共建龙架构生态。

为此,龙芯中科宣布将龙芯CPU核心IP及龙架构指令系统开放授权给合作伙伴,支持合作伙伴研制基于龙芯CPU核心IP及龙架构指令系统的SoC芯片产品。

具体来说,目前龙芯CPU内核IP拥有五款,包括LA132、LA264、LA364、LA464、LA664。龙芯中科处理器核首席架构师汪文祥表示,这些龙芯自研的系列化CPU核心,产品的性能指标达到同类型产品市场主流水平,可以满足信息化处理、网络安全、工业控制、边缘计算、物联网等应用的SOC芯片研制需求。

本次对外开放授权的是对标Arm Cortex-M4的LA132、对标Coretx-A55的LA264、对标Coretx-A75的LA364。

在本次大会上,苏州雄立科技有限公司、大唐可再生能源试验研究院有限公司、得一微电子股份有限公司、山东领能电子科技有限公司、三峡智控科技有限公司、国家超级计算无锡中心、北京得瑞领新科技有限公司、北京科技大学工业互联网研究院、西安微电子技术研究所、北方自动控制技术研究所共10家企业与龙芯中科正式签署合作协议,将使用基于龙架构的CPU核设计超算芯片、专用控制芯片、存储控制芯片等多种SoC芯片。

龙芯联合多家芯片合作伙伴共建的龙架构软硬件生态正在蓬勃发展,形成“众木成林”的态势。

此外,胡伟武还在大会上透露,未来龙架构指令系统也将考虑开放授权。但是,鉴于目前开源指令集过度开放所带来的生态碎片化、软件不兼容等问题,龙芯也正在起草技术规范协议,并公开征求意见。只要签署该技术协议,即可获得永久授权。

在大会现场,作为全球头部的主板品牌,华硕负责人也宣布将结合华硕在主板设计和CPU超频上的丰富经验,推出基于龙芯3A6000芯片的主板产品。同时,该负责人还透露,已经验证了将龙芯3A6000超频到3GHz。

龙芯还携手50多家合作伙伴举办了基于龙芯3A6000处理器的整机产品发布仪式。

同方计算机、航天七〇六、联想开天、超越科技、升腾资讯、攀升、国光信息、北方自控、视睿、海尔雷神、宝德网安、百信、黄河信产、大众电子、方正数码、西计、北联国芯、航天龙梦、卓怡恒通、云涌科技、上海华硕、上海六联、智微智能、高能计算机、腾凌科技、百代存储、天安星控、派若乐、龙迈科技、众达、盛博科技、昆山嘉提、江苏嘉擎、集和诚、迅为电子、驭芯科技、深中微、航普电子、华龙讯达、道莅智远、吉斯凯达、配天技术、智流形机器人、松科智能、电科网安、高鸿信安、天融信、铵泰克、宽域、木链科技、全讯汇聚、长焜科技等50余家合作伙伴发布基于龙芯3A6000的桌面计算机、笔记本、板卡、存储产品、网络安全设备、工业控制计算机等产品。

六、全面展示,焕发“芯”活力

在大会展区,近60家龙芯合作伙伴展出数百款基于龙芯CPU的解决方案,涵盖信息化办公、工业控制、智能制造、智能家居、数字五金等多个场景。

在游戏体验区,搭载龙芯3A6000处理器的电脑支持畅玩云·原神、古墓丽影等大型3D游戏,在办公体验区除可使用QQ、微信、钉钉等常用办公软件外,中望CAD、云桌面、WPS、数字孪生开发引擎软件等行业应用也能流畅地运行在龙芯电脑上,现场嘉宾无不感叹“龙芯电脑更好用了!”。

五金电子区、工业自动化控制区、教育体验区等特色体验区也为现场嘉宾带来“沉浸式”感受。

小结:

龙芯此次发布的桌面处理器龙芯3A6000在性能上已经到了英特尔10代酷睿四核水平,这也代表了这款芯片将可以进入更为广阔的主流市场,而非龙芯原有的信创市场。后续的服务器处理器龙芯3C6000和移动桌面终端处理器2K3000也有望进入主流市场,与英特尔和AMD进行竞争。

胡伟武也表示,由本次发布的桌面处理器龙芯3A6000、在研服务器处理器龙芯3C6000和移动桌面终端处理器2K3000构成的龙芯“三剑客”已具有一定开放市场竞争力。

此外,围绕自研的龙架构,龙芯也迅速建起了完整的LoongArch开源生态体系,这也有利于龙芯CPU在公开市场的开拓。而龙芯对于自研CPU内核IP及未来龙指令集的开放授权,也将进一步加速龙芯软硬件生态的壮大。

“龙芯CPU是目前最自主的,所以没有‘卡脖子’风险,也没有‘天花板’的压制,可以在市场实践中不断迭代。

当然,这也带来一些难题,比如自主生态智能靠自己来建设,不能跟着走。但这也可能会成为我们未来的优势。我相信龙芯CPU能够把自主化的优势转化为性能和生态优势,构建与X86体系和Arm体系‘三足鼎立’的新型信息技术和软件生态!”龙芯中科董事长胡伟武非常有信心的说道。

查看评论
created by ceallan