国产化通用处理器之现状

(注意:相关观点仅用于技术交流并无商业目的,如果有不妥之处敬请指正)

自1980年代从申威处理器(通过买断美国DEC的Alpha架构)开始,期间经历国防科大探索的辛酸(先后尝试X86、惠普的Epic、SPARC、ARM,最终在1999年选择了ARM架构,目前在军方认可的三家自主可控处理器----飞腾、龙芯、申威中位居第一);作为地方操作方式龙芯于2001年由中科院计算所推出,采用MIPS架构,相比飞腾、申威,龙芯缺乏强大后盾,逆境中生长,在嵌入式领域找到自己的定位。

到2018年,飞腾以其通用性(ARM架构的产业链最成熟)占有国产化通用处理器领域最大份额,再加上中电集团的加盟,商业化能力只是稍逊龙芯;龙芯在商业化能力是老大,嵌入式领域(航天、军工)独占江湖;申威在超算(国家专项资金扶持)是老大,但正因为这个原因,它下沉到通用服务器领域的能力较飞腾、龙芯是最弱的,到2020年中电科集团加盟,希望能够奋起直追。

因为自主通用处理器性能不够,功耗体积大,加上自建软件生态难度很大,2013年起,“核高基”基本放弃了CPU自主研发路线,开始客观思考ARM、X86架构引进和自主可控的逻辑:申威、龙芯都是基于境外的架构基础上加入自己的理解而发展的,因而基于更先进、产业链更加成熟的ARM、X86架构,与自主可控并不矛盾,因而华为、展讯、飞腾都选择了ARM架构:华为的强大能力让鲲鹏处理器成为目前最有竞争力的国产化通用处理器;上海兆芯通过台湾VIA获取了X86架构,加上可以直接继承大量软件的原因,在政府办公、保密等桌面应用领域占有最大份额;海光通过AMD的X86授权,更多在服务器领域耕耘。



Intel通用处理器和国产化处理器比较:

第一在芯片工艺上,intel已经处于12nm阶段(2023年推出7nm),而我们的国产化处理器普遍处于28nm阶段,14nm的制造工艺其实还是受制于外方(这个制约着产业化规模,还能真正称为“自主可控”吗?);芯片工艺是处理器性能、功耗的基础,按照nm级别估算国产化处理器在性能和功耗上与Intel比较至少差距在2倍,也就是说通用处理能力要求下国产化处理平台的机器台数是Intel平台的2倍,如果考虑指令集方面的落后,这个数字还得扩大;

第二是设计能力上,Intel平台经过多年的发展,在多核、超线程、特殊指令集(超长并行指令、AES密码算法指令)等方面远远领先于ARM架构(都不用谈国产化的问题),因而在服务器领域Intel平台领先于ARM架构至少40%或以上的算力,再加上大量的软件(大数据、人工智能)都是基于Intel架构和指令集进行的优化,因而在国产化平台上想发挥出这些软件的能力,移植只是一个最基本诉求,难度更大的是优化,如果不进行优化,大量软件要损失至少50%以上的性能,许多软件甚至不能运行(比如正则匹配库HyperScan使用了大量的Intel特有指令集;虚拟化技术等);国产化处理器团队在虚拟化、规则匹配方面已经做了一些工作,但更多的优化还是基于FPGA辅助的方式才能达到目前Intel的水平,这必然提高了成本:以使用Xilinx K7系列FPGA为例,一个Xilinx K7系列FPGA芯片价格是700RMB,国产化可替代芯片(比如复旦微的K7系列FPGA)高达5000RMB。要将大量的成熟算法移植到国产化平台,特别是目前大数据、人工智能算法方面国产化处理器团队进行的工作还是相当的少,只能有待时日。

综上,考虑到大数据、人工智能等方面的应用,如果不考虑FPGA的方案,则在相同功耗和设备体积的情况下,整体处理能力至少降低2倍或更多;如果考虑FPGA的方案,依然使用进口芯片成本会提升20%左右,使用国产化芯片成本将是2倍的提升(还要考虑算法往FPGA移植难度和成本)。

举报
评论 0