​关于六大国产CPU介绍

2022-09-26 13:28:20 admin 63

关于六大国产CPU介绍(龙芯中科、天津飞腾、华为鲲鹏、上海兆芯、申威科技及海光信息)

CPU 是计算机系统的核心和大脑,即中央处理器是计算机的运算和控制核心,其功能主要是解释计算机指令以及处理计算机软件中的数据。CPU 主要由控制器、运算器、存储器和连接总线构成。其中,控制器和运算器组成 CPU 的内核,内核从存储器中提取数据,根据控制器中的指令集将数据解码,通过运算器中的微架构(电路)进行运算得到结果,以某种格式将执行结果写入存储器。因此,内核的基础就是指令集(指令集架构)和微架构。指令集是所有指令的集合,它规定了 CPU 可执行的所有操作,微架构是完成这些指令操作的电路设计。相同的指令集可以有不同的微架构,如 Intel 和 AMD 都是基于 X86指令集但微架构不同。

国产CPU

 指令集架构n(Instruction Set Architecture),又称指令集或指令集体系,是计算机体系结构中与程序设计有关的部分,包含了基本数据类型,指令集,寄存器,寻址模式,存储体系,中断,异常处理以及外部 I/O。指令集架构包含一系列的 opcode 即操作码(机器语言),以及由特定处理器执行的基本命令。简单地来说,指令集一般被整合在操作系统内核最底层的硬件抽象层中,属于计算机中硬件与软件的接口,它向操作系统定义了 CPU 的基本功能。

 CPU 按指令集的架构区分n,分为 CISC( Complex Instruction Set Computing,复 杂 指 令集 )型 和 RISC( Reduced Instruction Set Computing,精简指令集)型两类。CISC 的设计者希望通过直接在硬件中构建复杂的指令从而使编程更方便、程序运行速度更快,其架构中每个指令可执行若干低端操作,诸如从存储器读取、存储、和计算操作,全部集于单一指令之中;与之相反,RISC 架构中只包含使用频率高的少量简单指令,并提供一些必要的指令以支持操作系统和高级语言。

1、天津飞腾:创新可信主力芯片厂商,产业生态日益丰富,市场空间广阔,飞腾专注于 ARM 芯片研发,是中国最早获得 ARMv8 指令集架构授权的芯片设计厂商,主要致力于国产高性能、低功耗集成电路芯片的设计与服务,产品广泛应用于计算机终端与服务器。目前国内完全自主设计的芯片厂商仅飞腾、龙芯、海光、兆芯和申威等寥寥数家,飞腾在 CPU、JS 引擎性能、HTML5 兼容性等方面全面领先其他厂商。

 飞腾产品覆盖高性能服务器 CPUn、高能效桌面 CPU 和高端嵌入式 CPU 等。飞腾通过 20 年技术积累,已经形成完整的多样化算力产品谱系,是国内通用 CPU里面谱系最全的 CPU 厂家,包括高性能服务器 CPU、高效能桌面CPU、高端嵌入式 CPU,能为从端到云的各类设备提供核心算力支撑。目前,主推产品是面向服务器的 FT-2000+64、面向桌面终端的 FT-2000 四核和面向嵌入式的 FT-2000A 两核。

2、华为鲲鹏 :基于 ARM 架构授权,卓越性能提供市场最强算力支撑

作为鲲鹏计算产业底座的 Kunpeng 处理器n,华为持续重点投入以满足市场对于新算力的需求。目前鲲鹏系列已经实现量产的有 Kunpeng 912、Kunpeng 916、Kunpeng 920、Kunpeng 920s,而 Kunpeng 920Lite、Kunpeng 930 及 Kunpeng 930s 目前仍在研发中,Kunpeng 930Lite 尚在规划中。

最新鲲鹏 920 芯片已实现通用计算最强算力n,性能优于其他厂商的同类型芯片。2019 年,华为发布最新鲲鹏 920 处理器。这款鲲鹏 920 基于ARMv8 指令集,是行业内首款 7nm 数据中心 ARM 处理器,由华为自主研发设计,采用多发射、乱序执行、优化分支预测等多种手段提升单核的性能。鲲鹏 920 拥有 64 个内核,集成 8 通道 DDR4,可以提供多个接口,主频可达 2.6GHz,总带宽 640Gbps,保证了 920 超强算力的高效输出。此外,在 Memory 子系统上也进行了大量的优化,采用当前典型的 3 级Cache 的架构,对 Cache 大小以及延时进行了优化设计。鲲鹏 920 面向数据中心,主打低功耗强性能,性能达到业界领先水平,尤其是整型计算能力,业界标准 SPECint Benchmark 评分超过 930,超出业界标杆 25%,同时能效优于业界标杆 30%。并已经针对大数据、分布式存储、数据库及云服务等场景进行了欧化,通过软硬协同进一步提升处理器的性能。

n鲲鹏 920 已实现性能超越 Intel 系列 X86 芯片。鲲鹏芯片算力维度方面在非 X86 架构芯片中明显领先,且发展至目前已经达到可以与 X86 芯片相匹配的性能。鲲鹏 920 芯片基于 ARM v8 架构,各方面性能优异。目前从整体性能上看,鲲鹏 920 与芯片龙头 Intel 公司所生产的芯片相比较而言,48核鲲鹏 920 与 Intel 至强 8180 性能相当,但鲲鹏 920 能耗比对方低 20%,而 64 核的鲲鹏 920 测试性能要远优于 Intel 至强 8180。这证明 ARM 架构已经具备赶超 X86 架构性能的能力。

3、龙芯:国内最早自主研发芯片厂商,MIPS 架构体系自主化程度高

n“龙芯”是我国最早研制的高性能通用处理器系列,于 2001 年在中科院计算所开始研发,得到了中科院、863、973、核高基等项目大力支持,完成了十年的核心技术积累。n龙芯 CPU 采用 MIPS 体系结构,产品现包括龙芯1 号小CPU、龙芯2 号中 CPU 和龙芯 3 号大 CPU 三个系列,此外还包括龙芯7A1000桥片。产品方面,龙芯目前共推出 3 代 CPU产品,2017 年 4 月发布面向桌面/服务器应用的龙芯 3 号处理器的最新升级产品龙芯 3A3000/3B3000,其中,龙芯 3A3000 基于中芯 28nm FDSOI工艺,自主 GS464E 架构(自主指令系统 LoongISA),设计为四核 64 位,主频 1.5GHz,功耗仅 30W,是目前国产 CPU 中单核 SPEC 实测性能最高的芯片之一。2019 年 12 月,龙芯推出首款基于 GS464v 微架构的四核处理器 3A4000 相比上一代产品实测性能提高一倍。预计 2020 年年底将推出 3A5000/3C5000,其工艺改进提高主频至 2.5GHz,核数提升至 16 核。

¡相比于龙芯 3A3000 处理器,龙芯 3A4000 性能翻倍。龙芯 3A4000相比 3A3000 的 GS464e 微架构,进一步优化流水线,提升运行频率,加强对虚拟化、向量支持、加解密、安全机制等方面的支持。其芯片整体实测性能提升一倍左右。在某些测试项目中,龙芯 3A4000 的速度超过了 3A3000 的三倍,比如 hmmer 测试,3A4000 的速度是3A3000 的 3.6 倍,这是因为龙芯 3A4000 的向量指令在发挥作用。但与 Intel i5-7200U处理器相比,龙芯 3A4000 处理器性能还存在一定差距。从测试结果可以看到,3A4000 处理器单核整数性能只有 i5-7200U 的 60%, 浮点性能只有后者的 50%。但考虑到 Intel i5-7200U睿频频率高达 3.1GHz,处理器的每 GHz 性能为整数 10.64 分,浮点12.6 分;3A4000 处理器核的同主频性能已经能够达到 i5-7200U 处理器的 80%~90%了。

4、海光:性能优越的 x86 架构芯片,商用市场极具潜力

 海光的最大优势是其产品性能和 x86 丰富的应用生态。由于有 AMD 技术做后盾,AMD 授权给海光的是性能强劲的 Zen 的结构和代码,海光芯片性能优越,在国家级超算项目应用广泛。2018 年 7 月,AMD 与天津海光合作后首款 X86 处理器 Dhyana(禅定)启动生产,Dhyana(禅定)基于超微(AMD)Zen 核心架构开发,性能方面与 AMD EPYC 处理器相似,Linux维护者将 EPYC 支持代码转移到 Dhyana(禅定)处理器后可以成功运行,说明当时两款处理器差异相对较小。n 海光产品当下确定性高。受益于性能和生态两方面优势,且未受制裁影响,海光产品当下确定性高,可获得大量行业端国产订单。但 X86 架构的核心指令集仍然掌握在 Intel 和 AMD 手中,且海光未获得桌面产品授权,下一步海光将在现有架构基础上,持续迭代创新,维持国产先进性优势。

5、申威 :自主化程度最高的Alpha 架构芯片,主供军方与超算市场

 申威 SW26010 是中国首个采用国产自研架构且性能强大的计算机芯片。出于安全自主可控角度不再使用 ALPHA 指令集后,申威推出了自研的申威 64 位指令集,并在此基础上,成功研发出中国首个采用自主架构,同时性能达到世界一流水平的计算机芯片申威 SW26010。SW26010 采用 260核心众核架构,乱序执行架构,频率 1.45GHz,整个处理器包括 4 个 MPE管理单元、4 个 CPE 计算单元及 4 个 MC 内存控制器单元组成,总计 260个核心。

6、兆芯 :国内 x86 主要入围芯片,业务主要覆盖上海地区

兆芯的技术源自 VIAn,通过技术引进、仿制,再修改原始设计,最后自主创新,致力于通过技术创新与兼容主流的发展路线,为行业用户提供通用处理器和配套芯片等产品。公司成立以来,兆芯已成功研发并量产多款通用处理器产品,并形成“开先”、“开胜”两大产品系列。2019 年 6 月,兆芯发布开先 KX-6000/开胜 KH-30000 系列处理器,是首款主频达到3.0GHz 的国产通用处理器,也是业内第一款完整集成 CPU、GPU、芯片组的 SoC 单芯片国产通用处理器,其单芯片性能相比上一代产品提升了多达 50%,同频下的性能功耗比则是上代产品的 3 倍,产品性能与国际主流的 Intel i5 水平相当。

目前,国内 CPU 企业大多选择购买国外的架构授权,大体可以分为三类:第一类,龙芯(MIPS 指令集)和申威(Alpha 指令集),创新可信能力最强,但使用群体小,应用生态缺乏;第二类,飞腾、鲲鹏均基于 ARM 架构,由于是架构层级授权,有机会形成自主指令集,而且应用生态不断成熟;第三类,以兆芯、海光为代表的 x86 架构,由于指令集仍掌握在海外厂商手中,完全创新可信难度大。因此,在创新可信程度上申威、龙芯>海思、飞腾>海光、兆芯,但是未来鲲鹏和飞腾有机会基于 ARM V8 永久指令集授权实现进一步创新可信。