安培架构
Nvidia Ampere 是由 Nvidia 开发的图形处理单元(GPU)微架构,作为 Volta 架构 和 Turing 架构 架构的后继者。它于 2020 年 5 月 14 日正式宣布,并以法国数学家和物理学家 André-Marie Ampère 命名。
主要特性
-
CUDA 计算能力:A100 采用 CUDA 计算能力 8.0,GeForce 30 系列采用 8.6。
-
制程工艺:A100 使用了 TSMC 的 7 nm FinFET 工艺,而 GeForce 30 系列使用了三星定制的 8 nm 工艺(8N)。
-
Tensor Cores:第三代 Tensor Cores 支持 FP16,bfloat16,TensorFloat-32 (TF32) 和 FP64,并具有稀疏性加速。每个 Tensor Core 的处理能力是前一代的 4 倍(GA100,GA10x 上为 2 倍)。
-
内存支持:A100 40GB 和 A100 80GB 使用了高带宽内存 2 (HBM2),而 GeForce RTX 3090,RTX 3080 Ti,RTX 3080,RTX 3070 Ti 使用了 GDDR6X 内存。
-
PCI Express 4.0:支持 PCI Express 4.0,其中 A100 还支持 SR-IOV。
-
虚拟化和 GPU 分区:A100 支持多实例 GPU (MIG) 虚拟化和 GPU 分区功能,最多支持七个实例。
Ampere 架构产品
Ampere 架构被广泛应用于 Nvidia 的各类产品中,包括:
-
GeForce RTX 30 系列:包括 Nvidia GeForce RTX 3090,Nvidia GeForce RTX 3080 Ti,Nvidia GeForce RTX 3080,Nvidia GeForce RTX 3070 Ti 等。
-
RTX A 系列:专业/工作站级别的 GPU,如 Nvidia GeForce RTX A6000,Nvidia GeForce RTX A5000 等。
-
Nvidia A100:用于服务器/数据中心的 GPU。
本文作者:Maeiee
本文链接:安培架构
版权声明:如无特别声明,本文即为原创文章,版权归 Maeiee 所有,未经允许不得转载!
喜欢我文章的朋友请随缘打赏,鼓励我创作更多更好的作品!