安培架构

Nvidia Ampere 是由 Nvidia 开发的图形处理单元（GPU）微架构，作为 Volta 架构和 Turing 架构架构的后继者。它于 2020 年 5 月 14 日正式宣布，并以法国数学家和物理学家 André-Marie Ampère 命名。

主要特性

CUDA 计算能力：A100 采用 CUDA 计算能力 8.0，GeForce 30 系列采用 8.6。
制程工艺：A100 使用了 TSMC 的 7 nm FinFET 工艺，而 GeForce 30 系列使用了三星定制的 8 nm 工艺（8N）。
Tensor Cores：第三代 Tensor Cores 支持 FP16，bfloat16，TensorFloat-32 (TF32) 和 FP64，并具有稀疏性加速。每个 Tensor Core 的处理能力是前一代的 4 倍（GA100，GA10x 上为 2 倍）。
内存支持：A100 40GB 和 A100 80GB 使用了高带宽内存 2 (HBM2)，而 GeForce RTX 3090，RTX 3080 Ti，RTX 3080，RTX 3070 Ti 使用了 GDDR6X 内存。
PCI Express 4.0：支持 PCI Express 4.0，其中 A100 还支持 SR-IOV。
虚拟化和 GPU 分区：A100 支持多实例 GPU (MIG) 虚拟化和 GPU 分区功能，最多支持七个实例。

Ampere 架构被广泛应用于 Nvidia 的各类产品中，包括：

GeForce RTX 30 系列：包括 Nvidia GeForce RTX 3090，Nvidia GeForce RTX 3080 Ti，Nvidia GeForce RTX 3080，Nvidia GeForce RTX 3070 Ti 等。
RTX A 系列：专业/工作站级别的 GPU，如 Nvidia GeForce RTX A6000，Nvidia GeForce RTX A5000 等。
Nvidia A100：用于服务器/数据中心的 GPU。

本文作者：Maeiee

本文链接：安培架构

版权声明：如无特别声明，本文即为原创文章，版权归 Maeiee 所有，未经允许不得转载！

喜欢我文章的朋友请随缘打赏，鼓励我创作更多更好的作品！