![](http://y.zdmimg.com/202108/06/610ca71eac9ed5344.jpg_f710.jpg)
安培架构
Ampere架构是NVIDIA于 GTC 2020发布的GPU架构,NVIDIA Ampere 由540亿晶体管组成,是7nm芯片。
NVIDIA Tensor 核心技术最先运用在 NVIDIA Volta™ 架构上,不只大幅加速人工智能,也将训练时间从数周降至数小时,同时显著提升推论速度。NVIDIA Ampere 架构以这些创新技术为基础,采用全新精度标准 Tensor Float 32 (TF32) 与 64 位浮点 (FP64),以加速并简化人工智能应用,同时将 Tensor 核心效能拓展至高效能运算。
TF32 与 FP32 运作方式相同,无需更改任何程序代码即可将人工智能速度提升至最高 20 倍。透过 NVIDIA 自动混合精度,研究人员只要多加几行程序代码,就可以利用自动混合精度和 FP16 将效能提升 2 倍。而 NVIDIA Ampere 架构 Tensor 核心 GPU 中的 Tensor 核心透过支持 bfloat16、INT8 与 INT4,能为人工智能训练和推论创造极致多元的加速器。A100 和 A30 GPU 不只将强大的 Tensor 核心导入高效能运算,也支持完整矩阵运算、通过 IEEE 认证,并使用 FP64 精度。
每个人工智能与高效能运算应用都能受益于加速,但并非所有应用都需要使用 GPU 的完整效能。多实例 GPU (MIG) 是 A100 和 A30 GPU 支持的功能,可让工作负载共享 GPU。MIG 让每个 GPU 能分隔成多个 GPU 实例,各自在硬件中完全独立且受保护,且具备个别的高带宽内存、快取和运算核心。不论大小,开发人员可为所有应用提供突破性加速,并获得服务质量保障。IT 管理人员可为最佳利用率提供规模适中的 GPU 加速,并将横跨实体与虚拟环境的访问权限扩展给每个使用者和应用。
在跨多个 GPU 上扩充应用程序需要极快的数据移动速度NVIDIA Ampere 架构中的第三代 NVIDIA® NVLink® 可将 GPU 到 GPU 的直接带宽翻倍,达到每秒 600 GB (GB/秒),比第四代 PCIe 速度快近 10 倍。搭配最新一代 NVIDIA NVSwitch™ 使用时,服务器中的所有 GPU 都能透过 NVLink 全速相互交流,执行极高速的数据传输。
注:本名词内容引自百度百科
![](https://res.smzdm.com/pc/pc_library/dist/img/the-end.png)
![COLORFUL 七彩虹 iGame GeForce RTX 3060 Ultra W OC 12G 显卡 12GB 白色](https://qny.smzdm.com/202103/13/604c59f2441917348.png_a200.jpg)
![ROG 玩家国度 魔霸5 15.6英寸 游戏本](https://qny.smzdm.com/202101/13/5ffe6e799ee4a9879.jpg_a200.jpg)
![GALAXY 影驰 GeForce RTX 3080 Ti 金属大师 OC 显卡 12GB 银色](https://y.zdmimg.com/202106/03/60b8c87047af08833.jpg_a200.jpg)
![MSI 微星 GeForce RTX 3060 Gaming X TRIO 12G 魔龙 显卡 12GB](https://y.zdmimg.com/202102/26/6038756e141024515.jpg_a200.jpg)
![COLORFUL 七彩虹 iGame GeForce RTX 3070 Neptune OC 8G 显卡 8GB 黑色](https://y.zdmimg.com/202101/12/5ffd1992e9d898843.jpg_a200.jpg)
![MECHREVO 机械革命 Umi Pro3 十一代酷睿版 15.6英寸 游戏本](https://qny.smzdm.com/202204/12/62552b05703c74796.jpg_a200.jpg)
![GALAXY 影驰 RTX 3090 金属大师 显卡 24G 白色](https://qny.smzdm.com/202102/10/602379784691a1550.jpg_a200.jpg)
![GALAXY 影驰 RTX 3090大将 显卡 24G 金色](https://qny.smzdm.com/202102/10/60237c251551e1049.jpg_a200.jpg)