主要参数 | |
核心频率 | 1095 MHz |
---|---|
Turbo频率 | 1410 MHz |
流处理单元 | 6912 个 |
核心架构 | Ampere |
GPU代号 | GA100 |
生产工艺 | 7 nm |
TDP功耗 | 400W |
内存参数 | |
内存频率 | 2.4 Gbps |
---|---|
内存类型 | HBM2e |
内存位宽 | 5120 bit |
最大显存 | 40 GB |
参数补充 | |
代工厂 | TSMC |
---|---|
核心面积 | 826 mm² |
一级缓存 | 192 KB |
二级缓存 | 40 MB |
光栅单元 | 432 |
纹理单元 | 160 |
SM count | 108 |
Tensor cores | 432 |
建议电源 | 800 W |
总线接口 | PCIe 4.0 x16 |
理论性能 | |
像素填充率 | 225.6 GPixel/s |
---|---|
纹理填充率 | 609.1 GTexel/s |
显存带宽 | 1,555 GB/s |
FP16 | 77.97 TFLOPS (4:1) |
FP32 | 19.49 TFLOPS |
FP64 | 9.746 TFLOPS (1:2) |
显卡特性 | |
DirectX | N/A |
---|---|
OpenGL | N/A |
OpenCL | 3.0 |
Vulkan | N/A |
CUDA | 8.0 |