从 SM 单元架构上看,每个 SM 单元包含 4 个分区,每个分区包含第三代 Tensor Core,还包含由 16 个 FP32 单元、8 个 FP32+8 个 INT32 单元组成的混合单元,可执行 FP32 或 INT32 运算。