当前位置: 雪花家园 >  系统资讯 >  AMD APU MI300A量产:OpenFOAM测试是英伟达H100的4倍,性能超越预期

AMD APU MI300A量产:OpenFOAM测试是英伟达H100的4倍,性能超越预期

更新时间:2023-12-07 07:30:39作者:xhjaty
12 月 7 日消息,AMD 在推出旗舰 MI300X 加速卡之外,还宣布 Instinct MI300A APU 已进入量产阶段,预估明年开始交付,上市后有望成为世界上最快的 HPC 解决方案。

AMD APU MI300A量产:OpenFOAM测试是英伟达H100的4倍,性能超越预期

AMD APU MI300A量产:OpenFOAM测试是英伟达H100的4倍,性能超越预期

AMD Instinct MI300A 加速器以创新的 AMD CDNA 架构为基础,经优化可实现百万兆次级性能和节能。是创新的针对 HPC 和 AI 的加速处理器 (APU),提供 24 个“Zen 4”CPU 核心和 128 GB 的 CPU 与 GPU 共享的 HBM3 内存,带来非凡的性能。

AMD Instinct MI300A APU 结合了 Zen 4、CDNA 3 和第 4 代 Infinity 架构和互联技术,其部分性能如下:

FP64 精度下,最高算力 61 TFLOPS

FP32 精度下,最高算力 122 TFLOPS

最高 128 GB HBM3 内存

1460 亿个晶体管

MI300A 的封装和 MI300X 非常相似,不过前者使用了 TCO 优化的内存容量和 Zen 4 内核。

AMD APU MI300A量产:OpenFOAM测试是英伟达H100的4倍,性能超越预期

每个活动 die 有 2 个 CDNA 3 GCD,提供单独的缓存和核心 IP 池。每个 CCD 有 8 个内核和 16 个线程,因此活动芯片上总共有 24 个内核和 48 个线程。还有 24 MB 的 L2 缓存(每个内核 1 MB)和一个单独的缓存池(每个 CCD 32 MB)。

AMD APU MI300A量产:OpenFOAM测试是英伟达H100的4倍,性能超越预期

AMD APU MI300A量产:OpenFOAM测试是英伟达H100的4倍,性能超越预期

在 GPU 方面,AMD 基于 CDNA 3 架构共支持了 228 个计算单元,相当于 14592 个内核。也就是说,每个 GPU 小芯片有 38 个计算单元。

简要总结下 AMD Instinct MI300 加速器的突出功能

首款集成 CPU+GPU 封装

瞄准百万兆次级超级计算机市场

1460 亿个晶体管

最多 24 个 Zen 4 核心

CDNA 3 GPU 架构

228 个计算单元(14,592 个内核)

最高 128 GB HBM3 内存

最多 8 个 Chiplets + 8 个存储器堆栈(5nm + 6nm 工艺)

性能

AMD 再次将 MI300A 与 H100 进行了比较,得益于统一的内存布局、GPU 性能以及整体内存容量和带宽,在 OpenFOAM 测试中,性能是 H100 的 4 倍。

AMD APU MI300A量产:OpenFOAM测试是英伟达H100的4倍,性能超越预期

AMD APU MI300A量产:OpenFOAM测试是英伟达H100的4倍,性能超越预期

AMD APU MI300A量产:OpenFOAM测试是英伟达H100的4倍,性能超越预期

AMD 还证实,Instinct MI300A APU 现已出货,还将用于为下一代 El-Capitan 超级计算机提供动力,该超级计算机预计将提供高达 2 Exaflops 的计算能力。

相关教程

copyright ©  2012-2024 雪花家园 m.xhjaty.com 版权声明