AMD 架构创新成果:最新 AI 系统比 2020 年的产品能效提高 28.3 倍

xxn 阅读:52343 2024-12-12 00:03:29 评论:0

IT之家 12 月 11 日消息,AMD 在 2021 年初就制定了“到 2025 年将 EPYC 处理器和 Instinct 加速器的能效提高 30 倍”的目标。

根据 AMD 官方的说法,尽管距离 2025 年尚有一段时间,但他们目前距离这一目标只差一步之遥:配备最新 EPYC 9575F 和 Instinct MI300X 的机器相较于 2020 年一台未公开机器的能效提高了 28.3 倍。

AMD 在测试中采用了 Llama3.1-70B(vLLM 0.6.1.post2、TP8 Parallel、FP8、连续批处理)模型进行测试,来对比其推理性能的差异。

尽管 AMD 没有透露测试中使用的 2020 年硬件规格,但很显然,这基于 Zen 2 系列的 EPYC 7002 处理器(单个 CPU 最多 64 核)以及基于初代 CDNA 架构的 Instinct MI100 加速器。

AMD指出,除了硬件的强劲提升之外,这一成就是通过架构改进和软件优化的综合效果实现的,这是一个可预见的结果。

该公司最近推出了基于 CDNA 3 架构的 Instinct MI325X 加速器,搭载了 288 GB HBM3E 内存子系统;AMD计划明年推出基于 CDNA 4 架构的 Instinct MI355X,其性能(FP8 和 FP16)预计将比 MI325X 提高大约 80%。

MI325X 除了支持 FP8 和 FP16 外,还将支持 FP4 和 FP6 格式,其峰值性能将达到 9.2 PetaFLOPS(FP4),这对许多大型语言模型而言非常有用。这表明,AMD 并非难以在 2025 年实现其计算平台能效提升 30 倍的目标。

AMD 高级副总裁、AMD 公司研究员和产品技术架构师 Sam Naffziger 表示,“通过我们的深思熟虑的硬件和软件协同设计,我们对实现 30x25 目标充满信心,并对未来充满期待,我们已经看到了在未来几年内实现大幅度能效提升的有效途径。”

相关阅读:

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容