AMD MI300X 评估:强悍硬件难掩软件短板,难以跨越英伟达“CUDA 护城河”
近日,科技媒体SemiAnalysis发布了一篇关于AMD新款MI300X AI芯片的调研报告。经过长达5个月的深入调研发现,尽管MI300X硬件性能强大,但由于软件存在严重问题,难以撼动英伟达在市场上的主导地位。
从规格上看,AMD的MI300X芯片具有一定优势,拥有1307 TFLOPS(FP16)的算力和192GB HBM3内存,相较之下,英伟达的H100为989 TFLOPS和80GB内存,即使是H200也只有141GB内存。同时,AMD系统的成本更低,拥有更经济的以太网络。
然而,调研发现AMD的软件存在诸多问题,运行时需要大量的调试工作,几乎无法进行AI模型训练。与此同时,英伟达不断推出新功能、库和性能更新,扩大其领先优势。
根据分析师通过GEMM基准测试和单节点训练等大量测试,发现AMD难以逾越英伟达的“CUDA护城河”。
据报道,AMD的开箱即用体验非常糟糕,需要大量时间和精力才能使其达到可用状态。甚至最大的GPU云供应商Tensorwave都需向AMD团队提供免费的GPU访问权限以修复软件问题。
SemiAnalysis建议AMD CEO苏姿丰增加对软件开发和测试的投入,学习Nvidia的经验,为自动化测试分配成千上万个MI300X芯片,简化复杂的环境变量并优化默认设置,提升开箱即用体验。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。