回归 Pascal:英伟达 RTX 50 显卡全部 CUDA 核心支持 FP32 / INT32 双功能
xxn
阅读:1502
2025-02-01 14:00:27
评论:0
最新消息显示,英伟达已发布Blackwell GPU架构白皮书,揭示了GeForce RTX 50系列显卡的许多技术细节。其中值得关注的一点是Blackwell架构的所有单精度CUDA核心均支持FP32 / INT32数据,这使其回归到了九年前Pascal架构的设计思路。
在GeForce 10“Pascal”一代中,英伟达仍然采用单精度CUDA单元兼容FP32 / INT32的设计。而在Volta和Turing两代中,则采用了两组1:1比例的CUDA核心分别处理INT32和FP32数据。
在Ampere架构中,英伟达为每个SM流式处理器的四个处理块之一提供了1组16个FP32 / INT32单元和1组16个纯FP32单元;这一设计在Ada GPU上也延续了下来。
Blackwell架构引入了统一CUDA,使得每个SM的INT32整数运算能力相较Ada翻倍。然而,在任何指定的时钟周期内,Blackwell统一内核只能以FP32或INT32模式中的一种运行。
英伟达表示,Ada架构SM设计和优化旨在标准着色器,而Blackwell的SM设计则专注于神经着色器。
广告声明:文中包含的外部链接旨在传达更多信息,节省筛选时间,仅供参考。
声明
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。