奇谱科技 奇谱科技

CHIP奇谱
关注产品与技术 分享体验与新知
广告

挑战CUDA还需努力,AMD最新的ROCm 6.4版本仍未支持RDNA 4

作者:原创

AMD发布了ROCm 6.4版本,带来包括框架增强、更广泛的OS支持以及对多个性能和分析工具的改进。然而,它仍然缺乏对RDNA 4 GPU的支持,这可能会阻碍开发者转向AMD的最新架构。

ROCm是AMD的开源GPU编程平台,与Nvidia的CUDA生态系统竞争,用于为高性能计算(HPC)和人工智能(AI)应用提供动力。当RDNA 4上个月上市时,大家就期待ROCm能够第一时间实现兼容,AMD的AI软件副总裁也曾暗示过这一点。ROCm主要专注于AMD的MI Instinct加速器及其专业级Radeon Pro系列,但对消费级Radeon GPU的支持也在逐渐增加,只是速度没有CUDA那么快。

RDNA 4带来了一些架构改进,例如每个周期的FP16操作数量翻倍,INT4操作增加了8倍。此外,通过支持FP8,RDNA 4的性能可以比RDNA3的FP16能力提高8倍。没有官方的ROCm支持,这些改进实际上处于闲置状态。而且,讽刺的是,首次提到Navi 48(为RX 9070系列提供动力的GPU)可以追溯到去年的一个ROCm补丁。

尽管如此,AMD在ROCm 6.4中做了很多改进:

· 支持CPX模式与NPS4内存模式。

· 支持PyTorch 2.6和2.5。

· 支持VP9,通过rocDecode/rocPyDecode实现。

· 对ROCm计算分析器进行了多项改进。

· 支持Oracle Linux 9和Radeon PRO W7800 GPU。

尽管AMD最近努力挑战CUDA的护城河,但其硬件支持始终落后于Nvidia。ROCm对消费级Radeon GPU在Windows上的支持始于2022年,现在几乎涵盖了RDNA 2和RDNA 3系列的所有GPU(不包括RX 7650 GRE和RX 7900 GRE),但不包括RX 6600到RX 6750 XT范围的HIP SDK支持。Linux方面的情况更加严峻,只兼容4款Radeon GPU。

不过,也有好消息,现在可以在AMD的Strix Halo系列APU上使用ROCm,这些APU最多配备128GB内存,非常适合用于移动设备上的AI和HPC工作负载。AMD通常每月发布一次ROCm更新,因此我们可能会在下一个版本中看到对RDNA 4的支持。然而,这种不一致性可能会使开发者倾向于Nvidia,后者提供了更好且更可预测的兼容性。



赞(0)
未经允许不得转载:奇谱科技 » 挑战CUDA还需努力,AMD最新的ROCm 6.4版本仍未支持RDNA 4
分享到:
广告