好消息! AMD正式发布ROCm 6.4.0版, 包含多项改进和创新

  • 2025-04-15 12:24:55
  • 688

美国时间2025年4月11日,AMD正式发布ROCm 6.4.0版。

可能有些普通读者朋友不理解AMD的ROCm是什么?下面小编介绍一下:

ROCm的英文全称为“Radeon Open Compute”,它是AMD所推出的、非常类似英伟的达CUDA开源软件平台,让开发者可以像使用AMD的GPU执行科学计算、机器学习和深度学习等任务。

ROCm 6.4.0版主要有以下重要改进:

1、在Megatron-LM框架中添加了对几种新内核支持,Megatron-LM框架是Megatron-LM的特殊分支,旨在AMD GPU上实现高效训练大规模语言模型,新版Megatron-LM增加了以下几种新内核:Fused Attention (Fused QKV)、Fused Layer和NormFused ROPE。

2、改进了ROCm用户空间软件与AMDKFD内核模式驱动程序之间的兼容性,以实现对新旧内核版本更好的兼容性。AMD扩大了内部测试范围,以涵盖、支持更多用户/内核组合。

3、添加了对PyTorch 2.5和PyTorch 2.6的支持。4、在rocDecode和rocPyDecode中添加了对VP9的支持,在rocDecode中还添加了对Bitstream reader的支持。

5、为 ROCm数据中心工具引入了新的模块。6、添加了对Oracle Linux 9(Oracle的RHEL9 衍生版)的官方支持。7、添加了Radeon PRO w7800 48GB的支持。

另外,6月10日AMD宣布6月12日举办Advancing AI主题活动(请参阅上图),承诺将在这次活动上“介绍ROCm开放软件生态系统的最新进展”,预计届时会更加详细地介绍ROCm 6.4.0,非常值得期待。