快科技 8 月 13 日消息,除了玩游戏,NVIDIA 的显卡还在 AI 加速上遥遥领先,不仅科技巨头都在抢 A100/H100 等显卡,GeForce 游戏卡也是普通人搞 AI 炼丹的选择,AMD 显卡在这方面落后不少。
好消息是 AMD 现在也能追上来了,深度学习领域的华人大神、OctoML CTO 陈天奇带领团队在 AMD 显卡上做出了大模型推理的方案,这意味着业界又有 NVIDI 之外的选择,不用为 N 卡抢破头、加价而困扰了。
根据他的优化算法,在 Llama2 的 7B 和 13B 大模型中,用 RX 7900 XTX 显卡也能跑出让人满意的性能,性能已经达到了 RTX 4090 显卡 82% 或者 RTX 3090 Ti 显卡的 94% 水平。
不仅是性能追上来了,AMD 显卡的性价比也要高得多,RX 7900 XTX 跟其他两款显卡都是 24GB 显存,但只要 999 美元,RTX 4090、RTX 3090 Ti 分别是 1599、1999 元,价格高出 60-100%。
当然,RX 7900 XTX 现在的价格早就松动了,实际售价比 999 美元便宜不少,而 N 卡价格一直坚挺。
究其根底,A 卡在 AI 炼丹能力上的提升,尤其是 RX 7900 XTX 这样的游戏卡能有质变,还是 AMD 最近在 ROCm 软件生态上的改进,以前后者对游戏卡及 Win 平台的支持很差,4 月份开始不仅支持 Windows 系统,也加入了对 RX 7900 及工作站显卡的支持。
同时 AMD 还发布了 ROCm HIP SDK,允许开发者将针对 CUDA 平台开发的代码轻松迁移到 AMD 平台,这有是陈天奇等大神可以在 AMD 显卡上推动 AI 能力提升的基础。