本站4月18日消息,NVIDIA AI之強大,不僅僅在于硬件性能好,更離不開生態優化適配,可以發揮最佳效率,AMD相比之下就差了很多,但也在努力追趕。
現在,Stability AI發布了ONNX框架優化的Stable Diffusion模型,在兼容的AMD Radeon顯卡、銳龍集顯上最多可以提速達3.8倍。
AMD表示,過去一年來,一直在與OSV、OEM、ISV廠商合作,優化AMD硬件上的AI應用,包括硬件設計、驅動程序、編譯器、機器學習模型等等。
根據官方公布的數據,經過優化之后,SDXL 1.0、SDXL Turbo在AMD硬件上的推理性能,對比基礎的PyTroch模型最高提升3.8倍,SD3.5則可提升最多2.6倍。
實際圖片、視頻生成應用中,SDXL 1.0、SDXL Turbo、SD3.5 Large、SD3.5 Large Turbo在RX 9070 XT顯卡上的效率分別提升了3.1倍、1.5倍、3.3倍、2.1倍。
SDXL 1.0、SD3.5 Large、SD3.5 Large Turbo在銳龍AI MAX 395上的效率,則分別提升了1.4倍、3.3倍、3.0倍。
AMD硬件優化版的Stable Diffusion模型有一個特殊的“_amdgpu”后綴標記(比如stable-diffusion-3.5-large_amdgpu),現在已經可以在Stability AI或者Hugging Face上下載了。
你也可以使用AMD、TensorStack AI聯合打造的最新版Amuse 3.0。
注意,AMD GPU驅動版本不要低于24.30.31.05預覽版,或者等待即將發布的25.4.1正式版。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。