AMD發(fā)布ROCm 6.3更新 帶來(lái)多項AI應用優(yōu)化及新功能
AMD現已正式發(fā)布了其ROCm軟件棧的新迭代版本ROCm 6.3,引入了先進(jìn)的工具和優(yōu)化功能,以提升AMD Instinct GPU加速器上的AI、ML和HPC工作負載。
AMD現已正式發(fā)布了其ROCm軟件棧的新迭代版本ROCm 6.3,帶來(lái)了多項新功能。AMD表示ROCm 6.3是開(kāi)源平臺的一個(gè)重要里程碑,它引入了先進(jìn)的工具和優(yōu)化功能,以提升AMD Instinct GPU加速器上的AI、ML和HPC工作負載。ROCm 6.3旨在通過(guò)提高開(kāi)發(fā)人員的工作效率,為從創(chuàng )新型人工智能初創(chuàng )企業(yè)到高性能計算驅動(dòng)型行業(yè)的廣大客戶(hù)賦能。
ROCm 6.3共有五大核心功能提升,包括:
ROCm 6.3中的SGLang - 生成式AI(GenAI)模型的超快速推理,專(zhuān)為優(yōu)化AMD Instinct GPU上的LLM和VLM等尖端生成模型的推理而構建。
更高水平的Transformer優(yōu)化 - 在A(yíng)MD Instinct上重新設計FlashAttention-2,實(shí)現了更快、更高效的訓練和推理。
AMD Fortran編譯器 - 將傳統代碼橋接到GPU加速,運行基于Fortran的傳統HPC應用程序的企業(yè)現在可以通過(guò)AMD Instinct加速器釋放現代GPU加速的強大功能。
rocFFT中的新多節點(diǎn)FFT - HPC工作流的游戲規則改變者,在rocFFT中引入了多節點(diǎn)FFT支持,可實(shí)現高性能分布式FFT計算。
增強的計算機視覺(jué)庫 - AV1、rocJPEG等, 使企業(yè)能夠處理從視頻分析到數據集增強的各種工作負載。
此外,AMD將ROCm 6.2中引入的Omnitrace和Omniperf更名為ROCm System Profiler和ROCm Compute Profiler。AMD稱(chēng),此次品牌重塑將有助于增強可用性、穩定性,并無(wú)縫集成到當前的ROCm分析生態(tài)系統中。
轉載原創(chuàng )文章請注明,轉載自東莞厚街佰勝機械設備廠(chǎng),原文地址:http://www.geniusextensions.com/post/482.html