適用於機器學習的軟體函式庫
Arm 運算函式庫 (ACL) 是 Arm Kleidi 的關鍵元件,集結最新的開發人員支援技術及關鍵的開發人員資源,可加速人工智慧開發,並強化 Arm 架構平台的效能。ACL 提供一組完整的低階機器學習函數,針對 Arm Cortex-A CPU、Arm Neoverse 及 Arm Mali 繪圖處理器架構最佳化,可促進卓越的機器學習效能。函式庫為開源軟體,透過核可的 MIT 授權提供。
Arm 運算函式庫可為其他開放原始碼替代方案提供卓越效能,並可立即支援新型 Arm 技術和架構功能,包括 SVE2 及 SME2。
主要特色:
- 提供適合 CPU 和繪圖處理器使用的 100 多種機器學習函數
- 多種卷積演算法 (GEMM、Winograd、FFT 及 Direct)
- 支援多種資料類型:FP32、FP16、int8、uint8、BFloat16
- 針對關鍵機器學習圖元進行微架構最佳化
- 可高度設定的建構選項實現輕量二進位檔
- 進階最佳化技術,例如核心融合 (Kernel Fusion)、速算 (Fast Math) 支援及紋理使用率
- 使用 Open CL 調整器及 GEMM 最佳化啟發式演算法進行裝置及工作負載專屬調整
特色與效益
效能與效率
Arm 運算函式庫部署於 10 億台以上裝置及 PyTorch 人工智慧框架 (透過 OneDNN),獲得全球 Arm 開發人員的信賴,可提供預設的加速效果並縮短上市時程。
不受作業系統影響
函式庫真正不受作業系統影響,並可移植至 Android、Linux 及「裸機」系統。Arm 運算函式庫目前用於智慧型手機、數位電視、智慧相機、汽車應用等。
針對 Arm 架構處理器最佳化
Arm 運算函式庫包含一系列完整的軟體函數,特別針對 Arm Cortex-A CPU 及 Arm Mali 繪圖處理器最佳化。
Arm 運算函式庫資源
提供您需要瞭解的一切資訊,協助您為專案制訂正確決策,其中包括技術文件、產業洞見,並協助您尋求專家建議。
部落格:
- Kleidi 技術為基於 Arm Neoverse N2 架構的 ASR 提供最佳性價比
- 在 Arm Neoverse 上使用 Kleidi 加速 PyTorch 推論
- 以 torch.compile 在 AWS Graviton 處理器加速 PyTorch 推論
實用文件:
軟體與工具: