全新的 Arm GPU 加速釋放消費性裝置市場中的遊戲和 AI 創新潛能

 

June 28, 2024

 

作者:Arm 終端產品事業部 GPU 產品管理資深總監 Anand Patel

 

新的 Arm Immortalis-G925 GPU、Arm Mali-G725 GPU 和 Arm Mali-G625 GPU,它們適用於從旗艦智慧手機、高端手機,到智慧手錶、入門級行動裝置等各類消費性裝置。

 

全新的 Arm GPU

 

作為人們日常數位生活中不可或缺的一部分,Arm GPU 實現了從當今智慧手機上的沉浸式遊戲,到各類邊緣人工智慧(AI)體驗的各個方面。目前,Arm 合作夥伴的 GPU 出貨量已超過 100 億顆,而這一卓越成就歸功於我們業界領先的生態系。這些 GPU 廣泛應用於包括智慧手機、平板電腦、智慧電視、機上盒、智慧手錶和 XR 可穿戴裝置在內的各類消費性裝置。

 

去年此時,我們推出了新的第五代 GPU 架構及一系列新的 GPU,包括 Arm Immortalis-G720 GPUMediaTek 的天璣 9300 系統單晶片(SoC)平台便採用此 GPU。之後,知名手機廠商 vivo 和 OPPO 的旗艦智慧手機都先後採用了該晶片。

 

今年,我們很高興推出第二代基於 Arm 第五代 GPU 架構建構的 GPU 產品,成為 Arm 終端產品運算子系統(CSS)的重要組件。其中包括新的 Arm Immortalis-G925 GPUArm Mali-G725 GPUArm Mali-G625 GPU,它們適用於從旗艦智慧手機、高端手機,到智慧手錶、入門級行動裝置等各類消費性裝置,這些 GPU 產品的兩大設計重心:

 

  • 做為手機遊戲持續演進的一部分,持續實現沉浸式視覺體驗
  • 在主流應用中加速實現 AI 體驗

 

出色的遊戲效能

 

去年推出的 Immortalis-G720 在多數的圖形基準測試中都以其峰值效能(每秒幀數,fps)和更長遊戲時間的持續效能擊敗對手。透過推出 Arm 目前效能最強、效率最高的 GPU - Immortalis-G925,我們持續推動這一出色表現。在 Arm 參考平台上進行比較時,Immortalis-G925 的效能(fps) 比 Immortalis-G720 提高了 37%。此外,在提供與 Immortalis-G720 相當的遊戲效能時,Immortalis-G925 的功耗降低了 30%。

 

Immortalis-G720 對比其他 SoC 在領先的圖形基準測試中的表現情況

圖:Immortalis-G720 對比其他 SoC 在領先的圖形基準測試中的表現情況

 

此一出色效能延伸到了關鍵的手機遊戲領域,與 Immortalis-G720 相比,Immortalis-G925 的效能平均提升了 46%。單看各款遊戲,《原神》的效能提升 49%,而《Roblox》的運行速度加快 46%。其他熱門手機遊戲的效能提升幅度均在 29% 至 72% 之間,包括《使命召喚手遊》、《暗黑破壞神:不朽》、《明日之後》、《堡壘之夜》和《絕地求生手遊》。

 

這些令人驚喜的對遊戲的改進,對於開發人員和終端的遊戲玩家來說可說意義非凡。

 

Immortalis-G925 整體效能提升

圖:Immortalis-G925 整體效能提升

 

不斷追求更逼真的遊戲體驗

 

手遊內容演變的趨勢是 Arm 持續關注的重點,以確保我們的 GPU 產品能滿足開發人員和生態系合作夥伴的需求。Immortalis-G925 也不例外,該 GPU 專為最新的遊戲技術、功能和趨勢而設計。而正是整個生態系的協同合作,造就了更優異的遊戲體驗。

 

近年來,場景幾何在手遊領域持續發展,它可增加遊戲物件的清晰度,有助於設計更逼真的地形,並為遊戲角色賦予更高的真實感。事實上,隨著開發人員努力設計更多的場景細節和更高的真實感,熱門遊戲《堡壘之夜》和《原神》的幾何複雜度同比增加了 9% 至 11%。

 

複雜的片段著色技術透過為物件和角色賦予紋理感,製作出更逼真的遊戲體驗。該技術可實現高品質遊戲效果,如光暈、模糊和基於物理的著色。在《堡壘之夜》和《原神》中,片段著色器在 GPU 上花費的時間激增,同比增加 27% 到 43%。

 

為滿足針對更複雜幾何體的需求,Immortalis-G925 導入了片段預處理(Fragment Prepass) 的新機制。借助該圖形技術,應用無需進行任何物件或原語排序,並且在處理幾何工作負載時,能以更高效率減少過度繪製。透過片段預處理,我們觀察到由於無需物件排序,渲染執行緒週期縮短高達 43%。這不僅提高了效能和效率,也減少了 CPU 的負載。

 

自從在 Immortalis-G715 GPU 中導入光線追蹤以來,該技術正逐漸普遍,它有助於創造更真實的陰影、反射和高級光照效果。Immortalis-G925 持續推動光線追蹤內容的改進,對複雜物件的光線追蹤效能提高了 52%。通過對光線追蹤內容進行內部測試,我們正進一步提高其效能。例如,在遊戲場景透明度方面保持相同準確度的同時,效能提升 27%。開發人員也可選擇將遊戲場景透明度的準確性略微降低,由此帶來高達 52% 的驚人效能提升,並降低 57% 的記憶體流量。

 

Immortalis-G925 光線追蹤提升

圖:Immortalis-G925 光線追蹤提升

 

增加著色器核心,以支援更多的消費性裝置市場

 

為應對筆記型電腦、Chromebook 和遊戲手機等各類消費性裝置市場日益成長的效能需求,Immortalis-G925 所支持的著色器核心數量增加了 50%,達到 24 個核心的最大配置,而上一代最多只有 16 個。

 

為擴展到該效能點,圖塊輸送量和命令流前端(Command Stream Front-end, CSF) 均經過更改和優化。我們已經能夠將圖塊輸送量成長一倍,並對 CSF 進行了多項改進,包括對關鍵命令的硬體支援和增加硬體介面數量,以加快將作業分配給著色器核心的速度。

 

在新推出的 GPU 中,著色器核心的數量均已擴展。Immortalis-G925 可配置 10 個以上的核心,適用於旗艦智慧手機等高效能消費技術市場。Mali-G725 可在六至九個核心之間擴展,主要針對高階手機市場。此外,它還能提供與 Immortalis-G925 相同的 API 支援,同時為 Immortalis-G925 目標範疇以外的主流級別裝置提供導人入勝的沉浸式遊戲體驗。Mali-G625 可在一至五個核心之間擴展,適用於智慧手錶和入門級行動裝置。

 

Immortalis-G925、Mali-G725 和 Mali-G625的核心數

圖: Immortalis-G925、Mali-G725 和 Mali-G625的核心數

 

AI 效能提升

 

與前幾代產品一樣,我們不斷提升 AI 工作負載在 GPU 上的效能和效率。作為 Arm 終端產品運算子系統的重要元素,Immortalis-G925 在 AI 和機器學習(ML) 網路中的推理速度,比 Arm 2023 全面運算解決方案(TCS23) 中的 Immortalis-G720 提高了 34%。雖然大多數 AI 處理工作能夠在 CPU 上進行,但 GPU 為各種 AI 場景提供加速功能,包括圖像分類、圖像分割、物件檢測、自然語言處理和語音轉文本等。

 

與 TCS23 中的 Immortalis-G720 相比,Immortalis-G925 做為 Arm 終端產品運算子系統的一部分,在關鍵場景中提供了一系列 AI 效能改進。在影像處理方面(包括分割和分類),Immortalis-G925 可實現 41% 的效能提升,表現搶眼。同時,在超級採樣任務中,開發人員可以使用類神經網路對圖像進行向上擴展,其效能可提高近 30%,而在自然語言處理和語音轉文本,效能可提高 50%,同樣十分驚豔。

 

Immoratlis-G925 AI 效能提升

圖: Immoratlis-G925 AI 效能提升

 

此外,Arm 正攜手生態系合作夥伴,以提高 AI 效能。透過與 Unity 合作,我們幫助將對 int8 的支援導入運用在基於 Unity 應用的 ML 框架 Sentis。採用 int8 後,其效能提升 44%,同時記憶體佔用空間減少,進而改善了基於 ML 的行動遊戲體驗。

 

最後,做為 Arm 終端產品運算子系統的一部分,我們協同設計並交付 GPU 實體實作。我們攜手領先的晶圓製造合作夥伴,實現了生產就緒的 Immortalis-G925 三奈米工藝的實體實作,協助我們的合作夥伴能夠在三奈米工藝上充分發揮功耗、效能和面積(PPA) 優勢,同時通過生產就緒的晶片解決方案來縮短晶片的開發與部署時間。

 

生態系協作推動圖形技術進步

 

除了推出 GPU 新品,Arm 還致力於與遊戲生態系合作,進而帶來先進的圖形特性和功能。

 

我們正在與 Epic Games 攜手,在安卓上啟用其虛擬引擎 5(Unreal Engine 5) 桌面平台渲染器。對於開發人員來說,這將確保 Immortalis 和 Mali GPU 也能在行動裝置上提供桌面級品質的渲染和圖形效果。做為虛擬引擎 5 桌面平台渲染器相關工作的一部分,用於光線追蹤的 Lumen 光照解決方案已針對 Arm GPU 進行了優化,尤其是支援基於硬體光線追蹤的 GPU。使用 Lumen 的開發人員可以利用我們的最佳實作建議來管理場景複雜性、更新頻率和探測器設置,達到遊戲主機品質的光照效果。

 

我們還與 Google 和 MediaTek 以安卓動態效能框架(Android Dynamic Performance Framework, ADPF) 展開合作。借助這一來自 Google 的強大 API,開發人員能夠根據行動裝置的即時熱狀態資訊來優化其應用的使用者體驗和效能。在與手機遊戲同等級要求應用中,這可以降低功耗、避免過熱並延長遊戲時間。透過在 Arm 技術驅動的 Google Pixel 8 智慧手機上啟用 ADPF,我們在 2024 世界行動通訊大會(MWC 2024)上展示了 Steel Arms 手機遊戲展示,呈現了25% 的每幀能耗減低,以及 35% 的畫面播放速率提升。

 

同時,Arm 還透過一系列 GPU 工具和資源,保持對遊戲開發人員一貫的生態系支援。Arm Performance Studio 延續 Arm Mobile Studio 的成功,借助擴展分析工具,進一步支援行動裝置和 GPU 以外的一系列新工作負載、平台和裝置,包括運用於伺服器市場的 CPU 和 Arm Linux 平台。做為 Arm Performance Studio 的一部分,我們新增了 Arm Frame Advisor,使開發人員更容易地實現圖形分析和優化,進而更準確地針對其目標進行優化,並更快地將軟體推向市場。

 

為新一代 AI 和遊戲體驗而打造

 

隨著手遊和 AI 工作負載的不斷演進,新一代 Arm GPU 可提供出色的效能和效率優勢,帶來無可匹敵的使用者體驗。之前的 Arm GPU 已應用於主要的消費性裝置中,並展現出優異的峰值和持續遊戲效能,而新一代 GPU 將延續先前產品的強勁動能。

 

為新一代 AI 和遊戲體驗而打造

 

透過 Immortalis-G925、Mali-G725 和 Mali-G625,我們的目標是能橫跨從旗艦到入門等不同級別的、廣泛的消費性裝置,我們看到越來越多的消費者與合作夥伴要求更加沉浸式的手遊和 AI 體驗。我們新的 GPU 能夠滿足這些需求,提供無與倫比的遊戲和 AI 效能。這代表全球數百萬開發人員和數十億使用者,與基於 Arm 架構的裝置進行互動,將獲得更快、更沉浸式、更智慧的視覺體驗。

 

原文來源:Unleashing Gaming and AI Innovation Across Consumer Device Markets with New Arm GPUs