Armv9ベースの新しいCPUがモバイルを超えてAIを高速化

June 06, 2024

 

著:Saurabh PradhanArmクライアント事業部門 CPU製品管理担当ディレクター

※本資料は、英Armが英国時間2024年5月29日に公開したブログ記事の抄訳です。

現在、モバイルのAIワークロードの大半はArm CPUで実行可能です。スマートフォンの分野では、Armのv9 CPUテクノロジーを使用したAI対応の最新スマートフォンがその中心となっています。たとえばMediaTek Dimensity 9300を搭載したvivo X100、X100 Proスマートフォン、Samsung Galaxy S24、Google Pixel 8は、AIイノベーションにかつてない機会を提供しています。

AIワークロードが複雑化し、多くの処理を必要とする中、Armは最新のArmv9.2 CPUクラスターで高性能、高効率、多機能を追求することで次世代AIの基盤を整備しています。これは、あらゆる場所でAIを実現するというArmの目標の一環であり、フラグシップスマートフォンやAI対応PCから、メインストリームのモバイル、XR、ウェアラブル機器まで、幅広いコンシューマー機器にメリットをもたらします。

新しいArmv9 CPUのラインナップには、高性能を追求するArm Cortex-X925 CPU、卓越した持続性能を誇るArm Cortex-A725 CPUが加わりました。また、低負荷ワークロード向けに優れた電力効率を実現するArm Cortex-A520、さまざまなArmv9.2 CPUクラスターで消費電力と実装面積を削減するDynamIQ Shared Unit(DSU-120)も刷新しました。これらはすべてArm最速のAndroid向け演算プラットフォーム「Arm Compute Subsystems (CSS) for Client」に統合されています。

Armv9 CPUポートフォリオへの新たな追加とアップデート

Armv9 CPUポートフォリオへの新たな追加とアップデート

 

Cortex-X925Cortex-X史上最高の性能向上

Cortex-X925(旧コードネーム:Blackhawk)は、前年比でCortex-X史上最大の性能向上を実現しました。シングルスレッド(ピーク)性能は36%(Geekbench 6.2と2023年のプレミアムAndroidスマートフォンを比較)、AI性能は46%(Phi-3のTTFTとArm Cortex-X4 CPUを比較)向上しています。

Cortex-X925のパフォーマンス向上

Cortex-X925のパフォーマンス向上

 

電力パフォーマンスを見ると、Cortex-X925は必要なところでピーク性能を発揮します。各種アプリケーション、生成AIワークロード、ウェブサイトの閲覧、カメラの後処理、動画録画、AAAゲームなどの応答性が向上し、より快適に使用できます。

この性能向上は、Cortex-X925の優れた性能基盤と、その先駆的なマイクロアーキテクチャによって実現されています。Cortex-X925の最適化された3nm実装、そしてプレミアムサブシステムとパッケージにより、次世代のコンシューマー機器の性能スコアは30%以上向上します。マイクロアーキテクチャの改良(最大3MBのプライベートL2キャッシュを含む)は、幅広いコンシューマー機器でCPUクラスター構成の自由度を高めることになります。

CSS for Clientの一環として、ArmはCPUの物理実装の共同設計と提供を行っています。主要ファウンドリーパートナーとの協力により、3nmですぐにテープアウト可能なCortex-X925物理実装を実現しました。これによりパートナー各社は3nmプロセスでPPA(消費電力、性能、面積)のメリットを最大限に活用するとともに、量産対応のシリコンソリューションによりシリコン開発と導入にかかる時間を短縮可能です。

Cortex-A725:卓越した持続性能

ArmのCortex-A700シリーズのCPUは、さまざまな性能効率の製品を取り揃えています。Cortex-A725も同様で、CPUワークロードの主力製品となっています。Armのエンジニアリングおよび設計チームは、卓越した持続性能が求められるAIやゲームの主要なユースケースに焦点当て改良を重ねました。これによりCortex-A720と比べてパフォーマンスは35%、電力効率は25%向上しました。

Cortex-A725のパフォーマンスと電力効率の改善

Cortex-A725のパフォーマンスと電力効率の改善

 

こうした性能向上は、Cortex-A725のマイクロアーキテクチャの改善により実現されます。Cortex-X925と同様、Armは高度な物理実装を通じてCortex-A725の3nmでの最適化実装を提供します。また、メインストリームのコンシューマー機器向けに面積を最適化した実装も提供しています。

Cortex-A520DSU-120の刷新

CSS for Client向けに更新されたCortex-A520は、TCS23のCortex-A520を15%も上回る最高の電力効率を提供します。刷新されたCortex-A520は、最新の実装と高度な3nmの物理実装により実現されています。

刷新されたCortex-A520

刷新されたCortex-A520

 

新しいCSS for Clientの一環として、次世代用途やコンシューマー機器向けにDSU-120も強化されました。性能と効率を高める新しい機能性、メインストリームのコンシューマー機器を想定した低消費電力モードと機能強化が含まれるほか、高性能ユースケース向けに最大14コアまでの拡張オプションが維持されています。これにより標準的なワークロードで消費電力が50%削減され、CPUクラスター全体でキャッシュミスの消費電力も60%削減されるため、コンシューマー機器のリーク電力が減り、バッテリー寿命が伸びます。ハーフスライスパワーダウン、クイックナップなどの新しい省電力モードや機能強化は、生体認証、文字起こしから、AIスマートカメラ、コンテンツ生成、MLベースのAAAゲームまで、幅広いAIワークロードに対応します。

DSU-120のアップデートと改良

DSU-120のアップデートと改良

 

かつてない性能、効率性、汎用性に優れたCPUクラスター

新しいCPUや刷新されたCPUは、幅広いコンシューマー機器にわたるArmのCPUクラスターの構成に、これまでにないレベルの性能、効率性、汎用性を提供します。高性能の面では、新しいCPUクラスターは先行世代のCortex-X4を使用したCPUクラスターと比べ、AI性能が46%高く、応答性の高いパフォーマンスと持続的なスループットに貢献します。ユーザーエクスペリエンスの主な指標(パフォーマンスと消費電力の組み合わせ)はTCS23 CPUクラスターと比べて30%向上し、アプリケーションの動作やウェブ表示の高速化、AAAゲームの快適性、バッテリー寿命の延長につながります。

最新のArm CPUクラスターは、あらゆるコンシューマー機器分野で優れた拡張性を発揮します。たとえばデスクトップやノートPCでは、現在出荷されている製品より性能が25%向上し、クラス最高の性能を実現します。一方、TCS23における先行世代のDSU-120より消費電力と実装面積を削減し、Cortex-A725とCortex-A520による実装面積と消費電力の最適化とともに、メインストリームのデバイスに適した柔軟なCPUクラスター構成が可能となります。これにより、さまざまな低価格帯のコンシューマー機器でパフォーマンス追求やAI搭載が可能となり、日常的なデバイスにおいても高度なAI機能を利用できるようになります。

CPU blog image

Armv9 CPUで次世代のAIエクスペリエンス

新しいArmv9.2 CPUクラスターは、Androidスマートフォン、デスクトップやノートPC、その他の機器に優れた性能とユーザーエクスペリエンスをもたらします。クラスターの各CPUコンポーネントが幅広い実世界の用途とワークロードを網羅しているため、一連の改善がまとめて得られます。たとえばCortex-X925は、アプリケーションの起動やウェブ閲覧の大容量のデータ移動を伴うワークロードに対応します。また、Cortex-A725は一般的なAIワークロードとAAAゲームに必要な持続性能を提供します。Cortex-A520の高いパフォーマンスは軽めのメディアやアイドルタスク、バックグラウンドタスクに適しています。このような現実的なエクスペリエンスの向上はすべてのコンシューマー機器分野でスケーラブルです。新しいArmv9 CPUはメインストリームデバイスや日常的なユーザーに性能向上と高度なAI機能を提供し、ユーザーエクスペリエンス指標全体で30%の改善をもたらします。

テクノロジーに対する消費者の需要はとどまるところを知りません。ユーザーがデバイスを使用する時間はますます長くなり、より高度なエクスペリエンスを期待します。新しいArmv9 CPUは、コンシューマーテクノロジーの未来を定義する高度な演算性能を通じて、ウェブ閲覧やアプリケーションの高速化、AAAゲーム、生成AIワークロードなど、あらゆるエクスペリエンスを向上させます。

Armについて

Armのテクノロジーは、未来のコンピューティングを築く存在です。そのエネルギー効率に優れたプロセッサ設計とソフトウェアプラットフォームは、2,800億個以上のチップを通じて高度なコンピューティングを実現し、センサーからスマートフォン、スーパーコンピュータまで、あらゆる製品をセキュアにサポートしています。1,000社以上のパートナーとともに、チップからクラウドまで、あらゆる場所でAIを活用できるようにし、またサイバーセキュリティの分野では、デジタル世界における信頼の基盤を提供しています。Armは、これからの未来を築く根幹を支えていきます。

全ての情報は現状のまま提供されており、内容について表明および保証を行うものではありません。本資料は、内容を改変せず、出典を明記した上で自由に共有いただけます。ArmはArm Limited(またはその子会社や関連会社)の登録商標です。その他のブランドあるいは製品名は全て、それぞれの権利者の所有物です。©1995-2024 Arm Limited.