Arm NeoverseベースのAWS Graviton4プロセッサーがクラウドのイノベーションを加速

December 19, 2024

 

著:Bhumik Patel, サーバーエコシステム開発担当ディレクター, Arm

AIが爆発的に成長する中、クラウドコンピューティングを取り巻く状況は、大規模な変革に直面しています。AIアプリケーションの高度化が進み、要求が厳しくなる中、強力かつ効率的でコスト効果に優れたコンピューティング・ソリューションへのニーズは、かつてなく高まっています。ワークロードをクラウドにデプロイする場合、このようなモダンなワークロードの要件に対応できるよう、必要なインフラストラクチャの見直しが求められます。性能向上やコスト削減から、規制や持続可能性の目標に向けたエネルギー効率に関する最新ベンチマークの達成まで、要件は多岐にわたります。

用途特化型のシリコンと演算リソースの提供に向けて、ArmとAWSは長期的なコラボレーションを構築しており、より効率的で持続可能かつ強力なクラウドの分野を切り開いています。「AWS re:Invent 2024」ではその証拠が数多く示されましたが、Graviton4は大規模な進化を実現しており、開発者と企業はクラウドの可能性を存分に引き出すことが可能です。

圧倒的なパフォーマンスのメリット

Arm Neoverse V2ベースの最新版AWS Graviton4プロセッサーは、前世代のGraviton3プロセッサーとの比較で演算性能は最大30%、コア数は50%、メモリ帯域幅は75%向上しています。こうした利点によって、AWS Gravitonプロセッサーは現在、エコシステムとユーザー企業から大規模に採用されています。

Arm Neoverse V2プラットフォームは、高性能浮動小数点やベクトル命令のサポートなど、Armv9アーキテクチャの新機能に対応しつつ、SVE/SVE2、Bfloat16、Int8 MatMulなどの機能も採用しており、AI/MLとHPCのワークロードで強力なパフォーマンスを発揮します。

AI/MLワークロード

AIワークロードのさらなる採用を促進するため、Armは今年、Arm Kleidiを発表しました。主要なAIフレームワークやソフトウェアエコシステムとの提携により、初期設定不要で推論パフォーマンスを最適化できるというArm環境のメリットは、MLスタック全体で享受できるようになり、開発者はArm固有の専門知識を追加取得することなくワークロードを構築できます。一例として、Pytorchの最適化により、AWS Graviton4ではLlama 3 70BやLlama 3.1 8BなどのLLMの実行が可能で、トークン/秒や最初のトークンまでの時間の指標で大幅な向上が見られます。

AWS Graviton4でLlama LLMを実行

AWS Graviton4でLlama LLMを実行


上記のパフォーマンス指標は、PyTorchによるLLM推論Graviton4でLLM3に関するブログで詳述しています。

HPC/EDAワークロード

HPCワークロードの場合、Graviton4はGraviton3Eとの比較で大幅な機能向上を達成しており、コアあたりのメインメモリ帯域幅は16%増、vCPUあたりのL2キャッシュは2倍になっています。これらは、メモリ帯域幅の制約の多いHPCのアプリケーション性能にとって重要な要素であり、下図の通り、AWSはこれらの分野でメリットを達成しています。

EDAワークロードの場合、Armのエンジニアリングチームが実行した本番実行の測定値に基づく、RTLシミュレーション・ワークロードでのGraviton4のパフォーマンスは、Graviton3比で最大37%向上しています。


AWS Graviton4によるHPC/EDAワークロードのメリット

AWS Graviton4によるHPC/EDAワークロードのメリット


エコシステムでの採用

エンドカスタマーはAWS Gravitonプロセッサー上でクラウドのワークロードを幅広くデプロイしており、この数年間は、ソフトウェアエコシステム全体での採用が継続的に拡大しています。ユーザー企業はコストを削減し、パフォーマンスを向上させて、二酸化炭素排出量と持続可能性のフットプリントを改善しています。その一部を下表に示します。


Arm NeoverseベースのAWS Graviton3を採用するエコシステムのメリット

Arm NeoverseベースのAWS Graviton3を採用するエコシステムのメリット


開発者向けリソース

ArmとAWS Gravitonのチームが提供する主要なリソースの一部を以下にご紹介します。

Armについて

Armは、業界最高の性能と電力効率に優れたコンピューティング・プラットフォームであり、コネクテッドな世界における人口の100%に貢献する比類のないスケールを備えています。Armは、演算に対する飽くなき需要に応えるため、世界をリードするテクノロジー企業に先進的なソリューションを提供し、各社がAIによるかつてない体験や能力を解き放つことができるよう支援しています。世界最大のコンピューティング・エコシステムと2,000万人のソフトウェア開発者とともに、私たちはArm上で築くAIの未来を形作っていきます。

全ての情報は現状のまま提供されており、内容について表明および保証を行うものではありません。本資料は、内容を改変せず、出典を明記した上で自由に共有いただけます。ArmはArm Limited(またはその子会社や関連会社)の登録商標です。その他のブランドあるいは製品名は全て、それぞれの権利者の所有物です。©1995-2024 Arm Limited.