世界中の開発者のためのシームレスなAIアクセラレーション

AIの機会を最大限に活用するため、開発者は、それぞれの特定のワークロードに最適なパフォーマンスが必要であるほか、最速のAI導入方法にアクセスできる必要があります。Armは、Armプラットフォーム全体にわたるAIパフォーマンスを最大化し、すべての開発者、すべてのモデル、すべてのワークロードにシームレスなアクセラレーションを確約することに専念しています。

Arm KleidiでCPUパフォーマンスにおいてかつてないAIを実現

すべてのArmプラットフォームの中心にあるのがArm CPUです。そのユビキタス性は、ディープラーニングと生成AIを含む多くのAI推論ワークロードに柔軟性とエネルギー効率に優れたターゲットを提供します。ギリシャ語の「鍵」にヒントを得たArm Kleidiは、これらのワークロードがベースとなるArm Cortex-AまたはArm Neoverse CPUから最大限の性能を引き出せるよう確約することに重点を置いています。

Arm Kleidiの柱

主要なパートナーとのコラボレーションによりあらゆる場所でAIアクセラレーションを解放

Arm Kleidiは、主要なAIフレームワーク、クラウドサービスプロバイダー、ML ISVコミュニティとのコラボレーションを通じ、開発者による追加作業や専門知識を必要とすることなく、数十億のワークロードにフルMLスタック、即時の推論性能改善を提供することを使命としています。

PyTorch

ArmはPyTorchコミュニティと緊密に連携し、PyTorchで動作するモデルがArmで動作するよう確約することで、最も過酷なAIワークロードにもシームレスなアクセラレーションを実現します。

ExecuTorch

Armと軽量MLフレームワークであるExecuTorchを組み合わせることで、エッジでの効率的なオンデバイス推論機能が実現します。

Llama.cpp

LLM推論に関するArmベースCPUの能力を示すために、Armとそのパートナーは、llama.cppで実装されているint4カーネルとint8カーネルを最適化し、これらのより新しい命令を活用できるようにしています。

MediaPipe

MediaPipeとXNNPACKでのArmとGoogle AI Edgeのパートナーシップは、現在そして未来のArm CPUでAIワークロードを加速させています。これは、開発者がモバイル、ウェブ、エッジ、そしてIoTで卓越したAIパフォーマンスを実現することを可能にします。

Hunyuan

TencentのHunyuan AIフレームワークは、スマートフォンを含む幅広いデバイスでAI機能を実現する汎用モデル、Hunyuan LLMをサポートします。

CPUのパフォーマンスを加速させるための重要な開発者向けテクノロジー

Arm Kleidiは、AIモデルの能力、正確性、スピードを進化させる最新の開発者向けイネーブルメントテクノロジーを含んでいます。

CPUパフォーマンスを大規模に解き放つ

Kleidiは、Arm NeoverseおよびArm Cortex-A CPUのフルレンジにわたり最適化を容易にします。これらのテクノロジーは、Arm Scalable Vector Extensions（SVE）やArm Scalable Matrix Extensions（SME）など、AIパフォーマンスのアクセラレーションをターゲットとするArmアーキテクチャの高度な機能を活用しています。

CPU推論

世界中の開発者のためのシームレスなAIアクセラレーション

Arm KleidiでCPUパフォーマンスにおいてかつてないAIを実現

主要なパートナーとのコラボレーションによりあらゆる場所でAIアクセラレーションを解放

PyTorch

BERT-Large

Llama 3.1 8B

RoBERTa

FunASR Paraformer-Large

ExecuTorch

Llama 3.2 1B

Llama.cpp

Phi 3 3.8B

Llama 3 8B

MediaPipe

Gemma 1 2B

Hunyuan

Hunyuan

CPUのパフォーマンスを加速させるための重要な開発者向けテクノロジー

AIの導入を簡素化

CPUパフォーマンスを大規模に解き放つ

Arm KleidiをIoT領域に拡張

ArmとExecuTorchでエッジAIを民主化

Metaの新しいLlama 3.2 LLMでAI推論を拡張

PyTorchとExecuTorchの統合がパフォーマンス向上を実現

KleidiAIがGoogleのMediaPipeにパフォーマンス向上をもたらす

CPUでのAI推論を理解するためのガイド

購読してArmからAIの最新ニュースを取得

Armアカウント

アカウント登録する

世界中の開発者のためのシームレスなAIアクセラレーション

Arm KleidiでCPUパフォーマンスにおいてかつてないAIを実現

主要なパートナーとのコラボレーションによりあらゆる場所でAIアクセラレーションを解放

PyTorch

BERT-Large

Llama 3.1 8B

RoBERTa

FunASR Paraformer-Large

ExecuTorch

Llama 3.2 1B

Llama.cpp

Phi 3 3.8B

Llama 3 8B

MediaPipe

Gemma 1 2B

Hunyuan

Hunyuan

CPUのパフォーマンスを加速させるための重要な開発者向けテクノロジー

AIの導入を簡素化

CPUパフォーマンスを大規模に解き放つ

Arm KleidiをIoT領域に拡張

ArmとExecuTorchでエッジAIを民主化

Metaの新しいLlama 3.2 LLMでAI推論を拡張

PyTorchとExecuTorchの統合がパフォーマンス向上を実現

KleidiAIがGoogleのMediaPipeにパフォーマンス向上をもたらす

CPUでのAI推論を理解するためのガイド

購読してArmからAIの最新ニュースを取得