ハードウェア

Amazonが3nmの新AIチップ「Trainium3」を発表、「Trainium2」より4倍高速&コスト最大50%削減&さらに「Trainium4」も予告


Amazon Web Services(AWS)が、最新世代のTrainiumチップである「Trainium3」をUltraServerサービスを通じて提供開始しました。Trainium3は同社初の3nmというプロセスノードで製造されたAIチップであり、前世代と比較してさまざまな性能が向上しています。

Top announcements of AWS re:Invent 2025 | AWS News Blog
https://aws.amazon.com/jp/blogs/aws/top-announcements-of-aws-reinvent-2025/

Trainium3 UltraServer delivers faster AI training at lower cost
https://www.aboutamazon.com/news/aws/trainium-3-ultraserver-faster-ai-training-lower-cost

AWS makes Trainium3 UltraServers generally available - DCD
https://www.datacenterdynamics.com/en/news/aws-makes-trainium3-ultraservers-generally-available/

Trainium3 UltraServerは次世代AIワークロード向けに特別に設計されたシステムで、最大144個のTrainium3チップを搭載可能です。前世代の「Trainium2 UltraServer」と比較して最大4.4倍のコンピューティング性能、4倍のエネルギー効率、3.9倍のメモリ帯域幅を提供します。これによりモデルのトレーニングを高速化し、数カ月かかっていた時間を数週間に短縮し、ユーザーからの推論リクエストに同時に対応することで、これまで実現不可能または高コストだったAIプロジェクトに取り組むことが可能になるとされています。

OpenAIのオープンウェイトモデル「GPT-OSS」を用いたテストでは、Trainium2 UltraServerと比較してチップあたりのスループットが3倍向上し、応答時間が4倍高速化されたそうです。


顧客は数千台のUltraServerを接続して、最大100万個のTrainium3に接続することもできます。これは前世代の約10倍です。AWSによれば、Anthropic、Karakuri、Metagenomics、Neto.ai、Ricoh、Splashmusicなどが既にTrainium3 UltraServerを使用しているとのことです。なお、ソーシャルサイトのHacker Newsには「AWSはコアサービスを除けばベータ版だらけで、大きな欠陥を抱えているサービスも数多くある」との批判のもあります。

また同日、AWSは顧客の既存のインフラストラクチャを高性能なAI環境に変革するというプロジェクト「AWS AI Factories」も発表しています。これは顧客のデータセンターに専用のAWS AIインフラストラクチャをデプロイし、顧客専用に運用することで、コンピューティング、ストレージ、データベース、AIサービスへの安全で低レイテンシーなアクセスを提供するもので、顧客は既存のデータセンタースペースと電力容量を活用してAWSのAIインフラストラクチャとサービスにアクセスできるようになります。このAWS AI Factoriesにも、Trainium3が導入されています。


AI Factories: AWS brings AI infrastructure directly to customer data centers
https://www.aboutamazon.com/news/aws/aws-data-centers-ai-factories

加えて、Amazonは既に次世代チップの「Trainium4」にも取り組んでいることを明らかにしました。Trainium4はTrainium3と比較して、FP4処理性能が少なくとも6倍、FP8処理性能が3倍、メモリ帯域幅が4倍になり、根本的なパフォーマンスの飛躍とトレーニング速度の向上が期待できるとのことです。


このほか、Amazonからは、推論、マルチモーダル処理、会話型AI、コード生成、エージェントタスク全体でコストパフォーマンスに優れたAIモデル「Nova 2」シリーズと、AIモデルのカスタマイズを容易にする「オープントレーニング」を実現するサービス「Nova Forge」が発表されています。

Meet new Amazon Nova AI models that help build highly reliable AI agents
https://www.aboutamazon.com/news/aws/aws-agentic-ai-amazon-bedrock-nova-models

Nova 2は「Nova 2 Lite」「Nova 2 Pro」「Nova 2 Sonic」「Nova 2 Omni」という4つのモデルに分かれており、それぞれ性能の高さと費用対効果の高さが売り。

AI評価プラットフォームの「Artificial Analysis」によると、Nova 2.0 Pro Previewのトークン使用量は同業モデルと比較して低く、Nova 2.0 LiteとOmniは他のほとんどの推論モデルよりも安価とのことです。


Nova Forgeは、事前トレーニング済み、中間トレーニング済み、および事後トレーニング済みのNovaモデルへのアクセスを個別に提供することで、顧客が早い段階からモデルを独自にトレーニングできるようにするサービスです。これにより、元のトレーニングデータにアクセスできないモデルのトレーニングを継続することで意図しない結果を招くリスクや、膨大な費用をかけてモデルをゼロから構築する障壁を回避できるとされています。


さらに、UIベースのワークフロー向けに信頼性の高いAIエージェントを構築および管理するための新しいAWSサービス「Nova Act」も提供開始され、顧客関係管理(CRM)システムのデータ更新、ウェブサイト機能のテスト、健康保険請求の送信といったUIベースのワークフローにおいて優れた性能を利用できるようになります。


新しいAIエージェントとしてAmazonから発表されたのが、「Kiro自律エージェント」「AWSセキュリティエージェント」「AWS DevOpsエージェント」です。

Amazon launches frontier AI agents that work autonomously like teammates
https://www.aboutamazon.com/news/aws/amazon-ai-frontier-agents-autonomous-kiro

Kiro自律エージェントはソフトウェア開発のエージェントで、タスクを切り替える際にコンテキストを再構築したり、リポジトリ間の変更を手動で調整したり、チケット、プルリクエスト、チャットスレッドに散在する情報をつなぎ合わせたりと、人間の作業をまとめる役割を果たします。GitHubから直接Kiroに質問したり、タスクを説明したり、バックログにタスクを割り当てたりすることが可能。

AWSセキュリティエージェントは安全なアプリを実現するエージェントで、開発全体を通してリスクを積極的に特定すると同時に、問題が発生したときには迅速に対応するという役割を担います。深いセキュリティ専門知識を組み込み、設計ドキュメントをプロアクティブにレビューし、プルリクエストを組織のセキュリティ要件と一般的な脆弱性に照らし合わせてスキャンすることができます。


AWS DevOpsエージェントは運用効率を高めるエージェントで、障害発生時に問題を切り分け、システムの動作を理解した上で、根本原因を正確に特定して平均解決時間を短縮するアプローチを行います。可観測性、インフラストラクチャの最適化、デプロイパイプラインの強化、アプリケーションの耐障害性という4つの主要領域を強化するための推奨事項を提供することで、復旧時間を縮めるとのこと。

さらに、AIエージェント開発のためのプラットフォーム「Amazon Bedrock AgentCore」が改革され、大規模かつ安全にエージェントを構築・デプロイする環境、エージェントが実際の環境でどのようにパフォーマンスを発揮するかを把握するための診断、明確な定義を設定してエージェントの行動範囲を限定することで正確なエージェントを構築するための環境が整備されました。


Amazon launches AI Agents that stay within boundaries, track their performance, and get smarter over time
https://www.aboutamazon.com/news/aws/aws-amazon-bedrock-agent-core-ai-agents

このほかにも、Amazon関連のさまざまなサービスから新機能が発表されています。

この記事のタイトルとURLをコピーする

・関連記事
AWSが新しい海底ケーブルシステム「Fastnet」を開発中であると発表、2028年に運用開始予定 - GIGAZINE

AWSの大規模障害でウェブの半分がダウンし数十兆円規模の経済的損失が出たとの指摘、優秀なエンジニアがAWSを離れている証拠であるという指摘も - GIGAZINE

Amazonがストレージデバイスを接続してAWSクラウドにデータをより速く安全にアップロードできる物理施設「AWS Data Transfer Terminal」を発表 - GIGAZINE

Amazonの新しい生成AIモデル「Olympus」は画像・動画・文章を処理でき、早ければ来週のAWS re:Inventで発表される可能性あり - GIGAZINE

AmazonがClaude開発元のAnthropicに40億ドルの追加投資、AWS独自AIチップを共同開発 - GIGAZINE

in ハードウェア,   ソフトウェア,   ネットサービス, Posted by log1p_kr

You can read the machine translated English article Amazon announces new 3nm AI chip 'Traini….