AI

高性能オープンソースAIモデル「Mistral 3」登場、NVIDIAとも提携して最適化&多用途に対応したファミリーを展開


フランスのAI開発企業・Mistral AIが、次世代AIモデルファミリーの「Mistral 3」を発表しました。小型から超大型までを網羅するオープンソースモデルで、NVIDIAのGPUに最適化されているため、クラウドだけでなくローカル端末でも最先端AIを利用できます。

Introducing Mistral 3 | Mistral AI
https://mistral.ai/news/mistral-3


NVIDIA Partners With Mistral AI to Accelerate New Family of Open Models | NVIDIA Blog
https://blogs.nvidia.com/blog/mistral-frontier-open-models/?linkId=100000395318982

Mistral 3には、最先端の小型高密度モデル「14B」「8B」「3B」と、Mistral AI史上最も高性能なMistral Large 3が含まれています。Mistral Large 3は410億のアクティブパラメータ、6750億の合計パラメータ、25万6000の大規模コンテキストウィンドウを備えた専門家混合(MoE)モデル。MoEモデルはすべてのトークンに対してすべてのニューロンを活性化するのではなく、モデルの中で最も影響力のある部分のみを活性化するため、効率的に高精度を維持できる設計です。


Mistral Large 3はNVIDIAのH200 GPU 3000基を用いてゼロから学習された、最高クラスの許容型オープンウェイトモデルです。NVIDIAによると、NVIDIA GB200 NVL72システムとMistral AIのMoEアーキテクチャを組み合わせることで、高度な並列処理とハードウェア最適化のメリットを活用しながら、大規模なAIモデルを効率的に導入および拡張できるとのこと。また、Mistral Large 3は前世代のNVIDIA H200と比較して、GB200 NVL72において10倍のパフォーマンス向上を達成したことも報告されています。

指示調整後、Mistral Large 3は一般的なプロンプトにおいて、他の主要オープンウェイトモデルと同等の性能を示しました。さらに、画像理解能力と多言語会話(英語・中国語以外)において、クラス最高のパフォーマンスを示したと報告されています。

以下は、Mistral Large 3のベンチマーク結果を中国の高性能AIであるDeepseek 3.1およびKimi-K2と比較したグラフ。5種類のベンチマークで、いずれもMistral Large 3は他モデルと同等かそれ以上のパフォーマンスを記録したとのこと。


また以下は、ユーザーのプロンプトに従って適切な回答を返すよう調整された指示応答モデル(Instruct)において、一般的な質問(General Prompts)と多言語のプロンプト(Multilingual Prompts)で、Mistral Large 3、Deepseek 3.1、Kimi-K2を比較したもの。いずれの場合も、Mistral Large 3が他モデルを上回っています。


また、Mistral 3ファミリーは、エッジおよびローカルユースケース向けのシリーズも3サイズ展開しています。以下は横軸がモデルサイズ、縦軸がAIモデルの高度な推論力を測る指標である「GPQA Diamond Accuracy」のベンチマーク。Mistralの3モデルは、いずれも「単一のGPUで実行できる中では過去最高の大規模言語モデル」として登場した「Gemma 3」を上回っていることがアピールされています。


Mistral 3ファミリーはオープンソースモデルで、Hugging Faceでダウンロード可能です。

Mistral Large 3 - a mistralai Collection
https://huggingface.co/collections/mistralai/mistral-large-3

Ministral 3 - a mistralai Collection
https://huggingface.co/collections/mistralai/ministral-3

この記事のタイトルとURLをコピーする

・関連記事
コード生成・数学・推論の能力が大幅に向上した「Mistral Large 2」をMistral AIがリリース - GIGAZINE

Googleが単一のGPUで実行できる中では過去最高の大規模言語モデル「Gemma 3」を発表 - GIGAZINE

「DeepSeek-V3.2」が登場、GPT-5やGemini 3と同等性能でモデルを無料公開するオープンモデル - GIGAZINE

動画生成AI「Runway Gen-4.5」が登場、OpenAIのSora 2やGoogleのVeo 3より高性能 - GIGAZINE

Alibabaの視覚言語AIモデル「Qwen3-VL」は2時間ある映像に挿入されたフレームを99.5%の精度で特定可能 - GIGAZINE

高速かつ高品質な画像生成AI「Z-Image」をAlibabaが公開 - GIGAZINE

DeepSeekが数学的推論に特化したAIモデル「DeepSeek-Math-V2」をリリース、国際数学オリンピックで金メダルを取れるレベルの正答率を記録 - GIGAZINE

in AI, Posted by log1e_dh

You can read the machine translated English article Introducing the high-performance open-so….