DeepSeekのコスト利益率は理論上1日あたり545%であることが明らかに

中国のAI企業であるDeepSeekが、自社で開発するAIモデル「DeepSeek-V3」と「DeepSeek-R1」の収益について、コストに対する利益率が理論上1日あたり最大545%であると明らかにしました。ただし、あくまでも「理論上」とのことで、実際の利益はもっと低くなると予想されます。
???? Day 6 of #OpenSourceWeek: One More Thing – DeepSeek-V3/R1 Inference System Overview
— DeepSeek (@deepseek_ai) March 1, 2025
Optimized throughput and latency via:
???? Cross-node EP-powered batch scaling
???? Computation-communication overlap
⚖️ Load balancing
Statistics of DeepSeek's Online Service:
⚡ 73.7k/14.8k…
open-infra-index/202502OpenSourceWeek/day_6_one_more_thing_deepseekV3R1_inference_system_overview.md at main · deepseek-ai/open-infra-index · GitHub
https://github.com/deepseek-ai/open-infra-index/blob/main/202502OpenSourceWeek/day_6_one_more_thing_deepseekV3R1_inference_system_overview.md
China's DeepSeek claims theoretical cost-profit ratio of 545% per day | Reuters
https://www.reuters.com/technology/chinas-deepseek-claims-theoretical-cost-profit-ratio-545-per-day-2025-03-01/
DeepSeek-V3/R1の推論サービスは「トレーニング時と一貫した精度を保つ」という理由から、すべて対中国輸出規制に対応したNVIDIAのAI向けGPU「H800」で提供されているとのこと。技術的には、行列乗算および分配通信プロセスではトレーニング時と同じFP8形式を採用し、コアとなるMLA(Multiple Layer Attention)の計算と結合通信ではBF16形式を使用することで、サービスの最適Snapdragon XR2+ Gen 2プロセッサなパフォーマンスを確保しているそうです。
また、昼間の高負荷と夜間の低負荷に対応するため、ピーク時の日中はすべてのノードで推論サービスを展開し、低負荷の夜間には推論ノードを減らして研究やトレーニングにリソースを割り当てる仕組みを実装している、とDeepSeekは述べています。
2025年2月27日12時から2月28日12時までの24時間におけるV3とR1の推論サービスの最大ノード占有率は278に達し、平均は226.75ノードだったとのこと。時間ごとのH800のノード数を示したグラフが以下で、0時~8時はノード占有率が下がっています。各ノードには8台のH800 GPUが含まれ、H800 GPU1台あたりのリース費用を時間当たり2ドル(約300円)と仮定すると、1日の総コストは8万7072ドル(約1300万円)になります。

DeepSeekによれば、同じ24時間の統計期間内でV3とR1は合計6080億の入力トークンを処理し、そのうち56.3%に当たる3420億トークンがディスク上のKVキャッシュにヒットしたそうです。また、出力トークンは合計1680億で、平均出力速度は毎秒20~22トークン、出力トークンあたりの平均KVキャッシュ長は4989トークンでした。H800ノード1台あたりの平均スループットは、プリフィリング時が毎秒約7万3700トークン、デコーディング時が毎秒約1万4800トークンの出力でした。もちろんこれらのデータにはウェブ、アプリ、APIからのすべてのユーザーリクエストが含まれています。
DeepSeek-R1の利用料は、キャッシュヒットの入力トークンが100万あたり0.14ドル(約21円)、キャッシュミスの入力トークンは100万あたり0.55ドル(約83円)、出力トークンは100万あたり2.19ドル(約329円)です。もしすべてのトークンがDeepSeek-R1の価格で請求されれば、1日の総収益は56万2027ドル(約8460万円)となり、コスト利益率は545%になるとDeepSeekは報告しています。
以下は時間ごとにおけるコスト(オレンジ)と理論上の利益(青色)を示したグラフ。

ただし、DeepSeek-V3の価格がR1よりも大幅に低いこと、収益化されているのはサービスの一部のみでウェブとアプリは無料化されていること、そしてオフピーク時間帯には割引が適用されることから、実際の収益はこれよりも大幅に低くなるとDeepSeekは述べました。
ロイターは「DeepSeekのR1およびV3を搭載したチャットボットが世界中で人気急上昇したことを受けて、中国国外のAI企業は大きな打撃を受けており、今回のDeepSeekの発表はさらに追い打ちをかける可能性がある」と指摘しています。
・関連記事
DeepSeekのモデルは質問者の言語に忖度して回答を変えるとの指摘 - GIGAZINE
DeepSeekがさらに強化されたAIモデル「DeepSeek-R2」を2025年5月までに前倒しで発表か、さらにAPI利用料を最大75%割引きと発表 - GIGAZINE
DeepSeek-R1の開発企業が独自技術を次々にオープンソース化、AIの学習や推論を高速化可能 - GIGAZINE
DeepSeekのAndroidアプリはどのようなデータを収集して中国へ送信しているのか? - GIGAZINE
DeepSeek-R1の検閲回避版モデル「R1 1776」をPerplexityが公開、「天安門事件」「台湾独立」「ウイグル自治区」について詳しく回答可能 - GIGAZINE
・関連コンテンツ
in ソフトウェア, ネットサービス, Posted by log1i_yk
You can read the machine translated English article DeepSeek's theoretical cost-benefit ….