DeepSeek R2、パラメータ1.2兆・コスト97.3%削減との噂──米国株式市場に衝撃も?

出典:https://mp.weixin.qq.com/s/p8puOW8CChlNW9rTSlhu_Q

概要ポイント
  • DeepSeek R2はパラメータ規模が1.2兆、コストはGPT-4 Turbo比で97.3%削減と報道された。
  • 新アーキテクチャ「Hybrid MoE 3.0」により、動的に780億パラメータを活性化。
  • ViT-Transformerによる視覚理解性能や医療診断精度が人間専門家を超えたとされる。
  • モデルは8bit量子化で83%圧縮、精度損失は2%未満とされ、端末展開が容易に。
  • 真偽は未確認だが、米国半導体業界や株式市場に大きな影響を与える可能性が議論されている。
本文

DeepSeek R2に関する驚異的な情報がAI業界を賑わせている。流出情報によれば、同モデルはパラメータ規模が1.2兆に達し、さらにコストがGPT-4 Turbo比で97.3%も削減されたという。これは新たに採用された「Hybrid MoE 3.0」アーキテクチャによるもので、動的に780億パラメータを活性化し、高効率な推論を実現しているとされる。


また、DeepSeek R2の多モーダル性能も注目されている。ViT-Transformer混合構造により、COCOデータセットでの物体検出精度は92.4%mAPを記録し、CLIPを大きく上回った。さらに、太陽光パネルの欠陥検出や胸部X線診断においても人間専門家を凌ぐ精度を達成したとされる。加えて、モデルは8bit量子化によって83%の体積圧縮が可能となり、エッジ端末への展開も視野に入っている。


これらの情報は真偽未確認であるものの、SNS上では米国の半導体業界や株式市場に対する深刻な影響を懸念する声が相次いだ。特に、Nvidiaやその他米国企業の収益構造に大打撃を与える可能性や、AI領域における「冷戦」の新局面到来を指摘する意見も見られる。


もしこれらの情報が事実であれば、AI業界全体の勢力図が大きく塗り替わる可能性がある。DeepSeek R2の正式発表が注目される。