DeepSeek R2に関する驚異的な情報がAI業界を賑わせている。流出情報によれば、同モデルはパラメータ規模が1.2兆に達し、さらにコストがGPT-4 Turbo比で97.3%も削減されたという。これは新たに採用された「Hybrid MoE 3.0」アーキテクチャによるもので、動的に780億パラメータを活性化し、高効率な推論を実現しているとされる。
また、DeepSeek R2の多モーダル性能も注目されている。ViT-Transformer混合構造により、COCOデータセットでの物体検出精度は92.4%mAPを記録し、CLIPを大きく上回った。さらに、太陽光パネルの欠陥検出や胸部X線診断においても人間専門家を凌ぐ精度を達成したとされる。加えて、モデルは8bit量子化によって83%の体積圧縮が可能となり、エッジ端末への展開も視野に入っている。
これらの情報は真偽未確認であるものの、SNS上では米国の半導体業界や株式市場に対する深刻な影響を懸念する声が相次いだ。特に、Nvidiaやその他米国企業の収益構造に大打撃を与える可能性や、AI領域における「冷戦」の新局面到来を指摘する意見も見られる。
もしこれらの情報が事実であれば、AI業界全体の勢力図が大きく塗り替わる可能性がある。DeepSeek R2の正式発表が注目される。