StepFunは新たにマルチモーダル推論モデル「Step 3」を発表し、オープンソースとして公開した。321BパラメータのMoE(Mixture of Experts)構造を採用し、従来の大規模モデルを上回る推論能力を実現している。
同モデルにはMFA(Multi-Factor Attention)、AFD(Adaptive Feature Distillation)、StepMeshといった独自技術が組み込まれ、推論効率と精度を同時に高めている。また、APIの提供により、研究者だけでなく企業もすぐに導入できる環境が整った。
StepFunはこれまでにも独自の推論技術で注目を集めており、今回の「Step 3」の公開は、開発者コミュニティにおける新たな標準モデルとなる可能性がある。特に画像・動画・テキストを統合的に処理するマルチモーダルAIの分野での応用が期待されている。
オープンソース化により、AI研究の加速だけでなく、商用アプリケーションの迅速な展開が可能になる見込みであり、中国発のAI技術が国際的な存在感をさらに高める一手となりそうだ。