StepFun、新モデル「Step 3」を発表──推理効率で業界最高、7月末に世界同時オープンソース公開

出典:https://mp.weixin.qq.com/s/81oz1RiRkkA9pJGE6KT8jg

StepFun Step 3 イメージ
概要ポイント
  • Step 3は最初からマルチモーダル対応として設計された大規模基盤モデル。
  • 中国製AIチップで最大300%の推理効率を実現。
  • MMMUなど主要ベンチマークでマルチモーダルSOTAを達成。
  • ファーウェイAscendやIluvatar CoreXなどと業界連携体制を構築。
  • 音声・映像エージェントの実装がスマホ・自動車で進行中。
本文

StepFun(階躍星辰)は、2025年世界人工知能大会の開幕に先立ち、新たな基盤モデル「Step 3」を上海で発表した。最初からマルチモーダル対応として設計されたStep 3は、性能と推論コストのバランスを追求し、視覚・数理・実生活タスクに広く対応できる大規模推論モデルとして位置づけられている。


Step 3はMoE構造を採用し、総パラメータ数は321B、アクティブパラメータは38B。反射のある画像からの文字認識、SNSチャット履歴とレシートを組み合わせた割り勘計算、構造化推論などの高度な実用例をこなせる設計となっており、MMMUやMathVisionなどのベンチマークでオープンソースSOTAを記録している。


コスト効率の面では、中国製AIチップ(例:ファーウェイAscend、Iluvatar CoreX(天数智芯))上での推論性能がDeepSeek-R1比で最大300%に到達。NVIDIA Hopper環境下でもスループット70%以上の向上を達成しており、幅広いハードウェア環境で高効率推論が可能である点が大きな特徴となっている。


StepFunは同時に、ファーウェイAscend、Enflame Technology(燧原科技)、Iluvatar CoreX(天数智芯)などと「モデルと半導体の共創エコシステム(モデル×チップ連携イノベーション連盟)」を立ち上げ、モデル・チップ・アプリケーション層の統合的最適化に取り組んでいる。Step 3は7月31日に世界同時オープンソース公開され、GitHubでの技術レポートも公開中である。


スマートデバイス分野では、国内大手スマートフォンメーカーとのAIエージェント共同開発や、吉利汽車との音声AI搭載スマートコクピットの量産導入に成功。さらに、金融、コンテンツ制作、小売分野の主要企業とも協業を進め、C向けアプリケーションへの応用が加速している。