アリババは、最新世代の混合推論モデル「Qwen3」を正式にオープンソース化した。革新的なMOE(混合専門家)アーキテクチャを採用し、小型ながら前世代超大型Denseモデルを上回る性能を実現。推論タスクやツール呼び出しにおいて処理効率を大幅に向上させた。
Qwen3は推論と非推論を融合した設計で、数学推論、コード生成、総合論理分析など幅広いタスクに対応。特に、Qwen3-235B-A22Bモデルは知能水準で開源モデルの新記録を打ち立てた。事前学習には36万億tokensを使用し、推論、ツール使用、指令遵守、多言語(119言語)対応などで性能が飛躍的に向上している。
また、Qwen3は「思考モード」と「非思考モード」の切り替え機能を備え、タスクの複雑度に応じた柔軟な応答が可能。思考モードでは深い論理推論を行い、非思考モードでは応答速度を最優先する設計となっている。モードは指示や設定変更により動的に切り替え可能であり、実用性が高い。
提供プラットフォームも充実しており、Hugging Faceでは「Qwen3-235B-A22B」モデルが公開され、ModelScopeからもダウンロード可能。さらに、アリババのチャット型サービス「Qwen Chat」でも体験できるほか、阿里雲(Alibaba Cloud)の「百錬」プラットフォームでも、100万tokens分の無料体験が近日提供予定となっている。
アリババはこれらの展開を通じて、Qwen3の性能と応用力をグローバルに広める構えを見せている。