Moonshot AIが発表したKimi‑Dev‑72Bは、72Bパラメータ規模のオープンソースコード生成モデルとして、SWE‑bench Verifiedで60.4%というスコアを記録し、オープンソースにおける新たなSOTAを樹立した。モデルとコードはMITライセンスでGitHubおよびHuggingFace上に即日公開され、量子化版も利用可能である。
Kimi‑Devは「BugFixer」と「TestWriter」という二役を内包し、自律的にバグ修正とテスト生成を行う自己対話型学習アーキテクチャを採用している。Qwen 2.5‑72Bを基礎モデルとし、約1,500億トークンにおよぶ高品質なGitHub issueやPRデータで中期訓練されている。
強化学習ではDocker実行結果による報酬設計(成功で1、失敗で0)を軸に、無効なプロンプトを排除した高効率訓練と、成功例の再学習による強化を実施。最大40のコード修正案とテスト案を生成できる精度を獲得している。
Moonshot AIは今後、IDEやCI/CD環境との統合を進め、より複雑なソフトウェア開発タスクへの応用展開を予定している。