中国のAI企業HiDream(智象未来)が開発した画像生成モデル「HiDream-I1」が、OpenAIのGPT-4oに匹敵する性能を持つオープンソースモデルとして注目を集めている。17Bパラメータを持つこのモデルは、AI評価プラットフォーム「Artificial Analysis」の競技場において、わずか24時間で首位に立ち、初の中国発SOTAモデルとなった。
HiDream-I1は、リアルな質感と指令の忠実な再現において高い評価を受けており、Midjourneyを超えたとされたFLUX1.1さえも上回るケースが確認されている。生成された画像は、構図、光の反射、動きの描写などにおいて非常に精緻で、複雑なプロンプトにも的確に応じる能力を示している。
その技術的基盤には、新たに採用された「Sparse Diffusion Transformer(Sparse DiT)」があり、Sparse Mixture-of-Experts(MoE)技術を統合することでテキスト理解を強化すると同時に、計算コストも抑制。さらに、拡散モデルの蒸留にGANを融合させることで、生成画像のシャープネスやディテールを強化した。
複数のベンチマーク結果からも、HiDream-I1の優位性が証明されている。HPSv2.1ではアニメ、リアル、概念アートなど複数ジャンルで最上位スコアを記録。GenEvalやDPG-Benchでも複雑な属性や関係性を高精度に再現する能力を示し、指令遵守性でもトップクラスとなった。
こうした成果を踏まえ、HiDream(智象未来)は次なるモデル「HiDream-E1」の公開を予告している。同モデルは画像編集に対応しており、GPT-4o同様の対話的インターフェースで任意のスタイル・内容への編集を実現予定。両者を組み合わせることで、「オープンソース版GPT-4o」として、生成から編集までのフル機能を網羅する体制が整いつつある。
現在、HiDream-I1はHugging FaceとGitHubにて公開されており、グローバルな開発者コミュニティからの支持を獲得。Vivagoプラットフォームでは、画像生成から動画制作までの拡張利用も提供されている。今後、HiDream(智象未来)はマルチモーダルな対話型エージェントの公開も予定しており、中国発のオープンソースAIとして国際的な存在感を一層高めていくとみられる。