Doubao(豆包)1.6版を発表、動画生成「Seedance 1.0 pro」および音声ポッドキャストモデルも同時公開

出典:https://mp.weixin.qq.com/s/TZeogITwPorPmToXU4f9iQ

概要ポイント
  • Doubao(豆包)大模型1.6が推理・数学分野で世界トップ水準に到達。
  • 「Seedance 1.0 pro」は高品質な動画を生成、国際評価で1位を獲得。
  • 音声ポッドキャストモデルは自然な対話を再現、秒単位で生成可能。
  • API提供を含め、火山引擎やDoubao(豆包)Appなどで利用可能に。
本文

バイトダンスは「火山引擎Force原動力大会」にて、同社の大規模モデルDoubao(豆包)の最新版1.6版を発表。推理や数学、指令理解、エージェント構築などの分野で大幅に性能が強化され、複数の国際ベンチマークで世界トップクラスのスコアを記録した。


Doubao(豆包)1.6は、256kの長文脈処理や多モーダル理解、グラフィカルなUI操作などに対応しており、複雑なAIエージェント開発に向けた基盤として提供される。APIはすでに火山引擎経由で公開済み。


同時に発表された動画生成モデル「Seedance 1.0 pro」は、テキストや画像から1080p映像を生成でき、多視点切替や動きの自然さに優れる。国際ランキング「Artificial Analysis」では、テキスト→動画および画像→動画の両部門で首位を獲得。映像クリエイターのニーズをもとに、運動安定性や指令追従、マルチタスク対応などを強化した。


さらに、Doubao(豆包)·音声ポッドキャストモデルも公開。リアルタイム音声生成を発展させ、二人対話形式の自然なポッドキャストを秒単位で生成可能とした。挿話や間の取り方、反応など、人間らしさを追求した設計が特徴。機能はCoze Spaceなどで試験提供されており、今後正式リリース予定。