バイトダンスは「火山引擎Force原動力大会」にて、同社の大規模モデルDoubao(豆包)の最新版1.6版を発表。推理や数学、指令理解、エージェント構築などの分野で大幅に性能が強化され、複数の国際ベンチマークで世界トップクラスのスコアを記録した。
Doubao(豆包)1.6は、256kの長文脈処理や多モーダル理解、グラフィカルなUI操作などに対応しており、複雑なAIエージェント開発に向けた基盤として提供される。APIはすでに火山引擎経由で公開済み。
同時に発表された動画生成モデル「Seedance 1.0 pro」は、テキストや画像から1080p映像を生成でき、多視点切替や動きの自然さに優れる。国際ランキング「Artificial Analysis」では、テキスト→動画および画像→動画の両部門で首位を獲得。映像クリエイターのニーズをもとに、運動安定性や指令追従、マルチタスク対応などを強化した。
さらに、Doubao(豆包)·音声ポッドキャストモデルも公開。リアルタイム音声生成を発展させ、二人対話形式の自然なポッドキャストを秒単位で生成可能とした。挿話や間の取り方、反応など、人間らしさを追求した設計が特徴。機能はCoze Spaceなどで試験提供されており、今後正式リリース予定。