FORCE原動力カンファレンスで、火山エンジンは正式にドパオ大モデル1.6および新しいビデオ生成モデルSeedance1.0proを発表し、AIクラウドネイティブフルスタックサービスの全面的なアップグレードを示しました。マルチモーダルでコストパフォーマンスの高いリーディングモデルファミリーであるドパオ大モデル1.6は、機能とパフォーマンスの両方で顕著な改善が行われました。
画期的な価格とパフォーマンス
字節跳動のCEOである梁汝波氏は、発表会でドパオ大モデル1.6が統一された価格モデルを採用しており、入力長さに基づく価格設定の先駆けとなったことを述べました。企業が頻繁に使用する0-32Kの入力範囲では、価格は1百万トークンあたり0.8元、出力は8元となっています。これにより、以前のバージョンよりも総コストが63%削減されました。また、Seedance1.0proモデルの価格も非常に競争力があります。1千トークンあたりの価格はわずか0.015元、5秒間の1080Pビデオの生成には3.67元しかかかりません。
#### 高機能モデルシリーズ
ドパオ大モデル1.6シリーズは次の3つのモデルから構成されています:
- **doubao-seed-1.6**: 国内で初めて256Kの上下文をサポートする総合思考モデルで、深い思考やマルチモーダル理解などの能力を持っています。
- **doubao-seed-1.6-thinking**: 深い思考面で強化され、より複雑な推論能力をサポートします。
- **doubao-seed-1.6-flash**: エクストリームバージョンで、非常に低い遅延があり、視覚的理解能力は業界トップクラスに近いです。
これらのモデルは推論速度と正確さが大幅に向上し、より複雑なビジネスシナリオの実装を支えています。
「考えながら検索」機能と「DeepResearch」機能
ドパオ大モデル1.6の「考えながら検索」機能は、モデルが独立して考える際に情報検索を行うことを可能にします。例えば、広東出身の学生が北京での生活用品を準備する際、ドパオは問題を深く分析し、必要なアイテムを推薦します。「DeepResearch」機能は短時間で詳細な調査レポートを生成し、数日かかる作業を5〜30分に短縮します。
マルチモーダル理解とGUI操作能力
ドパオ大モデル1.6は、マルチモーダル思考をネイティブでサポートし、複雑な現実世界の問題を理解・処理することができます。このため、電子商取引商品の審査や自動運転のラベリングなど、多くの実用的なアプリケーションで活躍します。また、モデルは優れたGUI操作能力を持ち、さまざまなソフトウェアと効率的に相互作用し、ホテルの選定や領収書の整理などのタスクを自動的に実行できます。
新ビデオ生成モデルSeedance1.0pro
今回発表されたSeedance1.0proビデオ生成モデルは、シームレスなマルチショットナラティブ、安定した動き、そしてリアルな美しさを特徴とし、電子商取引、映画、ゲームなどの業界で広く利用されます。最新の第三者機関による権威ある評価によると、Seedance1.0proはテキストからビデオ生成および画像からビデオ生成の分野でトップレベルにあります。
これらの新しい機能や技術を通じて、ドパオ大モデル1.6とSeedance1.0proの発表は、企業がAIの知能化変革において重要なステップを踏むことを示し、将来の革新発展の基礎を築きました。