最高の豆包ビデオ生成モデル AIツールモデル_厳選豆包ビデオ生成モデル情報

AIニュース

ボリューノエンジンが豆包動画生成モデル1.0proを発表。高速化3倍、価格は72%低下

10月24日、火山引擎が豆包ビデオ生成モデル1.0pro fastを発表。生成速度が約3倍向上し、10秒で720Pの5秒動画を生成可能に。企業・クリエイター向けに効率的な動画制作ソリューションを提供。....

大規模言語モデルの効率を1.7倍に向上：バイトダンスのCOMET技術がオープンソース化

バイトダンス傘下の豆包大規模言語モデルチームは先日、混合専門家モデル（MoE）アーキテクチャにおける主要なボトルネックを克服し、COMETという名称の重要な最適化技術をオープンソース化したと発表しました。この技術は、大規模言語モデルのトレーニング効率を大幅に向上させ、最大1.7倍の効率向上を実現し、トレーニングコストを40％削減することに成功しました。画像注記：画像はAIによって生成され、画像ライセンス提供サービスMidjourneyを使用しています。COMET技術は、バイトダンスの万規模GPUクラスタトレーニングで実際に適用されており、数百万GPU時間の節約に貢献しています。

6.2k 1 日前

大規模言語モデルの効率を1.7倍に向上：バイトダンスのCOMET技術がオープンソース化

豆包：ビデオ生成モデル「VideoWorld」がオープンソース化純粋なビジュアル学習を実現

豆包大模型チームの公式アカウントによると、北京交通大学と中国科学技術大学の共同研究により、豆包大模型チームが提案したビデオ生成実験モデル「VideoWorld」が近日、正式にオープンソース化されました。このモデルの最大のハイライトは、従来の言語モデルに依存せず、視覚情報のみで世界を認知・理解できる点です。この画期的な研究は、李飛飛教授がTED講演で述べた「幼児は言語に頼らずに現実世界を理解できる」という考えから着想を得ています。「Vide」

7.4k 6 日前

豆包：ビデオ生成モデル「VideoWorld」がオープンソース化純粋なビジュアル学習を実現

バイトダンス豆包音声モデルとビジョンモデルがアップグレード、総合能力が20.3％向上

2024年8月21日開催の火山引擎AIイノベーションツアー上海会場において、火山引擎は豆包大規模言語モデルの全面的なアップグレードを発表しました。これには、豆包・テキスト生成画像モデルによる長文テキストのより正確な画像マッチング機能、複数の公開テストセットにおける豆包・音声認識モデルのエラー率最大40％の削減、そして豆包・音声合成モデルへのリアルタイム対応と正確な句読点付与が可能なストリーミング音声合成機能の追加が含まれます。火山引擎はまた、豆包大規模言語モデルとリアルタイムの音声ビデオ技術を統合した対話型AIリアルタイムインタラクションソリューションを発表し、エンドツーエンドの...

5.8k 1 日前

モデル

Gemini 2.0 Flash-Lite

Google

$0.49

入力トークン/百万

$2.1

出力トークン/百万

コンテキスト長

GPT-4.1 mini

Openai

$2.8

入力トークン/百万

$11.2

出力トークン/百万

コンテキスト長

Grok 4 Fast

Xai

$1.4

入力トークン/百万

$3.5

出力トークン/百万

コンテキスト長

o3 - mini

Openai

$7.7

入力トークン/百万

$30.8

出力トークン/百万

200

コンテキスト長

GPT-5 Codex

Openai

入力トークン/百万

出力トークン/百万

コンテキスト長

Claude 3 Opus

Anthropic

$105

入力トークン/百万

$525

出力トークン/百万

200

コンテキスト長

Gemini 2.0 Flash

Google

$0.7

入力トークン/百万

$2.8

出力トークン/百万

コンテキスト長

Claude Haiku 4.5

Anthropic

入力トークン/百万

$35

出力トークン/百万

200

コンテキスト長

Gemini 2.5 Flash

Google

$2.1

入力トークン/百万

$17.5

出力トークン/百万

コンテキスト長

Claude Sonnet 4.5

Anthropic

$21

入力トークン/百万

$105

出力トークン/百万

200

コンテキスト長

Claude 3 Sonnet

Anthropic

$21

入力トークン/百万

$105

出力トークン/百万

200

コンテキスト長

Gemini 2.5 Flash-Lite

Google

$0.7

入力トークン/百万

$2.8

出力トークン/百万

コンテキスト長

qwen-image-plus

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

qwen3-vl-plus

Alibaba

入力トークン/百万

$10

出力トークン/百万

256

コンテキスト長

Qianfan-Lightning

Baidu

入力トークン/百万

出力トークン/百万

128

コンテキスト長

wan2.5-i2i-preview

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

qwen3-max

Alibaba

入力トークン/百万

$24

出力トークン/百万

256

コンテキスト長

qwen3-vl-235b-a22b-thinking

Alibaba

入力トークン/百万

$20

出力トークン/百万

コンテキスト長

qwen3-coder-plus

Alibaba

入力トークン/百万

$16

出力トークン/百万

コンテキスト長

qwen-image-edit

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

未来を力づける、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

ビジネス協力サイトマップ

AIニュース

ボリューノエンジンが豆包動画生成モデル1.0proを発表。高速化3倍、価格は72%低下

大規模言語モデルの効率を1.7倍に向上：バイトダンスのCOMET技術がオープンソース化

豆包：ビデオ生成モデル「VideoWorld」がオープンソース化 純粋なビジュアル学習を実現

バイトダンス豆包音声モデルとビジョンモデルがアップグレード、総合能力が20.3％向上

モデル

Gemini 2.0 Flash-Lite

GPT-4.1 mini

Grok 4 Fast

o3 - mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-vl-plus

Qianfan-Lightning

wan2.5-i2i-preview

qwen3-max

qwen3-vl-235b-a22b-thinking

qwen3-coder-plus

qwen-image-edit

豆包：ビデオ生成モデル「VideoWorld」がオープンソース化純粋なビジュアル学習を実現