最近、MiniMaxが発表した貝殻ビデオ生成モデルabab-video-1が国内外で大きな注目を集めています。中国のネットユーザーだけでなく、海外のネットユーザーからも高い評価を得ています。

全体的な体験として、貝殻ビデオ生成は使いやすく、簡単な文章を入力するだけで滑らかなビデオを生成できます。ビデオ全体の動きは安定しており、人物の動きも非常に自然です。

Xで「Ryan Morrison」という名前のブロガーは、貝殻ビデオは彼が見た中で最も自然な手動モーション生成だと断言しています。

MiniMax1.jpg

また、別のブロガーは貝殻ビデオを使って「スターウォーズ」のビデオを生成しましたが、映像の色使いや美学から見て、既に「ハリウッド映画」のような雰囲気があります。さらに、カメラワークもスムーズで、動作の幅も大きく、ビデオが崩れることもありません。

MiniMax3.jpg

さらに、あるブロガーは比較を行い、貝殻ビデオは可灵よりも美学とビデオ表現において優れていると主張しています。果たして本当にそうなのでしょうか?

貝殻ビデオVS可灵 実測比較結果

以下では、AIbaseが3つのプロンプトを使ってテスト比較を行いましたので、比較結果をご覧ください!

実測比較1:都市風景(複雑なプロンプト)

プロンプト1:現代都市が徐々に過去へと戻っていく様子を表現します。摩天楼が徐々に消え去り、代わりに古い建物が現れます。車は馬車になり、街の人々の服装も過去のスタイルに戻ります。街全体がタイムマシンの中を移動しているかのように、観客に異なる時代の様式を体験させます。

AIbaseが貝殻AIを使用して生成したビデオ

ご覧のように、貝殻ビデオはプロンプトをかなり正確に理解しており、古今建築の移り変わりも自然なグラデーションで表現されています。非常に優れたパフォーマンスです。

同じプロンプトで、可灵が生成した結果は次のとおりです。

AIbaseが可灵を使用して生成したビデオ

可灵のテキストからビデオへの生成は、複雑で長いプロンプトの理解にやや欠けているようです。現状のビデオを見る限り、前半部分しか理解しておらず、現代建築から古代建築への変化は生成されていません。画像からビデオを生成する場合、可灵はより良いパフォーマンスを発揮できるでしょう。

実測比較2:バーにいる人々(複雑なプロンプト)

プロンプト2:5人がバーのカウンターに座っており、色の変化を通して5人の感情の波動を表します。画面は人物の肖像を中心に、背景の色は表情の変化に合わせて変化します。喜びの時は明るく暖かく、悲しみの時は深く冷たく、怒りの時は鮮やかに激しくなります。色の流れが感情の微妙な変化を表し、観客は人物の心の内を直感的に感じ取ることができます。

AIbaseはプロンプト2で、「感情の変化」や「背景の色調が感情の変化に合わせて変化する」といった複数の複雑な詳細を設定し、さらに画面の人数を増やして難易度を高めました。

AIbaseが貝殻ビデオを使用して生成したビデオ

現状では、貝殻ビデオは難なく対応しているようで、人物の感情の変化は自然で、顔も崩れておらず、背景の色調も感情に合わせて変化しており、表現力が高いです。

AIbaseが可灵を使用して生成したビデオ

同じプロンプトで、可灵が生成した人物は1人少なく、顔も崩れており、色調もプロンプトの要求通りに感情の変化に合わせて変化していません。

実測比較3:星空の下のカップル(簡単なプロンプト)

プロンプトが長すぎたり、複雑すぎるため、簡単なプロンプトを試してみましょう。

プロンプト3:カップルが手をつないで、星々が輝く夜空を散歩しています。背景の星々はゆっくりと動いています。

AIbaseが貝殻ビデオを使用して生成したビデオ

貝殻が生成したビデオは、動きの幅から構図、美学的な観点から見ても問題なく、カップルの散歩の動きも自然です。

AIbaseが可灵を使用して生成したビデオ

可灵が生成した星空にも問題はありませんが、唯一の欠点は下部のカップルが画面でやや小さく、見過ごされやすいことです。人物の外見も少し崩れていますが、許容範囲内です。

実測比較結果

上記のいくつかのテストから、少なくともテキストからビデオを生成する点では、貝殻ビデオは可灵を凌駕していることが分かります。現状、可灵の強みは機能が豊富で、画像からビデオの生成、先頭フレームと末尾フレームなどもサポートしており、この点ではテキストからビデオを生成するよりもはるかに優れています。貝殻ビデオはテキストからビデオを生成する機能しかないため、画像からビデオを生成する点では比較できません。

要約すると、貝殻ビデオの主な利点は以下のとおりです。

美学レベル:貝殻モデルで生成されたビデオは、画面の美しさにおいて顕著な向上が見られ、色の組み合わせがより調和し、構図がより洗練されています。

カメラワーク:可灵と比較して、貝殻モデルはビデオのカメラワークにおいて優れており、よりスムーズで自然な画面の切り替えとカメラの動きを実現できます。

表情描写:貝殻モデルは人物の表情の描写においてより繊細で豊かで、感情や物語をより効果的に伝えることができます。

テキスト表示:テキストを表示する必要があるシーンでは、貝殻モデルのパフォーマンスがより優れており、テキストのレイアウトとデザインがより美しく、読みやすくなっています。

ビデオの一貫性:貝殻モデルで生成されたビデオは、プロットの展開と画面の切り替えがより一貫しており、ストーリーテリング能力が向上しています。

創造性:貝殻モデルはクリエイターにより広い創造性を提供し、独自の視覚効果と物語表現をより効果的に実現できます。

ご興味のある方は、ぜひお試しください:https://top.aibase.com/tool/hailuowenwen