9月3日、ジーメンAIは正式に火山エンジンにリリースされ、企業向けにAPIサービスを開放しました。画像生成、動画生成、デジタル人間生成の3つのカテゴリをカバーしています。今回のリリースされたジーメンAIモデルには、C端ユーザーから人気のあるテキストから画像生成3.0、テキストから画像生成3.1、画像から画像生成3.0などの最新バージョンが含まれており、これらのモデルはユーザーの実際の創作フィードバックと深く理解に基づいて、テンセント自社モデルであるSeedream、SeedEdit、Seedance、OmniHumanなどに対して多方面にわたる精密なチューニングが施されており、現実的な創作ニーズにさらに適応し、企業が自分たちだけの「クリエイティブ生産ライン」を迅速に構築するのを助けます。

ジーメンAIのテキストから画像生成3.0は、ポスター設計のシナリオに特化して、テキストと画像のレイアウト、アートフォント、文字の正確性を強化しており、商用デザインのニーズに近づいたコンテンツを生成し、スタイル統一でレイアウトが専門的なマーケティング素材を簡単に作成できます。テキストから画像生成3.1は前世代の優位性を引き継ぎつつ、画面全体の美しさとシーンの豊かさをさらに向上させ、色、光、構図が全面的にアップグレードされ、映画のようなビジュアル品質を呈示します。画像から画像生成3.0はスマートな参照機能を持ち、テキスト命令に基づいて画像を正確に編集する能力が強く、例えば「背景の置き換え」「タイトルの調整」などの部分的な編集命令を正確に実行でき、人物の顔の特徴や細かいテクスチャを完全に保持することができます。現実的な画像処理やポスターのテキストと画像の創作シナリオでは、この機能は従来のAI画像編集で失真しやすい問題を効果的に解決し、クリエイティブな修正を効率的に実装します。

微信截图_20250903165543.png

ジーメンAIの動画3.0は品質と速度を両立し、プロ仕様のコントロール可能なカメラワークと1080Pの高精細レンダリングをサポートしています。製品紹介の短編動画やインフルエンサーコンテンツでも、滑らかで自然な視覚的表現が可能です。動画3.0Proは新たに複数のカメラショットによる物語の展開能力を追加し、テキスト命令に基づいてカメラショットの切り替えを行うことができます。人物の肢体動作と物体の運動軌跡は滑らかでカクつきません。また、「純粋なテキスト生成」と「最初のフレーム画像+テキスト」の2つのモードをサポートしており、多様な創作シナリオに対応しています。

ジーメンAIは使いやすさを考慮し、単一の画像を用いるデジタル人間の遊び方を導入しました。ユーザーは1枚の画像、または音声や動画だけで、人物、アニメキャラクターや仮想キャラクターを一瞬で「燃える」ようにします。この機能は音声、表情、口元、肢体動作を正確に一致させ、同時に元の画像の主要なイメージを高く保持します。写実的人物や二次元のキャラクターであっても、生き生きとして表現力があり、非常に繊細で魅力的な動きを実現し、学ぶことも演じることもできる、1人でさまざまな顔を持つことができます。

ジーメンAIは火山エンジンと協力し、企業にコストパフォーマンスの高いAPIサービスを提供し、企業がクリエイティブを効率的に実現するのを支援します。新規ユーザーは最大で3割の割引を享受でき、豪華な福利は9月限定で開催されます。