最近、グーグルはGemini APIを通じて最新のテキストから画像生成モデル「Imagen4」を正式にリリースしました。これは生成型AI(AIGC)分野における重要な出来事です。グーグル公式ブログやコミュニティからのフィードバックによると、Imagen4は画像内のテキスト生成において飛躍的な進歩を遂げ、AIGCが長年直面してきた技術的課題を解決し、開発者に高品質なビジュアルコンテンツ制作ツールを提供しています。

QQ20250626-142522.png

このモデルは「Imagen4」と「Imagen4Ultra」の2つのバージョンに分かれており、それぞれ1枚あたり0.04ドルと0.06ドルで提供されています。現在、Gemini APIおよびGoogle AI Studioで有料プレビューが行われており、一部の無料トライアル枠も開放されています。

Imagen4は前バージョンのImagen3と比べて、テキストのレンダリング品質が大幅に向上しており、最大2K解像度の画像生成をサポートし、写実的から抽象的な多様なアートスタイルをカバーします。「高速モード」では生成速度が10倍になり、効率的な創作ニーズに対応できます。Imagen4Ultraは高精度なプロンプトの整合性を重視して設計されており、広告や出版など細かい制御が必要なシーンに適しています。さらに、グーグルはすべての生成画像に「SynthID」のデジタルウォーターマークを埋め込むことを義務付けており、コンテンツの追跡可能性を確保し、偽情報の撲滅に貢献しています。