グーグルがImagin4を発表：テキスト生成のブレーキを突破ジェミニAPIでテキストから画像生成

AIbase基地

公開日AIニュース · 1 分で読めます · Jun 26, 2025

最近、グーグルはGemini APIを通じて最新のテキストから画像生成モデル「Imagen4」を正式にリリースしました。これは生成型AI（AIGC）分野における重要な出来事です。グーグル公式ブログやコミュニティからのフィードバックによると、Imagen4は画像内のテキスト生成において飛躍的な進歩を遂げ、AIGCが長年直面してきた技術的課題を解決し、開発者に高品質なビジュアルコンテンツ制作ツールを提供しています。

このモデルは「Imagen4」と「Imagen4Ultra」の2つのバージョンに分かれており、それぞれ1枚あたり0.04ドルと0.06ドルで提供されています。現在、Gemini APIおよびGoogle AI Studioで有料プレビューが行われており、一部の無料トライアル枠も開放されています。

Imagen4は前バージョンのImagen3と比べて、テキストのレンダリング品質が大幅に向上しており、最大2K解像度の画像生成をサポートし、写実的から抽象的な多様なアートスタイルをカバーします。「高速モード」では生成速度が10倍になり、効率的な創作ニーズに対応できます。Imagen4Ultraは高精度なプロンプトの整合性を重視して設計されており、広告や出版など細かい制御が必要なシーンに適しています。さらに、グーグルはすべての生成画像に「SynthID」のデジタルウォーターマークを埋め込むことを義務付けており、コンテンツの追跡可能性を確保し、偽情報の撲滅に貢献しています。

GeminiAPI Imagen4 AIGC 生成型AI

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

張宏江が外灘大会で発表：インフラストラクチャの拡大が加速し、AIは産業規模化に入っている

2025年外滩大会で、張宏江氏は大規模言語モデルとAIエージェントの経済的影響について講演。規模の法則（Scaling Law）が依然有効であり、推論モデルの登場が新たな発展曲線を形成していると指摘。....

Sep 11, 2025

コードからリソースへ王堅：AIのオープンな道のりはオープンソースにとどまらない

2025年外滩大会で、王堅氏はAI時代における「開放」の重要性を強調。コードからリソースへの変革を指摘し、1月の米国AIモデル輸出規制でも「オープンソース」が除外された事例を紹介。....

Sep 11, 2025

ターリング賞受賞者リチャード・サットン：AIは経験の時代に入り、人間のデータの恩恵は限界に近づいている

2025年9月11日午前、2025Inclusion・外灘会議が上海黄浦区の万博園で開幕しました。会議のオープニングフォーラムでは、2024年のターリング賞受賞者であり「強化学習の父」と呼ばれるリチャード・サットンが基調講演を行いました。彼は、人間のデータの恩恵が限界に近づいていると指摘し、人工知能が継続的な学習を核とする経験の時代に入っていると語りました。この時代の人工知能のポテンシャルはこれまで以上に大きいと述べました。サットンは講演で、現在の機械学習の多くは受動的で静的な人間の知識に基づいていると語っています。

Sep 11, 2025

バイトSeedが新規AgentGym-RLフレームワークをリリース: 大規模言語モデルの意思決定能力を向上

AI技術の発展に伴い、複雑なタスクを遂行する大規模言語モデル(LLM)エージェントの開発が注目されている。Seed研究チームは、強化学習(RL)に焦点を当てた新フレームワーク「AgentGym-RL」を発表し、多様な環境下でのゼロからの学習を可能にした。....

Sep 11, 2025

OpenAIがChatGPT開発者モードをリリース。AIが外部ツールを直接制御することを初めてサポート

OpenAIは9月11日にChatGPT開発者モードの機能を正式にリリースしました。このベータ版機能はPlusおよびProユーザー向けに提供され、モデルの完全なコンテキストプロトコル（MCP）クライアント機能をサポートしています。このアップグレードにより、ChatGPTは外部データを読み取るだけでなく、書き込み操作も行えるようになり、このAIアシスタントが対話ツールから自動化エージェントへの重要な転換を示しています。新機能はMCPプロトコルに基づいており、開発者がカスタムコネクタを作成できるようにし、ChatGPTが外部システムを直接操作できるようにします。ユーザーは...

Sep 11, 2025

Reddit が新機能をテスト中：アプリ内で記事を読むことができ、コメントを見ることができる

Redditは、ユーザー体験向上とニュース出版社向けツール拡充を目的とした新機能をテスト中。アプリ内で記事を直接開き、コメントを閲覧可能に。AI時代のニュース流通において出版社と読者の新たな接点を提供。....

Sep 11, 2025

Thinking Machines LabがAIのランダム性の課題を解決し、大規模言語モデルで初めて100%一貫した出力を実現

元OpenAIのChief Technology OfficerであるMira Muratiが設立したThinking Machines Labは最近、AI業界に長年残っていたモデル出力の不確実性問題を解決する重要な技術的進展を発表しました。この研究所が最新の研究報告書で明らかにしたのは、大規模言語モデルの推論プロセスにおける完全な確定性出力を達成したことです。『LLMの推論において不確実性に勝つ』というタイトルのこの研究報告書では、温度パラメータを0に設定しても、従来の大規模言語モデルは同じ入力に対して異なる出力を生成してしまうことが指摘されています。

Sep 11, 2025

Spotify元幹部が400万ドルの新作で衝撃的な登場！AIが瞬時にカリキュラムを作成し、従来の教育を変革。9つの学習モードで知識の獲得が音楽を聴くように簡単に

学び方に関する革命がシリコンバレーで静かに酝酿されている。我々が伝統的な教育の硬直的なモデルに悩まされている間、AnchorをSpotifyに売却した経験を持つ2人の起業家は次の破壊的ターゲットを狙っている。誰もが数秒で自分専用の学習カリキュラムを作り出せるようにすることだ。日本語の語根から名付けられたAI教育アプリOboeは、私たちが知識を得る方法を再定義しようとしている。Nir ZichermanとMichael Mignanoという二人の人物が

Sep 11, 2025

米国上院議員が「SANDBOX法案」を提出 AI企業が最大10年間の自主規制ルールを設定可能に

最近、米国上院議員のテッド・クルーズ（Ted Cruz）氏が『SANDBOX法案』と呼ばれる新たな立法案を提出した。この法案は、人工知能（AI）企業に対して『監督サンドボックス』を提供し、連邦政府の規制をある程度緩和することで実験を可能にするものである。図の出典：画像はAIによって生成され、画像ライセンスサービス会社Midjourneyによるものです。この法案により、AI企業は、少なくとも1つのAIシステムを含むまたは使用する製品のテストや導入をより簡単にできるようにするために、あらゆる障害となる規制の修正または免除を申請することが可能になる。

Sep 11, 2025

Primeira declaração após a rodada de semente de 2 bilhões de dólares! O laboratório misterioso de Mira Murati desafia a aleatoriedade da IA, quer tornar o pensamento das máquinas previsível

シリコンバレーの謎に包まれたAIラボ「Thinking Machines」が遂に研究内容を公開。OpenAI元CTO率いる同社は、AIモデルの回答不安定性という根本課題に挑む。20億ドルの資金とトップ研究者を擁し、業界に革新をもたらす可能性を秘めている。....

Sep 11, 2025

AIニュース

AIニュース日報

AIツールを探す

AI製品ランキング

AIプロダクト登録

AIツールディレクトリ

AIモデルファインダー

LLMプロバイダー

AIモデル登録

LLM比較選定

LLMコスト計算機

LLMアリーナ

MCPサーバー

MCPクライアント

MCPケースチュートリアル

MCPランキング

MCPサービス提出

MCP実験場

MCPインスペクター

GEO順位最適化サービス

グーグルがImagin4を発表：テキスト生成のブレーキを突破ジェミニAPIでテキストから画像生成

AIbase基地

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

張宏江が外灘大会で発表：インフラストラクチャの拡大が加速し、AIは産業規模化に入っている

コードからリソースへ王堅：AIのオープンな道のりはオープンソースにとどまらない

ターリング賞受賞者リチャード・サットン：AIは経験の時代に入り、人間のデータの恩恵は限界に近づいている

バイトSeedが新規AgentGym-RLフレームワークをリリース: 大規模言語モデルの意思決定能力を向上

OpenAIがChatGPT開発者モードをリリース。AIが外部ツールを直接制御することを初めてサポート

Reddit が新機能をテスト中：アプリ内で記事を読むことができ、コメントを見ることができる

Thinking Machines LabがAIのランダム性の課題を解決し、大規模言語モデルで初めて100%一貫した出力を実現

Spotify元幹部が400万ドルの新作で衝撃的な登場！AIが瞬時にカリキュラムを作成し、従来の教育を変革。9つの学習モードで知識の獲得が音楽を聴くように簡単に

米国上院議員が「SANDBOX法案」を提出 AI企業が最大10年間の自主規制ルールを設定可能に

Primeira declaração após a rodada de semente de 2 bilhões de dólares! O laboratório misterioso de Mira Murati desafia a aleatoriedade da IA, quer tornar o pensamento das máquinas previsível

AIニュース

AIニュース日報

AIツールを探す

AI製品ランキング

AIプロダクト登録

AIツールディレクトリ

AIモデルファインダー

LLMプロバイダー

AIモデル登録

LLM比較選定

LLMコスト計算機

LLMアリーナ

MCPサーバー

MCPクライアント

MCPケースチュートリアル

MCPランキング

MCPサービス提出

MCP実験場

MCPインスペクター

GEO順位最適化サービス

グーグルがImagin4を発表：テキスト生成のブレーキを突破 ジェミニAPIでテキストから画像生成

AIbase基地

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

張宏江が外灘大会で発表：インフラストラクチャの拡大が加速し、AIは産業規模化に入っている

コードからリソースへ 王堅：AIのオープンな道のりはオープンソースにとどまらない

ターリング賞受賞者リチャード・サットン：AIは経験の時代に入り、人間のデータの恩恵は限界に近づいている

バイトSeedが新規AgentGym-RLフレームワークをリリース: 大規模言語モデルの意思決定能力を向上

OpenAIがChatGPT開発者モードをリリース。AIが外部ツールを直接制御することを初めてサポート

Reddit が新機能をテスト中：アプリ内で記事を読むことができ、コメントを見ることができる

Thinking Machines LabがAIのランダム性の課題を解決し、大規模言語モデルで初めて100%一貫した出力を実現

Spotify元幹部が400万ドルの新作で衝撃的な登場！AIが瞬時にカリキュラムを作成し、従来の教育を変革。9つの学習モードで知識の獲得が音楽を聴くように簡単に

米国上院議員が「SANDBOX法案」を提出 AI企業が最大10年間の自主規制ルールを設定可能に

Primeira declaração após a rodada de semente de 2 bilhões de dólares! O laboratório misterioso de Mira Murati desafia a aleatoriedade da IA, quer tornar o pensamento das máquinas previsível

グーグルがImagin4を発表：テキスト生成のブレーキを突破ジェミニAPIでテキストから画像生成

コードからリソースへ王堅：AIのオープンな道のりはオープンソースにとどまらない