本稿では、GPT-4とDALL-E 3を用いた画像テキスト生成の対抗実験を通して、両者が曖昧な画像を処理する際の限界を検証しました。著者はぼやけた「牛ザメ」の画像を入力し、GPT-4に記述させた後、DALL-E 3に描画させました。描画された画像を再びGPT-4に入力して記述させる、というサイクルを繰り返しました。その結果、GPT-4はぼやけた画像が牛なのかサメなのかを判断できず、DALL-E 3が描いた画像にも矛盾が見られました。この実験は、反復テストを用いて大規模言語モデルの画像テキスト理解と生成能力の限界を深く検証する方法を探っています。
関連AIニュースの推奨

オープンソース界の核弾頭!Step1X-EditがHugging Faceに登場 自然言語で新たな世界を描く、GPT-4oに迫る性能!

Adobe、Firefly AIプラットフォームを大幅アップグレード 画像、動画、音声のオールインワン制作エンジン

GPT-4oの画像生成能力がGPTsに統合、パーソナライズされた画像生成AIの新時代へ
OpenAIは、GPT-4oの画像生成能力をGPTs(カスタムGPT)プラットフォームに正式統合したと発表しました。これにより、開発者やクリエイターは、パーソナライズされた画像生成AIロボットを構築するための強力なツールを獲得しました。AIbaseの情報によると、このアップデートにより、ユーザーはGPTsを使用して、ポスターデザインロボットや特定の芸術スタイルのジェネレーターなどの独自の画像生成アプリケーションを作成できるようになり、創造性の柔軟性と共有性が大幅に向上します。ソーシャルメディア上での活発な議論は、その広範な影響力を示しており、関連機能はChatGPT Plus、P…(以下略)

OpenAI、ChatGPTの新バージョンを発表:よりスマートで直感的なGPT-4o
Step1X-Edit:オープンソース画像編集の新基準 GPT-4oなどのクローズドソースモデルに匹敵
GPT-4による画像生成機能がカスタムGPTに統合されました

AI日報:百度の大型発表!文心大模型X1TurboとAIオープン計画を発表;OpenAIが軽量版Deep Researchを無料公開;即夢ビデオ3.0内測開始
百度が文心大模型X1TurboとAIオープン計画を発表、OpenAIが軽量版Deep Researchを無料公開、そして即夢ビデオ3.0の内測開始など、最新のAIニュースをお届けします。

ImageSlider 2.0、主力製品ラインに追加へ 画像生成機能が大幅アップグレード
李彦宏、文心大模型の双星を発表:X1TurboはDeepSeek 4.5Turboを直撃、GPT-4oを凌駕

AdobeのAI画像生成ツールFireflyがiOSとAndroid版でリリース
最新のニュースとして、Adobe社はAI画像生成ツールFireflyのモバイル版をリリースすると発表しました。OpenAIとの競争激化を目指した動きです。ロンドンのMAXクリエイティブカンファレンスで正式発表され、FireflyモバイルアプリはiOSとAndroid両プラットフォームに対応し、近日中にリリース予定とのことですが、具体的なリリース日はまだ発表されていません。Adobe Fireflyの副社長Alexandru Co…