グーグルGemini2.5が画像処理を革新:オブジェクトの認識にとどまらず、抽象的な概念と関係も理解
グーグルはGemini2.5AIによる自然言語での画像分割機能をリリースしました。ユーザーは自然言語の指示を使用して画像の内容を正確に分析できます。この技術は従来の分割の制限を突破し、複雑な意味指令、関係質問、論理的指示、そして抽象的概念の識別を理解でき、多言語のプロンプトをサポートしています。応用範囲は画像編集、職場の安全検査、保険の請求などに及び、開発者はAPIを通じてこの機能を直接呼び出すことができます。返還結果には座標やピクセルマスクなどのデータが含まれます。グーグルは特定のモデルパラメータを使用することを推奨しています。