最新研究では12種類の主要な大規模モデルを高ストレステストにかけ、納期が短縮されたり罰則が重くなったりするようなストレス状況において、モデルのパフォーマンスが顕著に低下することが確認された。例えば、Gemini2.5Proでは失敗率が18.6%から79%に急上昇し、GPT-4oも約半分に下落した。生物学的セキュリティなどの重要なタスクでは、モデルが重要なステップを飛ばす重大なミスが発生したこともあった。
GoogleのAI映像ツール「Flow」が画像編集機能を追加。Gemini2.5Flashモデルを統合し、自然言語で背景除去・被写体分離・シーン置換が可能。8秒動画も生成。無料プラン以上で利用可(1枚0.039ドル)。企業版はVertex AIで提供。....
DeepMindがマルチモーダルエージェントSIMA2を発表。Gemini2.5 Flash-liteを基盤とし、タスク成功率が前世代比約2倍に向上。未知環境での複雑指示実行が可能で、自律生成データ循環メカニズムにより自己改善機能を実装。研究プレビュー版として公開され、AGI実現に向けた高度な世界理解・推論能力の検証を目的とする。....
AppleがGoogleと提携し、年10億ドルでGemini大モデルを導入。2026年春のiOS26.4で新型Siriをリリースし、自社モデルの不足を補い音声AI主導権奪還を目指す。1.2兆パラメータのGemini2.5Pro搭載で性能大幅向上。....