GoogleがGemini2.5Flash音声モデルをアップグレードし、AIによる人間らしいリアルタイム対話を実現。音声の抑揚・感情・間を直接処理でき、文字変換不要で自然な会話が可能に。....
最新研究では12種類の主要な大規模モデルを高ストレステストにかけ、納期が短縮されたり罰則が重くなったりするようなストレス状況において、モデルのパフォーマンスが顕著に低下することが確認された。例えば、Gemini2.5Proでは失敗率が18.6%から79%に急上昇し、GPT-4oも約半分に下落した。生物学的セキュリティなどの重要なタスクでは、モデルが重要なステップを飛ばす重大なミスが発生したこともあった。
GoogleのAI映像ツール「Flow」が画像編集機能を追加。Gemini2.5Flashモデルを統合し、自然言語で背景除去・被写体分離・シーン置換が可能。8秒動画も生成。無料プラン以上で利用可(1枚0.039ドル)。企業版はVertex AIで提供。....
DeepMindがマルチモーダルエージェントSIMA2を発表。Gemini2.5 Flash-liteを基盤とし、タスク成功率が前世代比約2倍に向上。未知環境での複雑指示実行が可能で、自律生成データ循環メカニズムにより自己改善機能を実装。研究プレビュー版として公開され、AGI実現に向けた高度な世界理解・推論能力の検証を目的とする。....
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
$0.7
$2.8
$17.5
$8.75
$70
-
$1.4
131
Baidu
$1
$4
64
Sensetime
$1.5
$4.5
128
$1.05
$4.2
2.1k
$3.5
$10.5
32