アリババ、超強力AIモデルQwen2-VLをオープンソース化:20分以上の動画を理解
アリババクラウドが、新しいAIモデルQwen2-VLを発表しました。これは、視覚コンテンツを理解する強力な機能を備え、最長20分の動画をリアルタイムで分析し、動画の内容を要約したり、関連する質問に答えたり、オンラインチャットをサポートします。サードパーティのベンチマークテストでは、Qwen2-VLはMetaのLlama3.1、OpenAIのGPT-4o、AnthropicのClaude3Haiku、GoogleのGemini-1.5Flashなどを含むいくつかの指標で凌駕しています。