近日,智譜、清華大學和北京大學合作推出了一個名爲LVBench的長視頻理解基準測試項目。現有的多模態大型語言模型雖然在短視頻理解方面取得了長足進步,但在處理長達數小時的長視頻時仍面臨挑戰。爲彌補這一空白,LVBench應運而生。
長視頻理解基準測試
Anthropic
$21
輸入tokens/百萬
$105
輸出tokens/百萬
200
上下文長度
Openai
$8.75
$70
400
$525
Chatglm
$8
$16
128
$2
Xai
-