夕小瑤科技說 | 別再吹 GPT-4V 了!連北京烤鴨都不認識,你敢信??
["新提出的圖像推理基準HallusionBench用於檢驗GPT-4V等視覺語言模型,發現其存在語言幻覺和視覺錯覺問題。","GPT-4V等模型在HallusionBench中易受參數化記憶影響產生語言幻覺,答案錯誤率高達90%。","GPT-4V等在HallusionBench中容易產生幾何等視覺錯覺,當前視覺能力仍然有限。","簡單圖像操作就可輕易誤導GPT-4V等模型,反映出其脆弱性。","LLaVA-1.5的知識儲備不如GPT-4V,存在常識性錯誤。"]