美团LongCatチームがUNO-Benchを発表。44種類のタスクと5つのモーダルをカバーし、1250の全モーダルサンプルと2480の単一モーダルサンプルで、マルチモーダルモデルの性能を包括的に評価。....