小米が最新のマルチモーダル大規模モデル Xiaomi MiMo-VL-7B-2508 をオープンソース化
小米の大規模モデルチームは、最新のマルチモーダル大規模モデル Xiaomi MiMo-VL-7B-2508 をオープンソース化したと発表しました。このモデルには RL および SFT の2つのバージョンが含まれています。公式データによると、新しいモデルは学問的推論、ドキュメントの理解、グラフィックインターフェースの位置特定、ビデオの理解の4つの核心的な能力において記録を更新しました。特に MMMU ベンチマークでは初めて70点を突破し、ChartQA は94.4に上昇し、ScreenSpot-v2 は92.5、VideoMME は70.8に改善されました。