中國團隊發佈全球最大開源多模態數據集,2B參數模型性能創新高
近日,來自多家中國科研機構的研究團隊重磅發佈了名爲Infinity-MM的超大規模多模態數據集,並基於該數據集訓練出了一個性能卓越的AI模型Aquila-VL-2B。這一突破爲多模態AI發展注入了新動力。Infinity-MM數據集規模驚人,共包含四大類數據:1000萬條圖像描述、2440萬條通用視覺指令數據、600萬條精選高質量指令數據,以及300萬條由GPT-4等AI模型生成的數據。研究團隊採用開源AI模型RAM++進行圖像分析和信息提取,並通過獨特的六大類分類系統確保生成數據的質量和多樣性。圖源備註:圖片由AI生成