["OneLLM 是一種多模態對齊的統一框架","使用通用編碼器和統一的投影模塊與 LLM 對齊多模態輸入","支持圖像、音頻、視頻等多種模態數據的理解","實驗證明在多個任務中優於現有方法","具有較強的零樣本能力"]
一框架,統一所有語言模態