上海AI實驗室開源發佈多模態大模型InternVL3.5,採用級聯強化學習、動態視覺分辨率路由等創新技術,實現推理能力、部署效率和通用性能全面提升。該模型提供1B至241B全量級版本,刷新開源模型性能標杆,在多任務上達到領先水平。
OpenGVLab
InternVL3.5-4B是開源多模態模型系列的中等規模版本,包含4.7億參數,採用先進的級聯強化學習框架和視覺分辨率路由器技術,顯著提升了多模態推理能力和效率。
InternVL3.5是開源多模態模型家族的新成員,顯著提升了InternVL系列的通用性、推理能力和推理效率,支持GUI交互等新功能,達到開源多模態大語言模型的先進水平。
InternVL3.5-4B是開源多模態模型系列中的中等規模版本,在通用性、推理能力和推理效率上取得顯著進展,支持GUI交互等新能力。該模型採用級聯強化學習框架和視覺分辨率路由器技術,實現了高效的多模態理解與推理。
InternVL3.5-14B是InternVL系列的開源多模態模型,顯著提升了通用性、推理能力和推理效率,支持GUI交互等新功能,縮小了與商業模型的性能差距。
InternVL3.5-1B是InternVL系列的開源多模態模型,參數量為1.1B,包含0.3B視覺參數和0.8B語言參數。該模型顯著提升了通用性、推理能力和推理效率,支持GUI交互等新功能。
InternVL3_5-38B是開源多模態模型InternVL3.5系列中的一員,在多功能性、推理能力和推理效率方面取得了顯著進展。它支持多語言,可應用於圖像文本到文本的任務,採用級聯強化學習框架和視覺分辨率路由器技術優化性能。