上海AI研、多モーダル大規模モデル「InternVL3.5」をオープンソース化。階層型強化学習や動的視覚解像度ルーティングなどの新技術を採用し、推論能力や汎用性能を向上。1B~241Bの全サイズ版を提供し、オープンソースモデルの性能基準を更新。....
OpenGVLab
InternVL3_5-38Bは、オープンソースのマルチモーダルモデルInternVL3.5シリーズの一員で、機能性、推論能力、推論効率の面で著しい進歩を遂げています。多言語をサポートし、画像テキストからテキストへのタスクに適用でき、カスケード強化学習フレームワークとビジュアル解像度ルーター技術を用いて性能を最適化しています。
InternVL3.5-4Bはオープンソースのマルチモーダルモデルシリーズの中規模バージョンで、汎用性、推論能力、推論効率の面で顕著な進歩を遂げ、GUIインタラクションなどの新機能をサポートしています。このモデルはカスケード強化学習フレームワークと視覚解像度ルーター技術を採用し、効率的なマルチモーダル理解と推論を実現しています。
InternVL3.5はオープンソースのマルチモーダルモデルファミリーの新メンバーで、InternVLシリーズの汎用性、推論能力、推論効率を大幅に向上させ、GUIインタラクションなどの新機能をサポートし、オープンソースのマルチモーダル大規模言語モデルの先進水準に達しています。
InternVL3.5-4Bはオープンソースのマルチモーダルモデルシリーズの中規模版で、4.7億のパラメータを含み、先進的なカスケード強化学習フレームワークとビジュアル解像度ルーター技術を採用しており、マルチモーダル推論能力と効率を大幅に向上させています。
InternVL3.5-14BはInternVLシリーズのオープンソースのマルチモーダルモデルで、汎用性、推論能力、推論効率が大幅に向上し、GUIインタラクションなどの新機能をサポートし、商用モデルとの性能差を縮小しました。
InternVL3.5-1BはInternVLシリーズのオープンソースマルチモーダルモデルで、パラメータ数は11億で、そのうちビジュアルパラメータが3億、言語パラメータが8億を含んでいます。このモデルは汎用性、推論能力、推論効率を大幅に向上させ、GUIインタラクションなどの新機能をサポートしています。