書生・浦語霊筆多モーダル大規模モデルがバージョン2.5にアップグレード 長いコンテキストに対応、画像・ビデオの理解力はGPT-4Vに迫る
書生・浦語霊筆(InternLM-XComposer)2.5バージョンは、上海人工知能研究所によって開発され、長いコンテキストの入出力能力を特長としています。96Kの長さでスムーズに動作し、24Kのインターリーブされた画像テキストデータでトレーニングされています。主なアップグレードポイントには、高解像度画像の理解、詳細なビデオの理解、複数ラウンドの複数画像の対話などが含まれます。応用として、Webページの作成、高品質な画像付き記事の作成などが可能です。評価によると、16個のベンチマークテストでオープンソースの最先端モデルを上回り、重要なタスクではGPT-4V、Gemと肩を並べます。