InternVL2_5-4B-MPO-AWQは、画像とテキストの相互作用タスクにおけるモデルのパフォーマンス向上に焦点を当てた、多様なモダリティを持つ大規模言語モデル(MLLM)です。InternVL2.5シリーズをベースとし、混合嗜好最適化(MPO)によって性能がさらに向上しています。単一画像や複数画像、動画データなど、多様な入力に対応可能であり、画像とテキストの相互理解が必要な複雑なタスクに適しています。InternVL2_5-4B-MPO-AWQはその優れた多様なモダリティ能力により、画像とテキストからテキストを生成するタスクに強力なソリューションを提供します。