HuggingFaceM4/idefics-80b-instructは、画像とテキストの両方をインプットとして受け入れ、関連するテキストを出力するオープンソースのマルチモーダルモデルです。視覚的質問応答や画像キャプション生成などのタスクで優れたパフォーマンスを発揮し、汎用的なインテリジェントアシスタントモデルとして機能します。Hugging Faceチームによって開発され、オープンデータセットを用いてトレーニングされており、無料で利用できます。