Phi-3.5-visionは、Microsoftが開発した軽量かつ最新のマルチモーダルモデルです。合成データと厳選された公開利用可能なウェブサイトを含むデータセットに基づいて構築されており、テキストとビジュアルに関する高品質で緻密な推論データに焦点を当てています。Phi-3モデルファミリーに属し、厳格な拡張プロセスを経ており、教師あり微調整と直接選好最適化を組み合わせて、正確な指示遵守と強力なセキュリティ対策を確保しています。