ボタンエッジ公式微博は本日、正式にドウバオ大モデル1.6-visionをリリースしました。紹介によると、ドウバオ大モデル1.6-visionは、ドウバオ大モデルシリーズ初のツール呼び出し能力を持つ視覚的深層思考モデルで、より強力な汎用マルチモーダル理解と推論能力を持ち、Responses APIもサポートしています。

image.png

ドウバオ大モデル1.6-visionには以下の3つの利点があります:

ツールを呼び出して、視覚的理解をより正確にします。画像をその思考プロセスに組み込むことで、画像の位置指定、切り取り、ポイント選択、線引き、縮小、回転などの細かい処理が可能になります。また、人間が「全体から部分へ」という視覚的推論プロセスを模倣し、推論の説明性を高めつつ、画像操作を効率的かつ正確に行うことができます。

アプリケーション開発がより効率的になります。Responses APIをサポートしており、開発者はツールの呼び出しを選択的にできます。これにより、Agent開発におけるコード量が大幅に減少し、開発効率が向上し、開発者にとってアプリケーション開発がより効率的になります。

モデルのコストパフォーマンスがさらに向上しました。前バージョンの視覚的理解モデルであるドウバオ-1.5-thinking-vision-proと比較して、総合的なコストが約50%低下し、より低コストでより強力な性能を解放することができ、コストパフォーマンスが再度向上しました!