Le compte officiel de Volc Engine a annoncé aujourd'hui la publication officielle du modèle Dabao 1.6-vision. Selon les informations fournies, le modèle Dabao 1.6-vision est le premier modèle visuel profond du groupe Dabao à posséder des capacités d'appel d'outils. Il dispose d'une meilleure capacité d'interprétation et de raisonnement multimodaux généraux et prend en charge l'API Responses.

image.png

Le modèle Dabao 1.6-vision présente trois avantages principaux :

Appel d'outils, compréhension visuelle plus précise. Avec sa capacité différente d'appel d'outils, il intègre les images dans sa chaîne de pensée, permettant des traitements précis tels que la localisation, la coupe, le clic, le tracé, le zoom, la rotation des images. En simulant le processus de raisonnement visuel humain "du global au local", cela renforce l'explicabilité du raisonnement tout en accomplissant efficacement et précisément les opérations sur les images.

Développement d'applications plus efficace. Prend en charge l'API Responses, permettant aux développeurs de choisir librement l'appel d'outils, réduisant considérablement la quantité de code pendant le processus de développement d'Agent, améliorant ainsi l'efficacité du développement et rendant le développement d'applications plus efficace pour les développeurs.

Meilleur rapport qualité-prix du modèle. Comparé au modèle précédent de compréhension visuelle Doubao-1.5-thinking-vision-pro, le coût global a diminué d'environ 50 %, ce qui permet d'obtenir une performance plus forte à un coût plus faible, et le rapport qualité-prix s'améliore à nouveau !