QVQ-Max est un modèle de raisonnement visuel développé par l'équipe Qwen, capable de comprendre et d'analyser le contenu des images et des vidéos, et de fournir des solutions. Il ne se limite pas à la saisie de texte, mais peut également traiter des informations visuelles complexes. Il convient aux utilisateurs ayant besoin de traitement d'informations multimodales, dans des contextes éducatifs, professionnels et personnels. Ce produit est développé sur la base de techniques d'apprentissage profond et de vision par ordinateur, et convient aux étudiants, aux professionnels et aux créatifs. Cette version est la première version, et des optimisations seront apportées par la suite.