Aujourd'hui, alors que la technologie de l'intelligence artificielle se développe à grande vitesse, Alibaba a officiellement ouvert son tout nouveau modèle vectoriel en série Qwen3-Embedding le 6 juin. Ce modèle, basé sur la plateforme Qwen3, est optimisé pour des tâches comme la représentation du texte, la recherche et le classement, marquant ainsi un autre grand pas en avant pour Alibaba dans le domaine de l'IA.
Comparé à sa version précédente, Qwen3-Embedding présente une performance améliorée de plus de 40 % dans des tâches clés telles que la recherche, le regroupement et la classification du texte. Cette avancée non seulement renforce sa compétitivité technique, mais lui permet également de surpasser des modèles de premier plan tels que les modèles de Google Gemini Embedding, text-embedding-3-large d'OpenAI et multilingual-e5-large-instruct de Microsoft, en obtenant les meilleures performances (SOTA) parmi ses pairs.
Source de l'image : Généré par IA
En termes simples, un modèle vectoriel peut être considéré comme un "traducteur" pour l'IA. Il convertit des informations non structurées telles que le texte et les images en vecteurs compréhensibles pour les machines, permettant ainsi une classification, une recherche et un tri efficaces des informations. Basé sur le modèle Qwen3, l'équipe de Tongyi a utilisé diverses méthodes telles que l'entraînement par contraste, SFT et la fusion de modèles pour créer ce nouveau modèle vectoriel, qui inclut le modèle d'incorporation de texte Qwen3-Embedding et le modèle de réorganisation de texte Qwen3-Reranker.
Il convient de noter que le modèle vectoriel Qwen3 possède une capacité linguistique multilingue puissante, supportant plus de 100 langues, y compris plusieurs langages de programmation, ce qui démontre une excellente capacité de recherche dans les langues multiples, translinguistiques et codées. Cela offre aux développeurs mondiaux un espace d'application beaucoup plus large.
Le modèle vectoriel Qwen3 ouvert comprend actuellement 9 versions couvrant différentes tailles (0.6B, 4B, 8B, etc.) et des versions GGUF. Les développeurs peuvent choisir un modèle approprié selon leurs besoins et combiner les modules librement, voire personnaliser des vecteurs ou des instructions pour optimiser spécifiquement certaines tâches, langues et scénarios. Cette flexibilité augmentera considérablement l'efficacité des développeurs.
Actuellement, les modèles Qwen3Embedding et Reranker sont disponibles en open source sur de nombreuses plateformes telles que Moda Community, Hugging Face et GitHub. Les développeurs peuvent également utiliser directement les services API via Alibaba Cloud Bailian. Depuis l'ouverture au public le 29 avril, les grands modèles Qwen3 ont obtenu de bons résultats en tant que champions open source dans plusieurs listes internationales.