Information

Latest AI News

Explore AI Frontiers, Master Industry Trends

AI Daily Brief

Your Daily AI Brief - Never Miss What's Next

Information

AI Product Finder

Smart Product Discovery - Comprehensive Market Intelligence

AI Product Rankings

AI Product Power Rankings - Performance, Buzz & Trends

AI Product Submit

Submit Your AI Product - Amplify Reach & Drive Growth

Tools

AI Tools Directory

Discover The Best AI Websites & Tools

Information

AI Models Finder

Comprehensive AI Models Collection for All Your Development & Research Needs

LLM Leaderboard

AI LLM Power Rankings - Performance, Buzz & Trends

Model Providers

Discover Trusted AI Model Partners - Guaranteed Reliable Support

Submit Your Model

Submit Your Model Info & Services - Precision Marketing & User Targeting

Tools

Compare LLMs

Multi-Dimensional Large Model Comparison - Find Your Perfect Match

LLM Cost Calculator

Calculate AI Model Costs Accurately - Optimize Your Budget

LLM Arena

Multi-Model Real-Time Evaluation & Quick Output Comparison

Information

MCP Servers

Discover Popular AI-MCP Services - Find Your Perfect Match Instantly

MCP Client

Easy MCP Client Integration - Access Powerful AI Capabilities

MCP Case Tutorials

Master MCP Usage - From Beginner to Expert

MCP Ranking

Top MCP Service Performance Rankings - Find Your Best Choice

MCP Service Submission

Publish & Promote Your MCP Services

Tools

MCP Playground

Test MCP Services Freely - Quick Online Experience

MCP Inspector

Quick MCP Service Testing - Fast Deployment

GEO Services

Achieve Dominant Visibility in AI Search for Your Business or Brand with GEO Services

AI Search Visibility Checker

Detect brand's visibility on AI platforms

Tools

AI Model Compatibility Checker

Free PC Hardware Test for DeepSeek & Llama

Information

AI Dataset Collection

Large-scale datasets and benchmarks for training, evaluating, and testing models to measure

Tools

Intelligent Document Recognition

Comprehensive Text Extraction and Document Processing Solutions for Users

AI Tutorial

Alibaba lance un modèle Qwen3-VL compact pour améliorer l'efficacité des IA multimodales et accélérer le déploiement sur les appareils de bord

AIbase基地

Publié leActualités IA · 4 minutes de lecture · Oct 15, 2025

Le département d'intelligence artificielle d'Alibaba a officiellement lancé aujourd'hui une version compacte de la série de modèles linguistiques visuels Qwen3-VL, proposant des variantes avec 4 milliards et 8 milliards de paramètres. Cette initiative marque un grand progrès vers l'application plus large des technologies avancées en intelligence artificielle multimodale sur les appareils aux bords et dans les environnements à ressources limités.

Progrès considérables, petits modèles à la hauteur des géants

Les modèles 4B et 8B présentés cette fois-ci sont disponibles en versions Instruct et Thinking, et ont été optimisés pour des capacités multimodales essentielles telles que le raisonnement STEM, les questions-réponses visuelles (VQA), la reconnaissance optique de caractères (OCR), la compréhension vidéo et les tâches d'agent.

Selon les résultats des tests standardisés publiés, ces petits modèles se distinguent dans plusieurs catégories, surpassant même des concurrents comme Gemini2.5Flash Lite et GPT-5Nano. Plus remarquable encore, leur performance est capable de rivaliser avec le modèle Qwen2.5-VL-72B plus volumineux publié il y a seulement six mois, démontrant une efficacité extrême en termes de paramètres.

Optimisation des ressources, promotion de la démocratisation de l'IA

La principale caractéristique du nouveau modèle réside dans une utilisation significativement réduite de la VRAM, ce qui permet de le faire fonctionner directement sur des matériels de consommation tels que les ordinateurs portables et les smartphones. Pour améliorer davantage l'efficacité, Alibaba propose également une version quantifiée FP8, qui réduit encore davantage la consommation de ressources sans compromettre les capacités fondamentales. Comme l'a dit un membre de l'équipe Qwen impliqué dans le développement : « Les petits modèles VL sont adaptés au déploiement et ont un impact important dans les domaines des téléphones portables et des robots. »

Itérations rapides, partage open source

Le lancement de ce modèle compact poursuit la feuille de route initiée en septembre par la série Qwen3-VL (le modèle phare compte 235 milliards de paramètres). Précédemment, Alibaba avait déjà lancé la variante 30B-A3B à la fin du mois d'octobre, obtenant des résultats comparables à ceux de GPT-5Mini et Claude4Sonnet avec seulement 30 milliards de paramètres actifs. Cette itération rapide est perçue comme un signe fort de la volonté d'Alibaba de promouvoir la démocratisation de l'intelligence artificielle performante, notamment pour les systèmes incarnés comme les robots.

Adresse :

https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe

https://github.com/QwenLM/Qwen3-VL/tree/main/cookbooks

Qwen3-VL NéologismeIA Modèledelangagevisuel Terminologiedemarqueproduit

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

Journal de l'IA : OpenAI lance le navigateur Atlas ; Qwen3-VL de Tongyi ajoute deux tailles de modèle, 2B et 32B ; Baidu lance un grand modèle d'augmentation des preuves cycliques

OpenAI lance ChatGPT Atlas, un navigateur intégrant une IA pour concurrencer Chrome. Avec des agents intelligents dans chaque onglet, il marque son expansion vers les plateformes internet.....

Oct 22, 2025

Nouvelle avancée en IA médicale ! Baichuan lance une version médecin de ChatGPT pour rendre le diagnostic plus précis

Baichuan-M2Plus, modèle IA médical de Baichuan, améliore l'assistance médicale avec un raisonnement probant à six sources, réduisant les hallucinations et surpassant OpenEvidence.....

Oct 22, 2025

Qwen3-VL d'Alibaba Ajout de deux tailles de modèle, 2B et 32B, qui fonctionnent facilement sur smartphone

Alibaba lance Qwen3-VL en modèles 2B et 32B, couvrant des scénarios visuels-langagiers légers à hautes performances. Modèle Instruct pour réponses rapides/stables, modèle Thinking pour le raisonnement. Améliore flexibilité et développement.....

Oct 22, 2025

Qwen3-VL : une nouvelle extension du groupe ! Les modèles Qwen3-VL de 2B et 32B sont ajoutés, la matrice open source est entièrement mise à jour

Alibaba Cloud lance Qwen3-VL, deux nouveaux modèles denses (2B et 32B), portant la série à 24 modèles open source. Cette gamme complète renforce l'écosystème et la compétitivité.....

Oct 22, 2025

YouTube lance un outil d'identification des visages en IA pour lutter contre les contenus falsifiés

YouTube lance un outil IA de détection de deepfakes. Les créateurs vérifiés peuvent signaler et demander la suppression de vidéos suspectes via YouTube Studio. Déploiement progressif en cours.....

Oct 22, 2025

Sensation ! Le PDG de Vercel affirme que Kimi K2 dépasse GPT-5 en précision dans les applications d'intelligence artificielle, avec une amélioration de 50 % !

PDG de Vercel vante Kimi K2, modèle open-source chinois surpassant GPT-5 et Claude Sonnet 4.5 : +50% précision, 5x plus rapide.....

Oct 21, 2025

Toutiao lance Sa2VA : une segmentation intelligente multimodale combinant LLaVA et SAM-2

ByteDance lance Sa2VA, combinant LLaVA pour la compréhension vidéo globale et SAM-2 pour la segmentation précise, améliorant l'analyse vidéo.....

Oct 21, 2025

Concours de trading avec des modèles d'IA ! DeepSeek obtient un rendement supérieur à 14 %, Gemini 2.5 Pro subit une perte de 40 %

Le labo IA nof1 lance Alpha Arena sur Hyperliquid : 6 modèles dont GPT-5 et Gemini 2.5 Pro sont testés en trading réel avec 10 000 $ chacun, évaluant leurs décisions et gestion des risques en finance.....

Oct 21, 2025

Commentaire d'Andrej Karpathy sur le papier DeepSeek-OCR : l'entrée image pourrait devenir une nouvelle voie pour les modèles linguistiques à grande échelle

Ex-directeur de Tesla Andrej Karpathy suggère que les images pourraient remplacer le texte comme entrée des LLM, jugée inefficace. Cette proposition suscite des débats dans la communauté IA.....

Oct 21, 2025

Le chatbot OpenEvidence du secteur médical lève 2 milliards de dollars, atteignant une valeur de 6 milliards de dollars

OpenEvidence, société d'IA médicale, lève 200M$ à 6Md$ de valorisation. Fondée en 2022, elle aide les soignants à accéder rapidement aux connaissances médicales.....

Oct 21, 2025

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

Alibaba lance un modèle Qwen3-VL compact pour améliorer l'efficacité des IA multimodales et accélérer le déploiement sur les appareils de bord

AIbase基地

Progrès considérables, petits modèles à la hauteur des géants

Optimisation des ressources, promotion de la démocratisation de l'IA

Itérations rapides, partage open source

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

Journal de l'IA : OpenAI lance le navigateur Atlas ; Qwen3-VL de Tongyi ajoute deux tailles de modèle, 2B et 32B ; Baidu lance un grand modèle d'augmentation des preuves cycliques

Nouvelle avancée en IA médicale ! Baichuan lance une version médecin de ChatGPT pour rendre le diagnostic plus précis

Qwen3-VL d'Alibaba Ajout de deux tailles de modèle, 2B et 32B, qui fonctionnent facilement sur smartphone

Qwen3-VL : une nouvelle extension du groupe ! Les modèles Qwen3-VL de 2B et 32B sont ajoutés, la matrice open source est entièrement mise à jour

YouTube lance un outil d'identification des visages en IA pour lutter contre les contenus falsifiés

Sensation ! Le PDG de Vercel affirme que Kimi K2 dépasse GPT-5 en précision dans les applications d'intelligence artificielle, avec une amélioration de 50 % !

Toutiao lance Sa2VA : une segmentation intelligente multimodale combinant LLaVA et SAM-2

Concours de trading avec des modèles d'IA ! DeepSeek obtient un rendement supérieur à 14 %, Gemini 2.5 Pro subit une perte de 40 %

Commentaire d'Andrej Karpathy sur le papier DeepSeek-OCR : l'entrée image pourrait devenir une nouvelle voie pour les modèles linguistiques à grande échelle

Le chatbot OpenEvidence du secteur médical lève 2 milliards de dollars, atteignant une valeur de 6 milliards de dollars

GEO Services