Qwen a récemment ouvert officiellement le cadre de compréhension des documents et de recherche sémantique WeKnora (WeKnora). Il s'agit d'une solution intelligente pour les questions-réponses, conçue spécifiquement pour les scénarios de documents complexes et hétérogènes, visant à offrir un processus complet et contrôlable, efficace, aux questions-réponses sur les documents professionnels.

WeKnora utilise une conception modulaire moderne, créant une chaîne complète de compréhension et de recherche de documents, comprenant des modules centraux tels que le traitement des documents, la modélisation des connaissances, le moteur de recherche, le raisonnement et la génération ainsi que l'interface d'interaction. Le niveau de traitement des documents se charge de l'analyse et du prétraitement des documents de différents formats, transformant le contenu non structuré en données structurées ; le niveau de modélisation des connaissances construit une représentation des connaissances grâce à des technologies telles que la vectorisation, le fractionnement, le graphe de connaissances et l'indexation ; le niveau du moteur de recherche intègre plusieurs stratégies de recherche pour réaliser un rappel précis et efficace des contenus ; le niveau du raisonnement et de la génération utilise des grands modèles linguistiques pour comprendre et générer les résultats de recherche ; le niveau d'interaction et de présentation fournit une interface utilisateur intuitive et des interfaces API standard.

微信截图_20250807093605.png

WeKnora est basé sur des grands modèles linguistiques (LLM), intégrant des technologies telles que le prétraitement multimodal, l'indexation vectorielle sémantique, le rappel intelligent et la génération de raisonnement par grand modèle. Ses points forts techniques comprennent un moteur d'intelligence multimodale puissant, capable d'analyser avec précision le contenu textuel et graphique dans les PDF, les Word et les images, d'extraire les informations sémantiques textuelles, tabulaires et visuelles, et de construire un centre de connaissances structuré uniforme en combinant OCR et modélisation multimodale. La conception d'une chaîne de RAG modulaire permet de combiner librement les stratégies de recherche, les grands modèles linguistiques et les bases de données vectorielles, ce qui permet une intégration sans effort avec des plateformes comme Ollama, de basculer facilement entre les modèles principaux tels que Qwen et DeepSeek, répondant ainsi aux besoins d'adaptation efficace des bibliothèques de connaissances d'entreprise. Le raisonnement précis et la prise de décision fiable intègrent le déploiement privé, la compréhension approfondie du contexte en plusieurs tours et l'évaluation visuelle de l'ensemble de la chaîne, fournissant un soutien fiable aux scénarios sensibles. De plus, WeKnora prend en charge le déploiement local et les images Docker, compatible avec les environnements privés et hors ligne, dispose d'un système de journalisation interne et offre une visibilité globale, aidant les administrateurs à gérer efficacement.

WeKnora est largement applicable à divers scénarios de questions-réponses sur les documents professionnels, notamment la gestion des connaissances d'entreprise, l'analyse des documents scientifiques, le support technique des produits, le contrôle juridique et légal ainsi que l'assistance médicale. Il propose une interface Web intuitive, permettant de télécharger facilement divers documents via glisser-déposer, d'identifier automatiquement la structure du document et d'extraire les connaissances principales, de créer un index. Le système prend également en charge la visualisation du graphe de connaissances, capable de transformer les documents en graphes de connaissances, montrant les relations entre les différents paragraphes du document, améliorant ainsi la pertinence et la portée des résultats de recherche.

Les méthodes de déploiement de WeKnora sont variées. En ce qui concerne le déploiement local, il propose une solution complète de déploiement Docker, permettant aux utilisateurs de lancer rapidement le service en utilisant simplement quelques commandes. En outre, WeKnora, en tant que cadre technique central de la plateforme d'ouverture des dialogues WeChat, prend également en charge le déploiement sans code, permettant aux utilisateurs de déployer rapidement des services de questions-réponses intelligentes dans l'écosystème WeChat en téléchargeant simplement les connaissances, offrant ainsi une expérience "interrogation immédiate réponse immédiate". Grâce à la plateforme d'ouverture des dialogues WeChat, les capacités de questions-réponses intelligentes de WeKnora peuvent être intégrées sans effort dans des scénarios WeChat tels que les comptes officiels et les mini-applications, améliorant ainsi l'expérience d'interaction des utilisateurs.