Tencent hat kürzlich den neuen Dokumentenverstehens- und Semantik-Suchframework WeKnora (Weina La) offiziell als Open Source veröffentlicht. Dies ist eine intelligente Antwortlösung, die speziell für Dokumentenszenarien mit komplexer Struktur und heterogenen Inhalten entwickelt wurde und darauf abzielt, effiziente und kontrollierbare End-to-End-Prozesse für Unternehmensdokumente bereitzustellen.
WeKnora nutzt eine moderne modulare Design, um eine vollständige Dokumentenverstehen- und Suchkette zu bilden, die Kernmodule wie Dokumentenverarbeitung, Wissensmodellierung, Suchmotor, Inferenzgenerierung und Interaktionsdarstellung umfasst. Die Ebene der Dokumentenverarbeitung ist für die Analyse und Vorbereitung von Dokumenten in verschiedenen Formaten verantwortlich und wandelt unstrukturierte Inhalte in strukturierte Daten um; die Wissensmodellierungsschicht baut mit Technologien wie Vektorisierung, Blockbildung, Wissensgraphen und Indizes Wissensdarstellungen; die Suchmotor-Schicht integriert verschiedene Suchstrategien, um präzise und effiziente Inhaltsrückrufe zu ermöglichen; die Inferenz- und Generierungsschicht verwendet große Sprachmodelle, um die Ergebnisse der Suche zu verstehen und zu generieren; die Interaktionsdarstellungsschicht bietet eine intuitive Benutzeroberfläche und standardisierte API-Schnittstellen.
WeKnora basiert auf großen Sprachmodellen (LLM), kombiniert Technologien wie multimodale Vorverarbeitung, semantische Vektorindexierung, intelligente Rückrufstrategien und großes Modell-Reasoning. Zu den technischen Highlights gehört ein leistungsstarker multimodaler Wahrnehmungsmotor, der in PDFs, Word-Dokumenten und Bildern vorkommende Text- und Grafikinhalte genau analysieren kann, Text, Tabellen und Bildsemantikinformationen extrahieren und OCR sowie multimodale Modellierungstechniken nutzen, um einen einheitlichen strukturierten Wissenskern zu bilden. Die modulare RAG-Verarbeitungslinie unterstützt die freie Kombination von Suchstrategien, großen Sprachmodellen und Vektordatenbanken und kann nahtlos mit Plattformen wie Ollama integriert werden. Es ermöglicht flexibles Umschalten zwischen den Hauptmodellen Qwen und DeepSeek und erfüllt die Anforderungen an effiziente Anpassungen des Unternehmenswissensbestands. Präzises Reasoning und vertrauenswürdige Entscheidungen sind mit privater Bereitstellung, tiefem Verständnis mehrerer Kontexte und umfassender Visualisierungsbewertung verbunden, was hochsensiblen Szenarien zuverlässige Wissensunterstützung bietet. Darüber hinaus unterstützt WeKnora lokale Bereitstellung und Docker-Images, ist kompatibel mit privaten Cloud-Infrastrukturen und offline-Umgebungen, verfügt über ein internes Überwachungsprotokollsystem und bietet eine vollständige Beobachtbarkeit, um Administratoren bei der effizienten Verwaltung zu unterstützen. Ein aus der Box kommendes Interaktionserlebnis beinhaltet einen One-Click-Start-Skript und eine intuitive Web-Oberfläche, sodass auch nichttechnische Benutzer schnell Dokumentenindizes, intelligente Fragen und Antworten usw. bereitstellen und anwenden können.
WeKnora eignet sich für viele Unternehmensdokumentenfragen-Szenarien, darunter Unternehmenswissensmanagement, wissenschaftliche Literaturanalyse, Produkt-support, Rechts- und Compliance-Prüfung sowie medizinische Wissensunterstützung. Es bietet eine intuitive Web-Oberfläche, unterstützt das Verschieben und Hochladen verschiedener Dokumente, identifiziert automatisch die Dokumentenstruktur und extrahiert die zentralen Wissensinhalte und erstellt Indizes. Das System unterstützt auch die visuelle Darstellung von Wissensgraphen, kann Dokumente in Wissensgraphen umwandeln und zeigt die Beziehungen zwischen verschiedenen Abschnitten eines Dokuments an, um die Relevanz und Breite der Suchergebnisse zu verbessern.
WeKnora bietet flexible Bereitstellungsmöglichkeiten. Bei lokaler Bereitstellung bietet es eine vollständige Docker-Bereitstellungslösung, bei der Benutzer nur einfache Befehle eingeben müssen, um den Dienst schnell zu starten. Darüber hinaus ist WeKnora als zentrales Technologieframework des WeChat Dialogue Open Platform bekannt und unterstützt auch eine Code-freie Bereitstellung. Benutzer müssen nur ihre Wissensdaten hochladen, um im WeChat-Ökosystem schnell eine intelligente Antwortdienstleistung bereitzustellen und „sofortige Antwort“-Erfahrungen zu ermöglichen. Durch die WeChat Dialogue Open Platform kann die intelligente Antwortfähigkeit von WeKnora nahtlos in WeChat-Szenarien wie Offizielle Konten und Mini-Programme integriert werden und die Benutzerinteraktionserfahrung verbessern.