KI-Nachrichten

Verpassen Sie keinen Moment der globalen KI-Innovation

KI-Tagesübersicht

Tägliche Drei-Minuten-KI-Branchentrends

KI-Zeitleiste

Meilensteine der KI-Industrie

Al hardware

die artillerie der artillerie

KI-Monetarisierungs-Leitfaden

Neueste Fälle

KI-Monetarisierungsfall-Sharing

Bildersammlung

KI-Bilderstellungs-Monetarisierungsfälle

Videosammlung

KI-Videoerstellungs-Monetarisierungsfälle

Audiosammlung

KI-Audioerstellungs-Monetarisierungsfälle

Inhaltssammlung

KI-Content-Writing-Monetarisierungsfälle

KI-Tutorials

Neueste Tutorials

Kostenlose Weitergabe der neuesten KI-Tutorials

KI-Produkt-Rankings

KI-Produkt-Ranking

Zeigt das Ranking der Gesamtbesuche von KI-Websites

KI-Traffic-Wachstumsranking

Verfolgen Sie die am schnellsten wachsenden KI-Websites nach Traffic

KI-Traffic-Rückgangsranking

Konzentrieren Sie sich auf KI-Websites mit signifikanten Traffic-Einbrüchen

KI-Wochenranking

Zeigt das wöchentliche Besuchsranking von KI-Websites

Beliebte Länder-Rankings

Vereinigte Staaten

KI-Websites, die bei US-Nutzern am beliebtesten sind

China

KI-Websites, die bei chinesischen Nutzern am beliebtesten sind

Indien

KI-Websites, die bei indischen Nutzern am beliebtesten sind

Brasilien

KI-Websites, die bei brasilianischen Nutzern am beliebtesten sind

Beliebte Kategorie-Rankings

Bildgenerierung

Ranking der Gesamtbesuche von KI-Bildgenerierungs-Websites

Persönlicher Assistent

Ranking der Gesamtbesuche von KI-Websites für persönliche Assistenten

Charaktergenerierung

Ranking der Gesamtbesuche von KI-Websites zur Charaktergenerierung

Videogenerierung

Ranking der Gesamtbesuche von KI-Videogenerierungs-Websites

Beliebte Open-Source-Datenrankings

KI-Projektranking

GitHub beliebte KI-Projekte nach Gesamt-Stars

KI-Projektwachstumsranking

GitHub beliebte KI-Projekte nach Wachstumsrate

KI-Entwickler-Ranking

GitHub beliebtes KI-Entwickler-Ranking

KI-Organisationsranking

GitHub beliebtes KI-Organisationsranking

Beliebte Open-Source-Kategorien

Deepseek

GitHub beliebte Deepseek Open-Source-Projekte

TTS

GitHub beliebte TTS Open-Source-Projekte

LLM

GitHub beliebte LLM Open-Source-Projekte

ChatGPT

GitHub beliebte ChatGPT Open-Source-Projekte

KI-Open-Source-Projektbibliothek

Überblick

Überblick über GitHub beliebte KI-Open-Source-Projekte

Produktbibliothek Tool Navigation MCP

Baidu PaddleOCR 3.0 Open Source Veröffentlichung: Genauigkeit der OCR steigt um 13%

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 5 Minuten Lesezeit · May 22, 2025

Am 20. Mai 2025 veröffentlichte das PaddleOCR-Team von Baidu die Version 3.0 des PaddleOCR und öffnete sie für die Öffentlichkeit. Diese neue Version hat bedeutende Fortschritte in der Texterkennungsgenauigkeit, der Unterstützung mehrerer Sprachen, der Handschriftenerkennung sowie der hochpräzisen Dokumentenanalyse erzielt und hebt damit die technische Leistungsfähigkeit und den Anwendungswert von PaddleOCR im OCR-Bereich weiter an.

Seit seiner Veröffentlichung hat sich PaddleOCR durch seine wissenschaftlich fortschrittlichen Algorithmen und praxisorientierte Implementierungen sowohl in Forschung als auch in der Industrie großer Beliebtheit erfreut und wird in zahlreiche bekannte Open-Source-Projekte integriert. Die veröffentlichte Version 3.0 ist vollständig mit der offiziellen Version 3.0 von PaddlePaddle kompatibel. Neben der Verbesserung der Texterkennungsgenauigkeit unterstützt sie auch die Erkennung verschiedener Texttypen und Handschriften, um komplexe Dokumentenanalysen mit hoher Präzision zu ermöglichen. Zusätzlich steigerte die Kombination mit dem Wénxīn-Datenversion 4.5Turbo die Präzision bei der Extraktion kritischer Informationen und fügte Unterstützung für nationale Hardware wie Kunlun-Chip und Ascend hinzu.

Eines der Kernmerkmale von PaddleOCR 3.0 ist das allumfassende Texterkennungsmodell PP-OCRv5. Dieses Modell ermöglicht die Erkennung von fünf Textarten - vereinfachtes Chinesisch, traditionelles Chinesisch, Chinesische Umlaute, Englisch und Japanisch – sowie der Erkennung komplexer Textsituationen wie Handschrift, vertikalen Schriftsatz, Umlaute und selten vorkommenden Zeichen. Im Vergleich zur Vorgänger-Version stieg die Gesamtgenauigkeit um 13 Prozentpunkte, was einen Spitzenplatz in der Branche erreichte. Durch eine einheitliche Modellarbeitstechnik wurden verschiedene Texttypen nahtlos erkannt, was die Installation vereinfachte und die Gesamtgenauigkeit und Geschwindigkeit erhöhte.

Im Bereich der Dokumentenanalyse hat PaddleOCR 3.0 die allgemeine Dokumentenanalysemethode PP-StructureV3 vorgestellt. Diese Methode verstärkt die Fähigkeit zur Erkennung von Layouts, Tabellen und Formeln und fügt die Fähigkeit zur Analyse von Diagrammen und zur Wiederherstellung der Lesereihenfolge in mehrspaltigen Dokumenten hinzu. Außerdem kann das Ergebnis in Markdown- und JSON-Format konvertiert werden. PP-StructureV3 führt viele Open-Source- und geschlossene Systeme in der Benchmark-OmniDocBench vorbei und zeigt seine Stärke bei der hochpräzisen Analyse vielfältiger Dokumentenformate.

Zusätzlich hat PaddleOCR 3.0 die intelligente Dokumentenverstehungsmethode PP-ChatOCRv4 veröffentlicht. Diese Methode nativ die Wénxīn-Datenversion 4.5Turbo unterstützt und die Genauigkeit der kritischen Informationsextraktion um 15 Prozentpunkte gegenüber der Vorgängerversion verbesserte. PP-ChatOCRv4 kombiniert die Vorteile von großen und kleinen Modellen und unterstützt die Offline-Verwendung des multimodalen Dokumentenverständnismodells PP-DocBee2, um komplexe Dokumenteninformationen wie Layoutanalyse, selten vorkommende Zeichen, Mehrseiten-PDFs, Tabellen und Stempel in einem einzigen Schritt zu extrahieren.

Die Veröffentlichung von PaddleOCR 3.0 spiegelt nicht nur die kontinuierliche Innovation von Baidu in der OCR-Technologie wider, sondern bietet auch Entwicklern noch stärkere und benutzerfreundlichere Werkzeuge, um ihre AI-Anwendungen schneller umzusetzen.

Open-Source-Adresse:

https://github.com/PaddlePaddle/PaddleOCR

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Willkommen im Bereich [KI-Tagesbericht]! Hier ist Ihr Leitfaden, um jeden Tag die Welt der künstlichen Intelligenz zu erkunden. Jeden Tag präsentieren wir Ihnen die Hotspots im KI-Bereich, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu erkennen und innovative KI-Produktanwendungen zu verstehen.

—— Erstellt von der AIbase-Tagesberichtgruppe