PaddleOCR v2.8.0, une boîte à outils de reconnaissance de texte développée au sein du framework d'apprentissage profond open source PaddlePaddle, a bénéficié d'une mise à jour majeure. Cette version intègre des technologies OCR de pointe, notamment les solutions primées du concours d'algorithmes PaddleOCR, telles que SVTRv2 pour la reconnaissance de texte dans les scènes et SLANet-LCNetV2 pour la reconnaissance de tableaux, établissant ainsi une nouvelle référence dans le domaine de la reconnaissance optique de caractères (OCR).
Parallèlement, la structure du projet a été profondément optimisée. Les modules non essentiels ont été migrés vers un nouveau référentiel, permettant au projet de se concentrer sur les technologies OCR essentielles. De plus, des problèmes récurrents tels que l'impossibilité d'exécuter le modèle après la mise à jour de Backbone, les conflits de dépendances de la version NumPy et les ralentissements sur Mac ont été résolus, améliorant ainsi l'expérience utilisateur.
Cette nouvelle version inclut également la correction du problème de perte de résultats OCR lors de l'analyse de la mise en page, l'introduction de pyproject.toml pour se conformer à la spécification PEP518, ainsi que des améliorations telles que l'optimisation de l'opération de fenêtre glissante pour l'inférence sur les grandes images, renforçant ainsi la stabilité, la compatibilité et les performances du logiciel. Le soutien et les contributions de la communauté open source ont été essentiels à chaque avancée de PaddleOCR v2.8.0 ; les membres du PMC et les contributeurs sont particulièrement remerciés pour leurs efforts.
PaddleOCR est en train de construire un site web dédié aux tutoriels et à la documentation, qui offrira une fonction de recherche par mots clés et une interface intuitive et agréable.
Adresse du projet : https://github.com/PaddlePaddle/PaddleOCR