.NET Core appelle Baidu PaddleOCR pour reconnaître les images et les textes

Petite ordure · Publié sur 15/03/2021 18:21:43

Avant de découvrir PaddleOCR, comprenons d’abord PaddlePaddle. Fort des années de recherche technologique et d’applications commerciales de Baidu, PaddlePaddle est la première plateforme d’apprentissage profond de niveau industriel open source, technologiquement leader et entièrement fonctionnelle de Chine, intégrant des cadres de formation et d’inférence en apprentissage profond, des bibliothèques de modèles de base, des kits de développement de bout en bout et des composants d’outils riches. À ce jour, Flying Paddle a rassemblé plus de 2,65 millions de développeurs, servi 100 000 entreprises et généré 340 000 modèles basés sur la plateforme open source d’apprentissage profond Flying Paddle. Flying Paddle aide les développeurs à réaliser rapidement des idées d’IA et à lancer rapidement des services d’IA. Aider de plus en plus d’industries à compléter l’autonomisation de l’IA et à réaliser une mise à niveau de l’intelligence industrielle.

Site officiel :La connexion hyperlientérée est visible.

PaddleOCR vise à créer une bibliothèque d’outils OCR riche, performante et pratique pour aider les utilisateurs à entraîner de meilleurs modèles et à les implémenter.

Premier regard sur les rendus :

(Photo originale)

(Après identification,La bordure étiquetée est tracée de lui-même en fonction du résultat retourné）

Baidu Flying Paddle nécessite un environnement Windows

Windows 7/8/10 Pro/Enterprise (64 bits)
La version GPU prend en charge CUDA 9.0/10.0/10.1/10.2/11.0, et ne prend en charge qu’une seule carte
Version Python 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 bits)
PIP version 20.2.2+ (64 bits)

Note : Si vous utilisez une version supérieure de Python, comme Python 3.9, vous obtiendrez l’erreur suivante :

ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle

Solution:

Téléchargez une version prise en charge, par exemple : version 3.8.8, adresse de téléchargement :La connexion hyperlientérée est visible.

La connexion est visible.

Vous devez confirmer que Python et pip sont 64 bits, que l’architecture du processeur est x86_64 (ou x64, Intel 64, AMD64), et actuellement PaddlePaddle ne prend pas en charge l’architecture arm64. La première ligne en dessous affiche « 64 bits », et la seconde ligne affiche « x86_64 », « x64 » ou « AMD64 ».

D:\itsvse>python --version
Python 3.8.8

D:\itsvse>pip --version
PIP 20.2.3 de C :\Program Files\Python38\lib\Site-Packages\PIP (Python 3.8)

D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())"
64 bits
AMD64

Windows 10 installe la version CPU PaddlePaddle

Commander:

La connexion est visible.

Vérifiez l’installation

Une fois l’installation terminée, vous pouvez utiliser python ou python3 pour entrer l’interpréteur python, entrer import paddle, puis taper paddle.utils.run_check()

si elle apparaîtPaddlePaddle est installé avec succès !, indiquant que vous avez réussi à installer. Comme montré ci-dessous :

(Ne pas exécuter) commande de désinstallation :

La connexion est visible.

Installer PaddleHub

Commander:

La connexion est visible.

Télécharger Clone PaddleOCR

Utilisez la commande git clone pour télécharger sous condition, puis téléchargez-la inconditionnellement directement dans un paquet compressé, puis décompressez-le, adresse :La connexion hyperlientérée est visible.

Je l’ai téléchargé directement et dézippé dans le dossier :D :\itsvse\PaddleOCR-release-2.0.

Téléchargez le modèle d’inférence

Avant d’installer le module de service, vous devez préparer le modèle d’inférence et le placer sur le bon chemin.

Modèle de détection :La connexion hyperlientérée est visible.
Classificateur de direction :La connexion hyperlientérée est visible.
Identifiez le modèle :La connexion hyperlientérée est visible.

Après l’avoir téléchargé, je l’ai placé sous le dossier D :\itsvse\PaddleOCR-release-2.0\deploy\model, comme indiqué ci-dessous :

Installer le module de service série détection + identification

Modifiez la configuration « D :\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py » comme suit :

La connexion est visible.

Utilisez la fenêtre cmd pour exécuter la commande suivante dans le dossier D :\itsvse\PaddleOCR-release-2.0 :

La connexion est visible.

Remarque:Pour modifier le fichier python sous \hubserving\ocr_system, vous devez réinstaller le déploiement ou exécuter la commande ci-dessus。

Les erreurs peuvent être signalées comme suit :

ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb'

Il suffit d’utiliser pip pour installer, par exemple : pip install imgaug

L’installation est la suivante :

[2021-03-15 15:59:37,549] [ INFO] - Désinstallation réussie ocr_system
[2021-03-15 15:59:38,237] [ INFO] - Installation réussie ocr_system-1.0.0

Démarrez le service ocr_system

Ici, les paramètres de configuration utilisent le fichier de configuration, modifiant d’abord la configuration « D :\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json », comme suit :

La connexion est visible.

Commencez le service avec la commande suivante :

La connexion est visible.

Testez l’image avec le client Python

Mettez l’image que vous souhaitez tester dans le dossier « D :\itsvse\PaddleOCR-release-2.0\doc\imgs1 », et exécutez la commande suivante dans D :\itsvse\PaddleOCR-release-2.0 :

La connexion est visible.

test_hubserving.py Le code source est le suivant :

La connexion est visible.

Testez l’image avec le client .NET Core

Téléchargez directement le code, comme suit :

La connexion est visible.

{"msg » :" »,"results » :[[{"confidence » :0.9994004964828491,"text » :"Blog Statistics,"text_region » :[[23,18],[85,18],[85,33],[23,32]]},{"confidence » :0.9951881170272827,"texte » :"Bonjour à tous, Je suis un petit, et j’ai commencé un blog le 5 avril 2015 »,"text_region » :[[22,74],[471,74],[471,93],[22,93]]},{"confidence » :0.9985174536705017,"texte » :"À ce jour2021-03-1516:19:52 »,"text_region » :[[23,111],[ 217,111],[217,126],[23,126]]},{"confiance » :0,9762932062149048,"texte » :"Cumulatif à propos. .NET 1184 articles, 6844154 fois au total, 10505 commentaires au total »,"text_region » :[[24,153],[448,153],[448,165],[24,165]]},{"confidence » :0.9847920536994934,"texte » : « Total de 2807 articles, lectures cumulées 14210224 fois, 19074 critiques »,"text_region » :[[24,177],[414,177],[414,188],[24,189]]}]],"statut » :"000"}

Comme j’utilise le côté serveur pour le déploiement de machines virtuelles, il arrive que des erreurs mémoire soient signalées :

Oubliez de retenir la mémoire de 268418688 taille.

Solution temporaire : redémarrer le serveur.

Ressources:

La connexion hyperlientérée est visible.
La connexion hyperlientérée est visible.

(Fin)

Taygo · Publié sur 16/06/2021 12:38:26

Mark Yibo, viens apprendre

Petite ordure · Publié sur 13/11/2024 09:44:47

Tutoriel d’installation de PaddlePaddle sur Windows
https://www.itsvse.com/thread-10873-1-1.html

Petite ordure · Publié sur 31/12/2024 13:25:03

.NET/C# utilise FastDeploy pour déployer des modèles OCR afin de reconnaître le texte
https://www.itsvse.com/thread-10911-1-1.html

Petite ordure · Publié sur 24/04/2025 09:20:18

.NET/C# utilise la reconnaissance de texte Tesseract vers OCR pour les images
https://www.itsvse.com/thread-10994-1-1.html

[.NET Core] .NET Core appelle Baidu PaddleOCR pour reconnaître les images et les textes

Articles connexes

Sections vues