Avant de découvrir PaddleOCR, comprenons d’abord PaddlePaddle. Fort des années de recherche technologique et d’applications commerciales de Baidu, PaddlePaddle est la première plateforme d’apprentissage profond de niveau industriel open source, technologiquement leader et entièrement fonctionnelle de Chine, intégrant des cadres de formation et d’inférence en apprentissage profond, des bibliothèques de modèles de base, des kits de développement de bout en bout et des composants d’outils riches. À ce jour, Flying Paddle a rassemblé plus de 2,65 millions de développeurs, servi 100 000 entreprises et généré 340 000 modèles basés sur la plateforme open source d’apprentissage profond Flying Paddle. Flying Paddle aide les développeurs à réaliser rapidement des idées d’IA et à lancer rapidement des services d’IA. Aider de plus en plus d’industries à compléter l’autonomisation de l’IA et à réaliser une mise à niveau de l’intelligence industrielle.
Site officiel :La connexion hyperlientérée est visible.
PaddleOCR vise à créer une bibliothèque d’outils OCR riche, performante et pratique pour aider les utilisateurs à entraîner de meilleurs modèles et à les implémenter.
Premier regard sur les rendus :
(Photo originale)
(Après identification,La bordure étiquetée est tracée de lui-même en fonction du résultat retourné)
Baidu Flying Paddle nécessite un environnement Windows
Windows 7/8/10 Pro/Enterprise (64 bits) La version GPU prend en charge CUDA 9.0/10.0/10.1/10.2/11.0, et ne prend en charge qu’une seule carte Version Python 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 bits) PIP version 20.2.2+ (64 bits)
Note : Si vous utilisez une version supérieure de Python, comme Python 3.9, vous obtiendrez l’erreur suivante :
ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle Solution:
Téléchargez une version prise en charge, par exemple : version 3.8.8, adresse de téléchargement :La connexion hyperlientérée est visible.
Vous devez confirmer que Python et pip sont 64 bits, que l’architecture du processeur est x86_64 (ou x64, Intel 64, AMD64), et actuellement PaddlePaddle ne prend pas en charge l’architecture arm64. La première ligne en dessous affiche « 64 bits », et la seconde ligne affiche « x86_64 », « x64 » ou « AMD64 ».
D:\itsvse>python --version Python 3.8.8
D:\itsvse>pip --version PIP 20.2.3 de C :\Program Files\Python38\lib\Site-Packages\PIP (Python 3.8)
D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())" 64 bits AMD64 Windows 10 installe la version CPU PaddlePaddle
Commander:
Vérifiez l’installation
Une fois l’installation terminée, vous pouvez utiliser python ou python3 pour entrer l’interpréteur python, entrer import paddle, puis taper paddle.utils.run_check()
si elle apparaîtPaddlePaddle est installé avec succès !, indiquant que vous avez réussi à installer. Comme montré ci-dessous :
(Ne pas exécuter) commande de désinstallation :
Installer PaddleHub
Commander:
Télécharger Clone PaddleOCR
Utilisez la commande git clone pour télécharger sous condition, puis téléchargez-la inconditionnellement directement dans un paquet compressé, puis décompressez-le, adresse :La connexion hyperlientérée est visible.
Je l’ai téléchargé directement et dézippé dans le dossier :D :\itsvse\PaddleOCR-release-2.0.
Téléchargez le modèle d’inférence
Avant d’installer le module de service, vous devez préparer le modèle d’inférence et le placer sur le bon chemin.
Modèle de détection :La connexion hyperlientérée est visible. Classificateur de direction :La connexion hyperlientérée est visible. Identifiez le modèle :La connexion hyperlientérée est visible.
Après l’avoir téléchargé, je l’ai placé sous le dossier D :\itsvse\PaddleOCR-release-2.0\deploy\model, comme indiqué ci-dessous :
Installer le module de service série détection + identification
Modifiez la configuration « D :\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py » comme suit :
Utilisez la fenêtre cmd pour exécuter la commande suivante dans le dossier D :\itsvse\PaddleOCR-release-2.0 :
Remarque:Pour modifier le fichier python sous \hubserving\ocr_system, vous devez réinstaller le déploiement ou exécuter la commande ci-dessus。
Les erreurs peuvent être signalées comme suit :
ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb' Il suffit d’utiliser pip pour installer, par exemple : pip install imgaug
L’installation est la suivante :
[2021-03-15 15:59:37,549] [ INFO] - Désinstallation réussie ocr_system [2021-03-15 15:59:38,237] [ INFO] - Installation réussie ocr_system-1.0.0
Démarrez le service ocr_system
Ici, les paramètres de configuration utilisent le fichier de configuration, modifiant d’abord la configuration « D :\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json », comme suit :
Commencez le service avec la commande suivante :
Testez l’image avec le client Python
Mettez l’image que vous souhaitez tester dans le dossier « D :\itsvse\PaddleOCR-release-2.0\doc\imgs1 », et exécutez la commande suivante dans D :\itsvse\PaddleOCR-release-2.0 :
test_hubserving.py Le code source est le suivant :
Testez l’image avec le client .NET Core
Téléchargez directement le code, comme suit :
{"msg » :" »,"results » :[[{"confidence » :0.9994004964828491,"text » :"Blog Statistics,"text_region » :[[23,18],[85,18],[85,33],[23,32]]},{"confidence » :0.9951881170272827,"texte » :"Bonjour à tous, Je suis un petit, et j’ai commencé un blog le 5 avril 2015 »,"text_region » :[[22,74],[471,74],[471,93],[22,93]]},{"confidence » :0.9985174536705017,"texte » :"À ce jour2021-03-1516:19:52 »,"text_region » :[[23,111],[ 217,111],[217,126],[23,126]]},{"confiance » :0,9762932062149048,"texte » :"Cumulatif à propos. .NET 1184 articles, 6844154 fois au total, 10505 commentaires au total »,"text_region » :[[24,153],[448,153],[448,165],[24,165]]},{"confidence » :0.9847920536994934,"texte » : « Total de 2807 articles, lectures cumulées 14210224 fois, 19074 critiques »,"text_region » :[[24,177],[414,177],[414,188],[24,189]]}]],"statut » :"000"}
Comme j’utilise le côté serveur pour le déploiement de machines virtuelles, il arrive que des erreurs mémoire soient signalées :
Oubliez de retenir la mémoire de 268418688 taille. Solution temporaire : redémarrer le serveur.
Ressources:
La connexion hyperlientérée est visible.
La connexion hyperlientérée est visible.
(Fin)
|