Før vi lærer PaddleOCR at kende, lad os først forstå PaddlePaddle. Baseret på Baidus mange års forskning i deep learning-teknologi og forretningsapplikationer er PaddlePaddle Kinas første open source, teknologisk førende og fuldt funktionsdygtige industriel deep learning-platform, der integrerer deep learning kernetrænings- og inferensrammer, grundlæggende modelbiblioteker, end-to-end udviklingssæt og rige værktøjskomponenter. På nuværende tidspunkt har Flying Paddle samlet mere end 2,65 millioner udviklere, betjent 100.000 virksomheder og genereret 340.000 modeller baseret på Flying Paddle open source deep learning-platformen. Flying Paddle hjælper udviklere med hurtigt at realisere AI-idéer og hurtigt lancere AI-tjenester. Hjælp flere og flere industrier med at fuldføre AI-empowerment og realisere industriel intelligent opgradering.
Officiel hjemmeside:Hyperlink-login er synlig.
PaddleOCR sigter mod at skabe et rigt, førende og praktisk OCR-værktøjsbibliotek, der hjælper brugere med at træne bedre modeller og implementere dem.
Først kig på renderingerne:
(Originalbillede)
(Efter identifikation,Den mærkede kant tegnes alene baseret på det returnerede resultat)
Baidu Flying Paddle kræver Windows-miljø
Windows 7/8/10 Pro/Enterprise (64bit) GPU-versionen understøtter CUDA 9.0/10.0/10.1/10.2/11.0 og understøtter kun ét kort Python version 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 bit) PIP version 20.2.2+ (64 bit)
Bemærk: Hvis du bruger en højere version af Python, såsom Python 3.9, vil du få følgende fejl:
ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle Opløsning:
Download en understøttet version, for eksempel: version 3.8.8, downloadadresse:Hyperlink-login er synlig.
Du skal bekræfte, at Python og pip er 64-bit, og at processorarkitekturen er x86_64 (eller x64, Intel 64, AMD64) arkitektur, og i øjeblikket understøtter PaddlePaddle ikke arm64-arkitekturen. Den første linje nedenunder sender "64bit", og den anden linje sender "x86_64", "x64" eller "AMD64".
D:\itsvse>python --version Python 3.8.8
D:\itsvse>pip --version PIP 20.2.3 fra C:\Program Files\python38\lib\site-packages\pip (Python 3.8)
D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())" 64bit AMD64 Windows 10 installerer PaddlePaddle CPU-versionen
Kommando:
Verificér installationen
Når installationen er færdig, kan du bruge python eller python3 til at indtaste python-tolken, indtaste import paddle og derefter skrive paddle.utils.run_check()
hvis det dukker opPaddlePaddle er installeret med succes!, hvilket indikerer, at du har installeret det med succes. Som vist nedenfor:
(Udfør ikke) afinstaller-kommando:
Installer PaddleHub
Kommando:
Download Clone PaddleOCR
Brug git-klonkommandoen til at downloade betinget, og download den ubetinget direkte til en komprimeret pakke og pak den derefter ud, adresse:Hyperlink-login er synlig.
Jeg downloadede den direkte og pakkede den ud i mappen :D:\itsvse\PaddleOCR-release-2.0.
Download inferensmodellen
Før du installerer servicemodulet, skal du forberede inferensmodellen og sætte den i den korrekte bane.
Detektionsmodel:Hyperlink-login er synlig. Retningsklassifikator:Hyperlink-login er synlig. Identificer modellen:Hyperlink-login er synlig.
Efter at have downloadet den, placerede jeg den under D:\itsvse\PaddleOCR-release-2.0\deploy\model-mappen, som vist nedenfor:
Installer detektions- + identifikationsserie-servicemodulet
Ændr konfigurationen "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py" som følger:
Brug cmd-vinduet til at udføre følgende kommando under D:\itsvse\PaddleOCR-release-2.0-mappen:
Bemærkning:For at ændre python-filen under \hubserving\ocr_system, skal du geninstallere udrulningen eller udføre ovenstående kommando。
Fejl kan rapporteres som følger:
ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb' Brug bare pip til at installere, for eksempel: pip install imgaug
Installationen er som følger:
[2021-03-15 15:59:37,549] [ INFO ] - Afinstalleret ocr_system [2021-03-15 15:59:38,237] [INFO] - Installeret med succes ocr_system-1.0.0
Start ocr_system service
Her bruger konfigurationsparametrene konfigurationsfilen, først modificerer konfigurationen "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json" som følger:
Start servicen med følgende kommando:
Test billedet med python-klienten
Læg det image, du vil teste, i mappen "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1", og kør følgende kommando i D:\itsvse\PaddleOCR-release-2.0:
test_hubserving.py Kildekoden er som følger:
Test billedet med .NET Core-klienten
Upload koden direkte som følger:
{"msg":"","results":[{"confidence":0.9994004964828491,"text":"Blog Statistics","text_region":[[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"Hej alle sammen, Jeg er en lille, og jeg startede en blog den 5. april 2015","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.9985174536705017,"text":"Pr. nu2021-03-1516:19:52","text_region":[[23,111],[ 217,111],[217,126],[23,126]]},{"confidence":0.9762932062149048,"text":"Kumulativ om. .NET 1184 artikler, 6844154 gange i alt, 10.505 kommentarer i alt","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"konfidens":0.9847920536994934,"tekst":"I alt 2807 artikler, kumulativ læsning 14210224 gange, 19074 anmeldelser","text_region":[[24,177],[414,177],[414,188],[24,189]]}]],"status":"000"}
Da jeg bruger serversiden af virtual machine-implementering, rapporteres der nogle gange hukommelsesfejl:
Fejl i at allokere hukommelse af 268418688 størrelse. Midlertidig løsning, genstart serveren.
Ressourcer:
Hyperlink-login er synlig.
Hyperlink-login er synlig.
(Slut)
|