Innan vi lär känna PaddleOCR, låt oss först förstå PaddlePaddle. Baserat på Baidus många års forskning inom djupinlärningsteknologi och affärsapplikationer är PaddlePaddle Kinas första open source, teknologiskt ledande och fullt fungerande industriella djupinlärningsplattform, som integrerar kärnutbildnings- och inferensramverk för djupinlärning, grundläggande modellbibliotek, end-to-end-utvecklingskit och rika verktygskomponenter. För närvarande har Flying Paddle samlat mer än 2,65 miljoner utvecklare, servat 100 000 företag och genererat 340 000 modeller baserade på Flying Paddles öppna källkodsplattform för djupinlärning. Flying Paddle hjälper utvecklare att snabbt förverkliga AI-idéer och snabbt lansera AI-tjänster. Hjälper fler och fler industrier att slutföra AI-förstärkning och realisera industriell intelligent uppgradering.
Officiell webbplats:Inloggningen med hyperlänken är synlig.
PaddleOCR syftar till att skapa ett rikt, ledande och praktiskt OCR-verktygsbibliotek för att hjälpa användare att träna bättre modeller och implementera dem.
Först titta på renderingarna:
(Originalbild)
(Efter identifiering,Den märkta ramen ritas själv baserat på det returnerade resultatet)
Baidu Flying Paddle kräver Windows-miljö
Windows 7/8/10 Pro/Enterprise (64-bitars) GPU-versionen stöder CUDA 9.0/10.0/10.1/10.2/11.0 och stöder endast ett enda kort Python version 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 bitars) PIP version 20.2.2+ (64 bitar)
Obs: Om du använder en högre version av Python, som Python 3.9, kommer du att få följande fel:
ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle Lösning:
Ladda ner en stödd version, till exempel: version 3.8.8, nedladdningsadress:Inloggningen med hyperlänken är synlig.
Du måste bekräfta att Python och pip är 64-bitars, och att processorarkitekturen är x86_64 (eller x64, Intel 64, AMD64) arkitektur, och för närvarande stöder inte PaddlePaddle arm64-arkitekturen. Den första raden nedanför ger ut "64 bit", och den andra raden ger ut "x86_64", "x64" eller "AMD64".
D:\itsvse>python --version Python 3.8.8
D:\itsvse>pip --version Pip 20.2.3 från C:\Program Files\Python38\lib\Site-Packages\pip (Python 3.8)
D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())" 64bit AMD64 Windows 10 installerar PaddlePaddle CPU-versionen
Befallning:
Verifiera installationen
När installationen är klar kan du använda python eller python3 för att gå in i python-tolken, ange import paddle och sedan skriva paddle.utils.run_check()
om det dyker uppPaddlePaddle installeras framgångsrikt!, vilket indikerar att du har installerat det framgångsrikt. Som visas nedan:
(Utför inte) avinstallera kommandot:
Installera PaddleHub
Befallning:
Ladda ner Clone PaddleOCR
Använd git-klonkommandot för att ladda ner villkorligt, och ladda ner det ovillkorligt direkt till ett komprimerat paket och packa upp det, adress:Inloggningen med hyperlänken är synlig.
Jag laddade ner den direkt och packade upp den till mappen :D:\itsvse\PaddleOCR-release-2.0.
Ladda ner inferensmodellen
Innan du installerar servicemodulen behöver du förbereda inferensmodellen och placera den i rätt väg.
Detektionsmodell:Inloggningen med hyperlänken är synlig. Riktningsklassificerare:Inloggningen med hyperlänken är synlig. Identifiera modellen:Inloggningen med hyperlänken är synlig.
Efter att ha laddat ner den placerade jag den under mappen D:\itsvse\PaddleOCR-release-2.0\deploy\model, som visas nedan:
Installera servicemodulen för detektering + identifiering
Modifiera konfigurationen "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py" enligt följande:
Använd cmd-fönstret för att utföra följande kommando under D:\itsvse\PaddleOCR-release-2.0-mappen:
Anmärkning:För att ändra pythonfilen under \hubserving\ocr_system måste du installera om distributionen eller köra ovanstående kommando。
Fel kan rapporteras enligt följande:
ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb' Använd bara pip för att installera, till exempel: pip installera imgaug
Installationen är som följer:
[2021-03-15 15:59:37,549] [INFO] - Avinstallerade ocr_system [2021-03-15 15:59:38,237] [ INFO ] - Installerade ocr_system-1.0.0 framgångsrikt
Starta ocr_system tjänsten
Här använder konfigurationsparametrarna konfigurationsfilen, först modifierar du konfigurationen "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json" enligt följande:
Starta tjänsten med följande kommando:
Testa bilden med python-klienten
Lägg bilden du vill testa i mappen "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1" och kör följande kommando i D:\itsvse\PaddleOCR-release-2.0:
test_hubserving.py Källkoden är följande:
Testa bilden med .NET Core-klienten
Ladda upp koden direkt, enligt följande:
{"msg":"","results":[{"confidence":0.9994004964828491,"text":"Blog Statistics","text_region":[[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"Hej allihopa, Jag är en liten skitstövel och startade en blogg den 5 april 2015","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.9985174536705017,"text":"Från och med nu2021-03-1516:19:52","text_region":[[23,111],[ 217,111],[217,126],[23,126]]},{"confidence":0.9762932062149048,"text":"Kumulativt om. .NET 1184 artiklar, 6844154 gånger totalt, 10 505 kommentarer totalt","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"confidence":0.9847920536994934,"text":"Totalt 2807 artiklar, kumulativ läsning 14210224 gånger, 19074 recensioner","text_region":[[24,177],[414,177],[414,188],[24,189]]}]],"status":"000"}
Eftersom jag använder serversidan av virtuell maskinutplacering rapporteras ibland minnesfel:
Misslyckas med att allokera minne av 268418688 storlek. Tillfällig lösning, starta om servern.
Resurser:
Inloggningen med hyperlänken är synlig.
Inloggningen med hyperlänken är synlig.
(Slut)
|