Voordat we PaddleOCR leren kennen, laten we eerst PaddlePaddle begrijpen. Gebaseerd op Baidu's jarenlange onderzoek naar deep learning-technologie en zakelijke toepassingen is PaddlePaddle China's eerste open source, technologisch toonaangevende en volledig functionele industriële deep learning-platform, dat diepe learning kerntrainings- en inferentieframeworks, basismodelbibliotheken, end-to-end ontwikkelkits en rijke toolcomponenten integreert. Op dit moment heeft Flying Paddle meer dan 2,65 miljoen ontwikkelaars verzameld, 100.000 ondernemingen bediend en 340.000 modellen gegenereerd gebaseerd op het open source deep learning-platform Flying Paddle. Flying Paddle helpt ontwikkelaars om AI-ideeën snel te realiseren en AI-diensten snel te lanceren. Helpen steeds meer sectoren om AI-empowerment te voltooien en industriële intelligente upgrades te realiseren.
Officiële website:De hyperlink-login is zichtbaar.
PaddleOCR streeft ernaar een rijke, toonaangevende en praktische OCR-toolbibliotheek te creëren om gebruikers te helpen betere modellen te trainen en te implementeren.
Kijk eerst naar de renderings:
(Originele foto)
(Na identificatie,De gelabelde rand wordt vanzelf getekend op basis van het teruggegeven resultaat)
Baidu Flying Paddle vereist een Windows-omgeving
Windows 7/8/10 Pro/Enterprise (64bit) De GPU-versie ondersteunt CUDA 9.0/10.0/10.1/10.2/11.0 en ondersteunt slechts één kaart Python versie 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 bit) PIP versie 20.2.2+ (64 bit)
Opmerking: Als je een hogere versie van Python gebruikt, zoals Python 3.9, krijg je de volgende foutmelding:
ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle Oplossing:
Download een ondersteunde versie, bijvoorbeeld: versie 3.8.8, downloadadres:De hyperlink-login is zichtbaar.
Je moet bevestigen dat Python en pip 64-bit zijn, en dat de processorarchitectuur x86_64 (of x64, Intel 64, AMD64) architectuur is, en momenteel ondersteunt PaddlePaddle geen arm64-architectuur. De eerste regel eronder geeft "64bit" en de tweede regel geeft "x86_64", "x64" of "AMD64" uit.
D:\itsvse>python --version Python 3.8.8
D:\itsvse>pip --version PIP 20.2.3 van C:\Program Files\Python38\lib\Site-Packages\pip (Python 3.8)
D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())" 64bit AMD64 Windows 10 installeert de PaddlePaddle CPU-versie
Bevelen:
Controleer de installatie
Na voltooiing van de installatie kun je python of python3 gebruiken om de python-interpreter in te voeren, import paddle invoeren en vervolgens paddle.utils.run_check() typen
als het verschijntPaddlePaddle is succesvol geïnstalleerd!, wat aangeeft dat je succesvol hebt geïnstalleerd. Zoals hieronder getoond:
(Niet uitvoeren) verwijderen commando:
Installeer PaddleHub
Bevelen:
Download Clone PaddleOCR
Gebruik het git clone-commando om conditionally te downloaden, download het onvoorwaardelijk direct in een gecomprimeerd pakket en pak het vervolgens weer uit, adres:De hyperlink-login is zichtbaar.
Ik heb het direct gedownload en uitgepakt in de map :D:\itsvse\PaddleOCR-release-2.0.
Download het inferentiemodel
Voordat je de servicemodule installeert, moet je het inferentiemodel voorbereiden en het in het juiste pad plaatsen.
Detectiemodel:De hyperlink-login is zichtbaar. Richtingsclassifier:De hyperlink-login is zichtbaar. Identificeer het model:De hyperlink-login is zichtbaar.
Na het downloaden heb ik het onder de D:\itsvse\PaddleOCR-release-2.0\deploy\model-map geplaatst, zoals hieronder weergegeven:
Installeer de detectie + identificatie serie servicemodule
Pas de configuratie "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py" als volgt aan:
Gebruik het cmd-venster om het volgende commando uit te voeren onder de D:\itsvse\PaddleOCR-release-2.0 map:
Opmerking:Om het pythonbestand onder \hubserving ocr_system\ te wijzigen, moet je de deployment opnieuw installeren of het bovenstaande commando uitvoeren。
Fouten kunnen als volgt worden gerapporteerd:
ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb' Gebruik gewoon pip om te installeren, bijvoorbeeld: pip install imgaug
De installatie is als volgt:
[2021-03-15 15:59:37,549] [ INFO ] - Succesvol verwijderd ocr_system [2021-03-15 15:59:38,237] [ INFO ] - Succesvol geïnstalleerd ocr_system-1.0.0
Start de ocr_system dienst
Hier gebruiken de configuratieparameters het configuratiebestand, pas eerst de configuratie "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json" aan, als volgt:
Begin de dienst met het volgende commando:
Test de afbeelding met de python-client
Plaats de image die je wilt testen in de map "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1" en voer het volgende commando uit in D:\itsvse\PaddleOCR-release-2.0:
test_hubserving.py De broncode is als volgt:
Test het beeld met de .NET Core-client
Upload de code direct, als volgt:
{"msg":"","results":[{"confidence":0.9994004964828491,"text":"Blog Statistics","text_region":[[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"Hallo allemaal, Ik ben een klein smeerlapje, en ik ben op 5 april 2015 een blog begonnen","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.9985174536705017,"text":"Vanaf nu2021-03-1516:19:52","text_region":[[23,111],[ 217,111],[217,126],[23,126]]},{"confidence":0.9762932062149048,"text":"Cumulatief over. .NET 1184 artikelen, 6844154 keer in totaal, 10.505 reacties in totaal","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"betrouwbaarheid":0.9847920536994934,"text":"In totaal 2807 artikelen, cumulatief gelezen 14210224 maal, 19074 recensies","text_region":[[24,177],[414,177],[414,188],[24,189]]}]],"status":"000"}
Omdat ik de serverkant van virtual machine-implementatie gebruik, worden er soms geheugenfouten gemeld:
Geheugen van 268418688 grootte niet toegewezen. Tijdelijke oplossing: de server opnieuw opstarten.
Weg:
De hyperlink-login is zichtbaar.
De hyperlink-login is zichtbaar.
(Einde)
|