Pirms mēs iepazīstamies ar PaddleOCR, vispirms sapratīsim PaddlePaddle. Balstoties uz Baidu gadiem ilgu dziļās mācīšanās tehnoloģiju izpēti un biznesa lietojumiem, PaddlePaddle ir Ķīnas pirmā atvērtā koda, tehnoloģiski vadošā un pilnībā funkcionējošā rūpnieciskā līmeņa dziļās mācīšanās platforma, kas integrē dziļās mācīšanās pamatapmācības un secinājumu sistēmas, pamata modeļu bibliotēkas, pilnīgus izstrādes komplektus un bagātīgus rīku komponentus. Šobrīd Flying Paddle ir pulcējis vairāk nekā 2.65 miljonus izstrādātāju, apkalpojis 100 000 uzņēmumu un ģenerējis 340 000 modeļu, kuru pamatā ir atvērtā koda dziļās mācīšanās platforma Flying Paddle. Flying Paddle palīdz izstrādātājiem ātri realizēt AI idejas un ātri uzsākt AI pakalpojumus. Palīdziet arvien vairāk nozaru pabeigt AI iespējas un realizēt rūpniecisko inteliģento modernizāciju.
Oficiālā mājas lapa:Hipersaites pieteikšanās ir redzama.
PaddleOCR mērķis ir izveidot bagātīgu, vadošu un praktisku OCR rīku bibliotēku, lai palīdzētu lietotājiem apmācīt labākus modeļus un tos ieviest.
Vispirms apskatiet atveidojumus:
(Oriģinālais attēls)
(Pēc identifikācijasMarķētā apmale tiek uzzīmēta pati, pamatojoties uz atgriezto rezultātu)
Baidu Flying Paddle nepieciešama Windows vide
Windows 7/8/10 Pro/Enterprise (64 bitu) GPU versija atbalsta CUDA 9.0/10.0/10.1/10.2/11.0 un atbalsta tikai vienu karti Python versija 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 biti) PIP versija 20.2.2+ (64 bitu)
Piezīmes: Ja izmantojat jaunāku Python versiju, piemēram, Python 3.9, jūs saņemsiet šādu kļūdu:
ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle Šķīdums:
Lejupielādējiet atbalstīto versiju, piemēram: versiju 3.8.8, lejupielādes adrese:Hipersaites pieteikšanās ir redzama.
Jums jāapstiprina, ka Python un pip ir 64 bitu, un procesora arhitektūra ir x86_64 (vai x64, Intel 64, AMD64) arhitektūra, un pašlaik PaddlePaddle neatbalsta arm64 arhitektūru. Pirmā rinda zem izvada "64bit", bet otrā rinda izvada "x86_64", "x64" vai "AMD64".
D:\itsvse>python --version Python 3.8.8
D:\itsvse>pip --version PIP 20.2.3 no C:\Program Files\Python38\lib\Site-Packages\PiP (Python 3.8)
D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())" 64 bitu AMD64 Windows 10 instalē PaddlePaddle CPU versiju
Pavēlēt:
Instalācijas pārbaude
Kad instalēšana ir pabeigta, varat izmantot python vai python3, lai ievadītu python tulku, ievadiet import paddle un pēc tam ierakstiet paddle.utils.run_check()
Ja tas parādāsPaddlePaddle ir veiksmīgi uzstādīts!, norādot, ka esat veiksmīgi instalēts. Kā parādīts zemāk:
(Neizpildīt) atinstalēšanas komanda:
Instalējiet PaddleHub
Pavēlēt:
Lejupielādēt Clone PaddleOCR
Izmantojiet komandu git clone, lai lejupielādētu nosacīti, un bez nosacījumiem lejupielādējiet to tieši saspiestā pakotnē un pēc tam izsaiņojiet to, adrese:Hipersaites pieteikšanās ir redzama.
Es to lejupielādēju tieši un izspiedu mapē :D:\itsvse\PaddleOCR-release-2.0.
Secinājumu modeļa lejupielāde
Pirms pakalpojuma moduļa instalēšanas jums jāsagatavo secinājumu modelis un jāievieto pareizajā ceļā.
Noteikšanas modelis:Hipersaites pieteikšanās ir redzama. Virziena klasifikators:Hipersaites pieteikšanās ir redzama. Identificējiet modeli:Hipersaites pieteikšanās ir redzama.
Pēc lejupielādes es to ievietoju mapē D:\itsvse\PaddleOCR-release-2.0\deploy\model, kā parādīts zemāk:
Instalējiet noteikšanas + identifikācijas sērijas servisa moduli
Modificējiet konfigurāciju "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py" šādi:
Izmantojiet cmd logu, lai izpildītu šādu komandu mapē D:\itsvse\PaddleOCR-release-2.0:
Piezīme:Lai modificētu python failu sadaļā \hubserving\ocr_system, jums ir jāpārinstalē izvietojums vai jāizpilda iepriekš minētā komanda。
Par kļūdām var ziņot šādi:
ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb' Vienkārši izmantojiet pip, lai instalētu, piemēram: pip install imgaug
Instalācija ir šāda:
[2021-03-15 15:59:37,549] [ INFO] - Veiksmīgi atinstalēta ocr_system [2021-03-15 15:59:38,237] [ INFO] - Veiksmīgi instalēta ocr_system-1.0.0
Pakalpojuma ocr_system sākšana
Šeit konfigurācijas parametri izmanto konfigurācijas failu, vispirms modificējiet konfigurāciju "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json" šādi:
Sāciet pakalpojumu ar šādu komandu:
Pārbaudiet attēlu ar python klientu
Ievietojiet attēlu, kuru vēlaties pārbaudīt, mapē "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1" un palaidiet šādu komandu programmā D:\itsvse\PaddleOCR-release-2.0:
test_hubserving.py Avota kods ir šāds:
Attēla pārbaude, izmantojot .NET Core klientu
Tieši augšupielādējiet kodu šādi:
{"msg":"","results":[[{"confidence":0.9994004964828491,"text":"Bloga statistika","text_region":[[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"Sveiki visiem, Es esmu mazliet skumjš, un es sāku emuāru 2015. gada 5. aprīlī","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.9985174536705017,"text":"No šī laika2021-03-1516:19:52","text_region":[[23,111],[ 217,111],[217,126],[23,126]]},{"confidence":0.9762932062149048,"text":"Kumulatīvais par. .NET 1184 raksti, kopā 6844154 reizes, kopā 10505 komentāri","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"confidence":0.9847920536994934,"text":"Kopā 2807 raksti, kumulatīvais lasījums 14210224 reizes, 19074 atsauksmes","text_region":[[24 177],[414 177],[414 188],[24 189]]}]],"status":"000"}
Tā kā es izmantoju virtuālās mašīnas izvietošanas servera pusi, dažreiz tiek ziņots par atmiņas kļūdām:
Neizdodas piešķirt 268418688 lieluma atmiņu. Pagaidu risinājums, restartējiet serveri.
Resursu:
Hipersaites pieteikšanās ir redzama.
Hipersaites pieteikšanās ir redzama.
(Beigas)
|