Prieš susipažindami su PaddleOCR, pirmiausia supraskime PaddlePaddle. Remiantis ilgamečiais "Baidu" gilaus mokymosi technologijų tyrimais ir verslo programomis, "PaddlePaddle" yra pirmoji Kinijos atvirojo kodo, technologiškai pirmaujanti ir visiškai veikianti pramoninio lygio gilaus mokymosi platforma, integruojanti gilaus mokymosi pagrindines mokymo ir išvadų sistemas, pagrindines modelių bibliotekas, visapusiškus kūrimo rinkinius ir turtingus įrankių komponentus. Šiuo metu "Flying Paddle" subūrė daugiau nei 2,65 milijono kūrėjų, aptarnavo 100 000 įmonių ir sukūrė 340 000 modelių, pagrįstų "Flying Paddle" atvirojo kodo gilaus mokymosi platforma. "Flying Paddle" padeda kūrėjams greitai įgyvendinti dirbtinio intelekto idėjas ir greitai paleisti dirbtinio intelekto paslaugas. Padėkite vis daugiau pramonės šakų užbaigti dirbtinio intelekto įgalinimą ir įgyvendinti pramoninį intelektualų atnaujinimą.
Oficiali svetainė:Hipersaito prisijungimas matomas.
PaddleOCR siekia sukurti turtingą, pirmaujančią ir praktišką OCR įrankių biblioteką, kuri padėtų vartotojams mokyti geresnius modelius ir juos įgyvendinti.
Pirmiausia pažvelkite į atvaizdus:
(Originali nuotrauka)
(Po identifikavimoPažymėta kraštinė nubrėžiama pati pagal grąžintą rezultatą)
"Baidu Flying Paddle" reikalinga "Windows" aplinka
Windows 7/8/10 Pro/Enterprise (64 bitų) GPU versija palaiko CUDA 9.0/10.0/10.1/10.2/11.0 ir palaiko tik vieną kortelę Python versija 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 bitų) PIP versija 20.2.2+ (64 bitų)
Pastaba: Jei naudojate naujesnę Python versiją, pvz., Python 3.9, gausite šią klaidą:
ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle Sprendimas:
Atsisiųskite palaikomą versiją, pvz.: 3.8.8 versiją, atsisiuntimo adresą:Hipersaito prisijungimas matomas.
Turite patvirtinti, kad Python ir pip yra 64 bitų, o procesoriaus architektūra yra x86_64 (arba x64, Intel 64, AMD64) architektūra, o šiuo metu PaddlePaddle nepalaiko arm64 architektūros. Pirmoji eilutė žemiau išveda "64bit", o antroji - "x86_64", "x64" arba "AMD64".
D:\itsvse>python --version Python 3.8.8
D:\itsvse>pip --version PIP 20.2.3 iš C:\Program Files\python38\lib\site-packages\pip (Python 3.8)
D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())" 64 bitų AMD64 "Windows 10" įdiegia "PaddlePaddle" procesoriaus versiją
Komanda:
Patikrinkite diegimą
Baigę diegti, galite naudoti python arba python3, kad įvestumėte python interpretatorių, įveskite import paddle ir įveskite paddle.utils.run_check()
Jei jis pasirodoPaddlePaddle sėkmingai įdiegtas!, nurodydami, kad sėkmingai įdiegėte. Kaip parodyta žemiau:
(Nevykdyti) pašalinimo komanda:
Įdiekite "PaddleHub"
Komanda:
Atsisiųskite Clone PaddleOCR
Naudokite komandą git clone, kad atsisiųstumėte sąlygiškai, ir besąlygiškai atsisiųskite ją tiesiai į suspaustą paketą ir išpakuokite jį, adresas:Hipersaito prisijungimas matomas.
Atsisiunčiau jį tiesiogiai ir išpakavau į aplanką :D:\itsvse\PaddleOCR-release-2.0.
Atsisiųskite išvadų modelį
Prieš diegdami aptarnavimo modulį, turite paruošti išvados modelį ir įdėti jį teisingu keliu.
Aptikimo modelis:Hipersaito prisijungimas matomas. Krypties klasifikatorius:Hipersaito prisijungimas matomas. Nustatykite modelį:Hipersaito prisijungimas matomas.
Atsisiuntęs jį įdėjau į aplanką D:\itsvse\PaddleOCR-release-2.0\deploy\model, kaip parodyta žemiau:
Įdiekite aptikimo + identifikavimo serijos aptarnavimo modulį
Pakeiskite "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py" konfigūraciją taip:
Naudokite cmd langą, kad vykdytumėte šią komandą aplanke D:\itsvse\PaddleOCR-release-2.0:
Pastaba:Norėdami modifikuoti python failą \hubserving\ocr_system, turite iš naujo įdiegti diegimą arba vykdyti aukščiau pateiktą komandą。
Apie klaidas galima pranešti taip:
ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb' Tiesiog naudokite pip įdiegti, pavyzdžiui: pip install imgaug
Diegimas yra toks:
[2021-03-15 15:59:37,549] [ INFO] - Sėkmingai pašalintas ocr_system [2021-03-15 15:59:38,237] [ INFO] - Sėkmingai įdiegta ocr_system-1.0.0
Paleiskite ocr_system paslaugą
Čia konfigūracijos parametrai naudoja konfigūracijos failą, pirmiausia pakeiskite "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json" konfigūraciją taip:
Paleiskite paslaugą naudodami šią komandą:
Išbandykite paveikslėlį naudodami python klientą
Įdėkite vaizdą, kurį norite išbandyti, į aplanką "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1" ir paleiskite šią komandą D:\itsvse\PaddleOCR-release-2.0:
test_hubserving.py Šaltinio kodas yra toks:
Išbandykite paveikslėlį naudodami .NET Core klientą
Tiesiogiai įkelkite kodą taip:
{"msg":"","results":[[{"confidence":0.9994004964828491,"text":"Dienoraščio statistika","text_region":[[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"Sveiki visi, Esu šiek tiek šlykštus ir 2015 m. balandžio 5 d. pradėjau rašyti tinklaraštį","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.9985174536705017,"text":"Šiuo metu2021-03-1516:19:52","text_region":[[23,111],[ 217,111],[217,126],[23,126]]},{"confidence":0.9762932062149048,"text":"Kaupiamasis apie. .NET 1184 straipsniai, iš viso 6844154 kartus, iš viso 10505 komentarai","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"confidence":0.9847920536994934,"text":"Iš viso 2807 straipsniai, bendras skaitymo 14210224 kartus, 19074 atsiliepimai","text_region":[[24,177],[414,177],[414,188],[24,189]]}]],"status":"000"}
Kadangi naudoju virtualios mašinos diegimo serverio pusę, kartais pranešama apie atminties klaidas:
Nepavyko paskirstyti 268418688 dydžio atminties. Laikinas sprendimas, iš naujo paleiskite serverį.
Išteklių:
Hipersaito prisijungimas matomas.
Hipersaito prisijungimas matomas.
(Pabaiga)
|