Skôr než spoznáme PaddleOCR, najprv si ho poďme predstaviť. Na základe rokov výskumu technológií hlbokého učenia a obchodných aplikácií Baidu je PaddlePaddle prvou open source, technologicky vedúcou a plne funkčnou priemyselnou platformou hlbokého učenia v Číne, ktorá integruje základné tréningové a inferenčné rámce hlbokého učenia, základné knižnice modelov, end-to-end vývojové sady a bohaté komponenty nástrojov. V súčasnosti Flying Paddle zhromaždil viac ako 2,65 milióna vývojárov, obslúžil 100 000 podnikov a vytvoril 340 000 modelov založených na open source platforme hlbokého učenia Flying Paddle. Flying Paddle pomáha vývojárom rýchlo realizovať AI nápady a rýchlo spustiť AI služby. Pomôžte čoraz väčšiemu počtu odvetví dokončiť posilnenie AI a uskutočniť priemyselnú inteligentnú modernizáciu.
Oficiálna webová stránka:Prihlásenie na hypertextový odkaz je viditeľné.
PaddleOCR si kladie za cieľ vytvoriť bohatú, vedúcu a praktickú knižnicu nástrojov OCR, ktorá pomôže používateľom trénovať lepšie modely a implementovať ich.
Najprv sa pozrite na vizualizácie:
(Originálna fotografia)
(Po identifikácii,Označený okraj sa kreslí sám o sebe na základe vráteného výsledku)
Baidu Flying Paddle vyžaduje prostredie Windows
Windows 7/8/10 Pro/Enterprise (64bit) Verzia pre GPU podporuje CUDA 9.0/10.0/10.1/10.2/11.0 a podporuje len jednu kartu Python verzia 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 bit) PIP verzia 20.2.2+ (64 bitov)
Poznámka: Ak používate vyššiu verziu Pythonu, napríklad Python 3.9, zobrazí sa vám nasledujúca chyba:
ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle Riešenie:
Stiahnite si podporovanú verziu, napríklad: verzia 3.8.8, adresa na stiahnutie:Prihlásenie na hypertextový odkaz je viditeľné.
Musíte si overiť, že Python a pip sú 64-bitové a procesorová architektúra je x86_64 (alebo x64, Intel 64, AMD64) architektúra, a momentálne PaddlePaddle nepodporuje arm64 architektúru. Prvý riadok nižšie vydáva "64bit" a druhý riadok "x86_64", "x64" alebo "AMD64".
D:\itsvse>python --version Python 3.8.8
D:\itsvse>pip --version PIP 20.2.3 z C:\Program Files\python38\lib\site-packages\pip (Python 3.8)
D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())" 64bit AMD64 Windows 10 inštaluje CPU verziu PaddlePaddle
Príkaz:
Overte inštaláciu
Po dokončení inštalácie môžete použiť python alebo python3 na zadanie python interpretera, zadať import paddle a potom napísať paddle.utils.run_check()
ak sa objavíPaddlePaddle je úspešne nainštalovaný!, čo znamená, že ste úspešne nainštalovali. Ako je uvedené nižšie:
(Nespúšťaj) príkaz odinštalovať:
Nainštalujte PaddleHub
Príkaz:
Stiahnite si Clone PaddleOCR
Použite príkaz git clone na podmienečné stiahnutie a bezpodmienečné stiahnutie priamo do komprimovaného balíka a následné rozbalenie, adresa:Prihlásenie na hypertextový odkaz je viditeľné.
Stiahol som ju priamo a rozbalil do priečinka :D:\itsvse\PaddleOCR-release-2.0.
Stiahnite si model inferencie
Pred inštaláciou servisného modulu je potrebné pripraviť model inferencie a umiestniť ho do správnej cesty.
Model detekcie:Prihlásenie na hypertextový odkaz je viditeľné. Smerový klasifikátor:Prihlásenie na hypertextový odkaz je viditeľné. Identifikujte model:Prihlásenie na hypertextový odkaz je viditeľné.
Po stiahnutí som ho umiestnil do priečinka D:\itsvse\PaddleOCR-release-2.0\deploy\model, ako je uvedené nižšie:
Inštalácia servisného modulu detekcie + identifikácie
Upravte konfiguráciu "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py" nasledovne:
Použite okno cmd na vykonanie nasledujúceho príkazu pod priečinkom D:\itsvse\PaddleOCR-release-2.0:
Poznámka:Ak chcete upraviť python súbor v \hubserving\ocr_system, musíte nasadenie preinštalovať alebo vykonať vyššie uvedený príkaz。
Chyby môžu byť hlásené nasledovne:
ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb' Stačí použiť pip na inštaláciu, napríklad: pip install imgaug
Inštalácia je nasledovná:
[2021-03-15 15:59:37,549] [ INFO] - Úspešne odinštalované ocr_system [2021-03-15 15:59:38,237] [ INFO] - Úspešne nainštalovaná ocr_system-1.0.0
Začnite službu ocr_system
Tu konfiguračné parametre používajú konfiguračný súbor, najprv upravte konfiguráciu "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json", nasledovne:
Začnite službu nasledujúcim príkazom:
Otestuj obrázok s python klientom
Vlož obrázok, ktorý chceš otestovať, do priečinka "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1" a spusti nasledujúci príkaz v D:\itsvse\PaddleOCR-release-2.0:
test_hubserving.py Zdrojový kód je nasledovný:
Otestujte obrázok pomocou .NET Core klienta
Kód nahrajte priamo, nasledovne:
{"msg":"","results":[{"confidence":0.9994004964828491,"text":"Blog Statistics","text_region":[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"Ahojte všetci, Som malý a začal som blog 5. apríla 2015","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.9985174536705017,"text":"K tomuto času 2021-03-1516:19:52","text_region":[23,111],[ 217,111],[217,126],[23,126]]},{"confidence":0.9762932062149048,"text":"Kumulatívne o. .NET 1184 článkov, spolu 6844154 krát, celkovo 10505 komentárov","text_region":[[24,153],[448,153],[448,165],[24,165]},{"confidence":0.9847920536994934,"text":"Spolu 2807 článkov, kumulatívne čítanie 14210224 krát, 19074 recenzie","text_region":[24,177],[414,177],[414,188],[24,189]]}],"status":"000"}
Keďže používam serverovú stranu pri nasadzovaní virtuálnych strojov, niekedy sa hlásia chyby v pamäti:
Nepodarilo sa mi prideliť pamäť 268418688 veľkosti. Dočasné riešenie, reštartovať server.
Zdroje:
Prihlásenie na hypertextový odkaz je viditeľné.
Prihlásenie na hypertextový odkaz je viditeľné.
(Koniec)
|