Než se podíváme na PaddleOCR, nejprve si ho pojďme představit. Na základě let výzkumu technologií hlubokého učení a obchodních aplikací společnosti Baidu je PaddlePaddle první čínskou open source, technologicky vedoucí a plně funkční průmyslovou platformou hlubokého učení, integrující základní tréninkové a inferenční rámce hlubokého učení, základní modelové knihovny, end-to-end vývojové sady a bohaté nástroje pro jednotlivé nástroje. V současnosti Flying Paddle shromáždil více než 2,65 milionu vývojářů, obsloužil 100 000 podniků a vytvořil 340 000 modelů založených na open source platformě hlubokého učení Flying Paddle. Flying Paddle pomáhá vývojářům rychle realizovat AI nápady a rychle spustit AI služby. Pomozte stále více odvětvím dokončit posílení AI a uskutečnit průmyslovou inteligentní modernizaci.
Oficiální webové stránky:Přihlášení k hypertextovému odkazu je viditelné.
PaddleOCR si klade za cíl vytvořit bohatou, průkopnickou a praktickou knihovnu nástrojů OCR, která uživatelům pomůže lépe trénovat modely a implementovat je.
Nejprve se podívejte na vizualizace:
(Původní obrázek)
(Po identifikaci,Označený okraj se kreslí sám o sobě na základě vráceného výsledku)
Baidu Flying Paddle vyžaduje prostředí Windows
Windows 7/8/10 Pro/Enterprise (64bit) GPU verze podporuje CUDA 9.0/10.0/10.1/10.2/11.0 a pouze jednu kartu Python verze 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 bit) PIP verze 20.2.2+ (64 bitů)
Poznámka: Pokud používáte vyšší verzi Pythonu, například Python 3.9, zobrazí se vám následující chyba:
ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle Řešení:
Stáhněte podporovanou verzi, například: verze 3.8.8, adresa ke stažení:Přihlášení k hypertextovému odkazu je viditelné.
Musíte ověřit, že Python a pip jsou 64bitové a procesorová architektura je x86_64 (nebo x64, Intel 64, AMD64) architektura, a momentálně PaddlePaddle nepodporuje arm64 architekturu. První řádek níže vydává "64bit" a druhý řádek "x86_64", "x64" nebo "AMD64".
D:\itsvse>python --version Python 3.8.8
D:\itsvse>pip --version PIP 20.2.3 z C:\Program Files\python38\lib\site-packages\pip (Python 3.8)
D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())" 64bit AMD64 Windows 10 instaluje verzi PaddlePaddle pro CPU
Příkaz:
Ověřte instalaci
Po dokončení instalace můžete pomocí pythonu nebo python3 zadat python interpreter, zadat import paddle a pak zadat paddle.utils.run_check()
pokud se objevíPaddlePaddle je úspěšně nainstalován!, což znamená, že jste úspěšně nainstalovali. Jak je uvedeno níže:
(Nespouštět) příkaz odinstalovat:
Nainstalovat PaddleHub
Příkaz:
Stáhnout Clone PaddleOCR
Použijte příkaz git clone pro podmíněné stažení a bezpodmínečně stáhněte ho přímo do komprimovaného balíčku a poté ho rozbalte, adres:Přihlášení k hypertextovému odkazu je viditelné.
Stáhl jsem ho přímo a rozbalil do složky :D:\itsvse\PaddleOCR-release-2.0.
Stáhněte si model inference
Před instalací servisního modulu je potřeba připravit inferenční model a umístit jej správnou cestou.
Model detekce:Přihlášení k hypertextovému odkazu je viditelné. Směrový klasifikátor:Přihlášení k hypertextovému odkazu je viditelné. Identifikujte model:Přihlášení k hypertextovému odkazu je viditelné.
Po stažení jsem ji umístil do složky D:\itsvse\PaddleOCR-release-2.0\deploy\model, jak je vidět níže:
Nainstalovat servisní modul série detekce + identifikace
Upravte konfiguraci "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py" následovně:
Použijte okno cmd k provedení následujícího příkazu pod složkou D:\itsvse\PaddleOCR-release-2.0:
Poznámka:Pro úpravu python souboru v \hubserving\ocr_system je potřeba znovu nainstalovat nasazení nebo spustit výše uvedený příkaz。
Chyby mohou být hlášeny následovně:
ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb' Stačí použít pip k instalaci, například: pip install imgaug
Instalace je následující:
[2021-03-15 15:59:37,549] [ INFO] - Úspěšně odinstalováno ocr_system [2021-03-15 15:59:38,237] [ INFO] - Úspěšně nainstalováno ocr_system-1.0.0
Začněte službu ocr_system
Zde konfigurační parametry používají konfigurační soubor, nejprve upravte konfiguraci "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json", následovně:
Začněte službu následujícím příkazem:
Otestujte obrázek s python klientem
Vložte obrázek, který chcete testovat, do složky "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1" a spusťte následující příkaz v D:\itsvse\PaddleOCR-release-2.0:
test_hubserving.py Zdrojový kód je následující:
Otestujte obrázek pomocí klienta .NET Core
Kód nahrajte přímo, následovně:
{"msg":"","results":[{"confidence":0.9994004964828491,"text":"Blog Statistics","text_region":[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"Ahoj všichni, Jsem malý hajzl a začal jsem psát blog 5. dubna 2015","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.9985174536705017,"text":"K tomuto času 2021-03-1516:19:52","text_region":[23,111],[ 217,111],[217,126],[23,126]]},{"confidence":0.9762932062149048,"text":"Kumulativní o. .NET 1184 článků, celkem 6844154 krát, celkem 10505 komentářů","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"confidence":0.9847920536994934,"text":"Celkem 2807 článků, kumulativní čtení 14210224 krát, recenze z roku 19074","text_region":[24,177],[414,177],[414,188],[24,189]]}],"status":"000"}
Protože používám serverovou stranu nasazení virtuálních strojů, někdy se hlásí chyby v paměti:
Nepodařilo se přidělit paměť 268418688 velikosti. Dočasné řešení, restartovat server.
Prostředky:
Přihlášení k hypertextovému odkazu je viditelné.
Přihlášení k hypertextovému odkazu je viditelné.
(Konec)
|