Tento článek je zrcadlovým článkem o strojovém překladu, klikněte zde pro přechod na původní článek.

Pohled: 55804|Odpověď: 4

[.NET Core] .NET Core volá Baidu PaddleOCR pro rozpoznávání obrázků a textů

[Kopírovat odkaz]
Zveřejněno 15.03.2021 18:21:43 | | | |
Než se podíváme na PaddleOCR, nejprve si ho pojďme představit. Na základě let výzkumu technologií hlubokého učení a obchodních aplikací společnosti Baidu je PaddlePaddle první čínskou open source, technologicky vedoucí a plně funkční průmyslovou platformou hlubokého učení, integrující základní tréninkové a inferenční rámce hlubokého učení, základní modelové knihovny, end-to-end vývojové sady a bohaté nástroje pro jednotlivé nástroje. V současnosti Flying Paddle shromáždil více než 2,65 milionu vývojářů, obsloužil 100 000 podniků a vytvořil 340 000 modelů založených na open source platformě hlubokého učení Flying Paddle. Flying Paddle pomáhá vývojářům rychle realizovat AI nápady a rychle spustit AI služby. Pomozte stále více odvětvím dokončit posílení AI a uskutečnit průmyslovou inteligentní modernizaci.

Oficiální webové stránky:Přihlášení k hypertextovému odkazu je viditelné.

PaddleOCR si klade za cíl vytvořit bohatou, průkopnickou a praktickou knihovnu nástrojů OCR, která uživatelům pomůže lépe trénovat modely a implementovat je.

Nejprve se podívejte na vizualizace:


(Původní obrázek)


(Po identifikaci,Označený okraj se kreslí sám o sobě na základě vráceného výsledku

Baidu Flying Paddle vyžaduje prostředí Windows

Windows 7/8/10 Pro/Enterprise (64bit)
GPU verze podporuje CUDA 9.0/10.0/10.1/10.2/11.0 a pouze jednu kartu
Python verze 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 bit)
PIP verze 20.2.2+ (64 bitů)

Poznámka: Pokud používáte vyšší verzi Pythonu, například Python 3.9, zobrazí se vám následující chyba:

ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle
Řešení:

Stáhněte podporovanou verzi, například: verze 3.8.8, adresa ke stažení:Přihlášení k hypertextovému odkazu je viditelné.

Musíte ověřit, že Python a pip jsou 64bitové a procesorová architektura je x86_64 (nebo x64, Intel 64, AMD64) architektura, a momentálně PaddlePaddle nepodporuje arm64 architekturu. První řádek níže vydává "64bit" a druhý řádek "x86_64", "x64" nebo "AMD64".



D:\itsvse>python --version
Python 3.8.8

D:\itsvse>pip --version
PIP 20.2.3 z C:\Program Files\python38\lib\site-packages\pip (Python 3.8)

D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())"
64bit
AMD64
Windows 10 instaluje verzi PaddlePaddle pro CPU

Příkaz:

Ověřte instalaci

Po dokončení instalace můžete pomocí pythonu nebo python3 zadat python interpreter, zadat import paddle a pak zadat paddle.utils.run_check()

pokud se objevíPaddlePaddle je úspěšně nainstalován!, což znamená, že jste úspěšně nainstalovali. Jak je uvedeno níže:



(Nespouštět) příkaz odinstalovat:

Nainstalovat PaddleHub

Příkaz:


Stáhnout Clone PaddleOCR

Použijte příkaz git clone pro podmíněné stažení a bezpodmínečně stáhněte ho přímo do komprimovaného balíčku a poté ho rozbalte, adres:Přihlášení k hypertextovému odkazu je viditelné.

Stáhl jsem ho přímo a rozbalil do složky :D:\itsvse\PaddleOCR-release-2.0.

Stáhněte si model inference

Před instalací servisního modulu je potřeba připravit inferenční model a umístit jej správnou cestou.

Model detekce:Přihlášení k hypertextovému odkazu je viditelné.
Směrový klasifikátor:Přihlášení k hypertextovému odkazu je viditelné.
Identifikujte model:Přihlášení k hypertextovému odkazu je viditelné.

Po stažení jsem ji umístil do složky D:\itsvse\PaddleOCR-release-2.0\deploy\model, jak je vidět níže:



Nainstalovat servisní modul série detekce + identifikace

Upravte konfiguraci "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py" následovně:

Použijte okno cmd k provedení následujícího příkazu pod složkou D:\itsvse\PaddleOCR-release-2.0:

Poznámka:Pro úpravu python souboru v \hubserving\ocr_system je potřeba znovu nainstalovat nasazení nebo spustit výše uvedený příkaz

Chyby mohou být hlášeny následovně:


ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb'
Stačí použít pip k instalaci, například: pip install imgaug

Instalace je následující:

[2021-03-15 15:59:37,549] [ INFO] - Úspěšně odinstalováno ocr_system
[2021-03-15 15:59:38,237] [ INFO] - Úspěšně nainstalováno ocr_system-1.0.0



Začněte službu ocr_system

Zde konfigurační parametry používají konfigurační soubor, nejprve upravte konfiguraci "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json", následovně:

Začněte službu následujícím příkazem:



Otestujte obrázek s python klientem

Vložte obrázek, který chcete testovat, do složky "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1" a spusťte následující příkaz v D:\itsvse\PaddleOCR-release-2.0:



test_hubserving.py Zdrojový kód je následující:

Otestujte obrázek pomocí klienta .NET Core

Kód nahrajte přímo, následovně:

{"msg":"","results":[{"confidence":0.9994004964828491,"text":"Blog Statistics","text_region":[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"Ahoj všichni, Jsem malý hajzl a začal jsem psát blog 5. dubna 2015","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.9985174536705017,"text":"K tomuto času 2021-03-1516:19:52","text_region":[23,111],[ 217,111],[217,126],[23,126]]},{"confidence":0.9762932062149048,"text":"Kumulativní o. .NET 1184 článků, celkem 6844154 krát, celkem 10505 komentářů","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"confidence":0.9847920536994934,"text":"Celkem 2807 článků, kumulativní čtení 14210224 krát, recenze z roku 19074","text_region":[24,177],[414,177],[414,188],[24,189]]}],"status":"000"}


Protože používám serverovou stranu nasazení virtuálních strojů, někdy se hlásí chyby v paměti:

Nepodařilo se přidělit paměť 268418688 velikosti.
Dočasné řešení, restartovat server.

Prostředky:

Přihlášení k hypertextovému odkazu je viditelné.
Přihlášení k hypertextovému odkazu je viditelné.

(Konec)





Předchozí:ASP.NET Filtr Core(4) sjednocený validace modelů ModelState
Další:2PC &&3PC distribuovaných transakcí
Zveřejněno 16.06.2021 12:38:26 |
Mark Yibo, přijď se učit
 Pronajímatel| Zveřejněno 13.11.2024 9:44:47 |
Návod na instalaci Windows PaddlePaddle
https://www.itsvse.com/thread-10873-1-1.html
 Pronajímatel| Zveřejněno 31.12.2024 13:25:03 |
.NET/C# využívá FastDeploy k nasazení OCR modelů pro rozpoznávání textu
https://www.itsvse.com/thread-10911-1-1.html
 Pronajímatel| Zveřejněno 24.04.2025 9:20:18 |
.NET/C# využívá Tesseract k OCR rozpoznávání textu pro obrázky
https://www.itsvse.com/thread-10994-1-1.html
Zřeknutí se:
Veškerý software, programovací materiály nebo články publikované organizací Code Farmer Network slouží pouze k učení a výzkumu; Výše uvedený obsah nesmí být používán pro komerční ani nelegální účely, jinak nesou všechny důsledky uživatelé. Informace na tomto webu pocházejí z internetu a spory o autorská práva s tímto webem nesouvisí. Musíte výše uvedený obsah ze svého počítače zcela smazat do 24 hodin od stažení. Pokud se vám program líbí, podporujte prosím originální software, kupte si registraci a získejte lepší skutečné služby. Pokud dojde k jakémukoli porušení, kontaktujte nás prosím e-mailem.

Mail To:help@itsvse.com