Преди да се запознаем с PaddleOCR, нека първо разберем какво е PaddlePaddle. Въз основа на годините изследвания на технологии за дълбоко обучение и бизнес приложения на Baidu, PaddlePaddle е първата в Китай с отворен код, технологично водеща и напълно функционална индустриална платформа за дълбоко обучение, интегрираща основни рамки за обучение и изводи, основни моделни библиотеки, комплекти за разработка от край до край и богати компоненти на инструменти. В момента Flying Paddle е събрал над 2,65 милиона разработчици, обслужвал е 100 000 предприятия и е генерирал 340 000 модела, базирани на отворената платформа за дълбоко обучение Flying Paddle. Flying Paddle помага на разработчиците бързо да реализират AI идеи и бързо да стартират AI услуги. Помогнете на все повече индустрии да завършат овластяването на AI и да реализират индустриално интелигентно ъпгрейдване.
Официален уебсайт:Входът към хиперлинк е видим.
PaddleOCR има за цел да създаде богата, водеща и практична библиотека с OCR инструменти, която да помага на потребителите да обучават по-добри модели и да ги прилагат.
Първо разгледайте визуализациите:
(Оригинална снимка)
(След идентификация,Означената граница се чертае сама въз основа на върнатия резултат)
Baidu Flying Paddle изисква Windows среда
Windows 7/8/10 Pro/Enterprise (64bit) Версията на GPU поддържа CUDA 9.0/10.0/10.1/10.2/11.0 и поддържа само една карта Python версия 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 бита) PIP версия 20.2.2+ (64 бита)
Забележка: Ако използвате по-висока версия на Python, като Python 3.9, ще получите следната грешка:
ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle Решение:
Изтеглете поддържана версия, например: версия 3.8.8, адрес за изтегляне:Входът към хиперлинк е видим.
Трябва да потвърдиш, че Python и pip са 64-битови, а архитектурата на процесора е x86_64 (или x64, Intel 64, AMD64), и в момента PaddlePaddle не поддържа arm64 архитектура. Първият ред по-долу показва "64bit", а вторият ред излиза "x86_64", "x64" или "AMD64".
D:\itsvse>python --version Python 3.8.8
D:\itsvse>pip --version PIP 20.2.3 от C:\program files\python38\lib\site-packages\pip (Python 3.8)
D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())" 64-битов AMD64 Windows 10 инсталира версията на процесора PaddlePaddle
Команда:
Проверете инсталацията
След като инсталацията приключи, можеш да използваш python или python3, за да въведеш python интерпретатора, да въведеш import paddle и след това да напишеш paddle.utils.run_check()
ако се появиPaddlePaddle е инсталиран успешно!, което означава, че сте успешно инсталирали. Както е показано по-долу:
(Не изпълнявай) команда за деинсталиране:
Инсталиране на PaddleHub
Команда:
Изтеглете Clone PaddleOCR
Използвайте командата git clone, за да го изтеглите условно, и безусловно го изтеглете директно в компресиран пакет и след това го разархивирайте, адрес:Входът към хиперлинк е видим.
Изтеглих го директно и го разархивирах в папката :D:\itsvse\PaddleOCR-release-2.0.
Изтеглете модела на извод
Преди да инсталирате сервизния модул, трябва да подготвите модела на извод и да го поставите в правилния път.
Модел за откриване:Входът към хиперлинк е видим. Класификатор на посоката:Входът към хиперлинк е видим. Идентифицирайте модела:Входът към хиперлинк е видим.
След като го изтеглих, го поставих под папката D:\itsvse\PaddleOCR-release-2.0\deploy\model, както е показано по-долу:
Инсталирайте сервизния модул за откриване + идентификация
Модифицирайте конфигурацията "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py" по следния начин:
Използвайте cmd прозореца, за да изпълните следната команда под папката D:\itsvse\PaddleOCR-release-2.0:
Забележка:За да модифицирате python файла под \hubserving\ocr_system, трябва да преинсталирате разгръщането или да изпълните горната команда。
Грешките могат да бъдат докладвани по следния начин:
ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb' Просто използвайте pip за инсталация, например: pip install imgaug
Инсталацията е следната:
[2021-03-15 15:59:37,549] [ ИНФОРМАЦИЯ ] - Успешно деинсталирах ocr_system [2021-03-15 15:59:38,237] [ ИНФОРМАЦИЯ ] - Успешно инсталиран ocr_system-1.0.0
Започнете ocr_system услуга
Тук конфигурационните параметри използват конфигурационния файл, първо модифицирайте конфигурацията "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json", както следва:
Започнете услугата със следната команда:
Тествай снимката с python клиента
Поставете образа, който искате да тествате, в папката "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1" и изпълнете следната команда в D:\itsvse\PaddleOCR-release-2.0:
test_hubserving.py Изходният код е следният:
Тествайте картината с .NET Core клиента
Директно качете кода, както следва:
{"msg":"","results":[[{"confidence":0.9994004964828491,"text":"Статистика на блога","text_region":[[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"Здравейте на всички, Аз съм малък негодник и започнах блог на 5 април 2015 г.","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.9985174536705017,"text":"Към този момент 2021-03-1516:19:52","text_region":[[23,111],[ 217,111],[217,126],[23,126]]},{"confidence":0.9762932062149048,"text":"Кумулативно около. .NET 1184 статии, общо 6844154 пъти, общо 10505 коментара","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"confidence":0.9847920536994934,"text":"Общо 2807 статии, кумулативно четене 14210224 пъти, 19074 ревюта","text_region":[[24,177],[414,177],[414,188],[24,189]]}],"статус":"000"}
Тъй като използвам сървърната страна на внедряването на виртуални машини, понякога се докладват грешки в паметта:
Не успявам да отделя памет с размер 268418688. Временно решение е рестартиране на сървъра.
Ресурси:
Входът към хиперлинк е видим.
Входът към хиперлинк е видим.
(Край)
|