Прежде чем мы познакомимся с PaddleOCR, давайте сначала разберёмся с PaddlePaddle. Основанный на многолетних исследованиях и бизнес-приложениях Baidu в области технологий глубокого обучения, PaddlePaddle является первой в Китае открытой, технологически ведущей и полностью функциональной промышленной платформой глубокого обучения, интегрирующей основные фреймворки для обучения и выводов для глубокого обучения, базовые библиотеки моделей, сквозные наборы для разработки и богатые компоненты инструментов. В настоящее время Flying Paddle собрал более 2,65 миллиона разработчиков, обслужил 100 000 предприятий и создал 340 000 моделей на базе открытой платформы глубокого обучения Flying Paddle. Flying Paddle помогает разработчикам быстро реализовать идеи ИИ и быстро запускать сервисы на ИИ. Помогите всё большему числу отраслей реализовать расширение возможностей ИИ и реализовать промышленное интеллектуальное обновление.
Официальный сайт:Вход по гиперссылке виден.
PaddleOCR стремится создать богатую, передовую и практичную библиотеку инструментов OCR, чтобы помочь пользователям обучать и внедрять более качественные модели.
Сначала взгляните на рендеры:
(Оригинальная фотография)
(После идентификации,Маркированная граница рисуется сама по себе на основе возвращённого результата)
Baidu Flying Paddle требует среды Windows
Windows 7/8/10 Pro/Enterprise (64 бит) Версия GPU поддерживает CUDA 9.0/10.0/10.1/10.2/11.0 и поддерживает только одну карту Версия Python 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 бит) Версия PIP 20.2.2+ (64 бит)
Примечание: если вы используете более продвинутую версию Python, например Python 3.9, вы получите следующую ошибку:
ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle Решение:
Скачайте поддерживаемую версию, например: версия 3.8.8, адрес для скачивания:Вход по гиперссылке виден.
Нужно убедиться, что Python и pip — 64-битные, а архитектура процессора — x86_64 (или x64, Intel 64, AMD64), и в настоящее время PaddlePaddle не поддерживает архитектуру arm64. Первая строка ниже выводит «64bit», а вторая — «x86_64», «x64» или «AMD64».
D:\itsvse>python --version Python 3.8.8
D:\itsvse>pip --version PIP 20.2.3 из C:\program files\python38\lib\site-packages\pip (python 3.8)
D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())" 64-битный AMD64 Windows 10 устанавливает версию процессора PaddlePaddle
Команда:
Проверьте установку
После завершения установки можно использовать python или python3, чтобы ввести интерпретатор Python, ввести Import Paddle и затем ввести paddle.utils.run_check()
если он появитсяPaddlePaddle установлен успешно!, означает, что вы успешно установили. Как показано ниже:
(Не выполнять) команду удаления:
Установка PaddleHub
Команда:
Скачать Clone PaddleOCR
Используйте команду git-клона, чтобы загрузить его условно, и безусловно скачать её прямо в сжатый пакет, а затем распаковать по адресу:Вход по гиперссылке виден.
Я скачал его напрямую и распаковал в папку :D:\itsvse\PaddleOCR-release-2.0.
Скачайте модель вывода
Перед установкой сервисного модуля нужно подготовить модель вывода и разместить её в правильном направлении.
Модель обнаружения:Вход по гиперссылке виден. Классификатор направления:Вход по гиперссылке виден. Определите модель:Вход по гиперссылке виден.
После скачивания я поместил его в папку D:\itsvse\PaddleOCR-release-2.0\deploy\model, как показано ниже:
Установите сервисный модуль серии обнаружения + идентификации
Измените конфигурацию «D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py» следующим образом:
Используйте окно cmd, чтобы выполнить следующую команду в папке D:\itsvse\PaddleOCR-release-2.0:
Замечание:Чтобы изменить python-файл в \hubserving\ocr_system, нужно переустановить развертывание или выполнить приведённую выше команду。
Ошибки могут быть указаны следующим образом:
ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb' Просто используйте pip для установки, например: pip install imgaug
Инсталляция выглядит следующим образом:
[2021-03-15 15:59:37,549] [ ИНФОРМАЦИЯ ] - Успешно удалил ocr_system [2021-03-15 15:59:38,237] [ INFO] - Успешно установлен ocr_system-1.0.0
Начните ocr_system сервис
Здесь параметры конфигурации используют конфигурационный файл, сначала измените конфигурацию «D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json» следующим образом:
Начните сервис следующей командой:
Проверьте изображение с помощью клиента Python
Поместите нужный вам образ в папку "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1" и выполните следующую команду в D:\itsvse\PaddleOCR-release-2.0:
test_hubserving.py Исходный код следующий:
Проверьте изображение с помощью клиента .NET Core
Загрузите код напрямую, следующим образом:
{"msg":"","results":[[{"confidence":0.9994004964828491,"text":"Blog Statistics","text_region":[[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"Всем привет, Я маленький мерзавец, и я начал вести блог 5 апреля 2015 года","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.9985174536705017,"text":"По состоянию на данный момент 2021-03-1516:19:52","text_region":[[23,111],[ 217,111],[217,126],[23,126]]},{"confidence":0.9762932062149048,"text":"Кумулятивное около. .NET 1184 статьи, всего 6844154 раз, всего 10505 комментариев","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"confidence":0.9847920536994934,"text":"Всего 2807 статей, совокупное чтение 14210224 раз, 19074 рецензии","text_region":[[24,177],[414,177],[414,188],[24,189]]}],"status":"000"}
Поскольку я использую серверную сторону развертывания виртуальных машин, иногда сообщают об ошибках памяти:
Не удалось выделить память 268418688 размера. Временное решение — перезагрузить сервер.
Ресурсы:
Вход по гиперссылке виден.
Вход по гиперссылке виден.
(Конец)
|