Antes de conocer PaddleOCR, primero entendamos PaddlePaddle. Basándose en los años de investigación tecnológica y aplicaciones empresariales de Baidu, PaddlePaddle es la primera plataforma de software de código abierto, tecnológicamente líder y totalmente funcional de aprendizaje profundo de grado industrial de China, integrando marcos básicos de formación e inferencia en aprendizaje profundo, bibliotecas básicas de modelos, kits de desarrollo de extremo a extremo y componentes de herramientas enriquecidos. Actualmente, Flying Paddle ha reunido a más de 2,65 millones de desarrolladores, ha servido a 100.000 empresas y ha generado 340.000 modelos basados en la plataforma de aprendizaje profundo de código abierto Flying Paddle. Flying Paddle ayuda a los desarrolladores a realizar rápidamente ideas de IA y a lanzar servicios de IA con rapidez. Ayudar a que cada vez más industrias completen el empoderamiento de la IA y logren la actualización de la inteligencia industrial.
Página web oficial:El inicio de sesión del hipervínculo es visible.
PaddleOCR tiene como objetivo crear una biblioteca de herramientas OCR rica, líder y práctica para ayudar a los usuarios a entrenar mejores modelos e implementarlos.
Primer vistazo a los renders:
(Imagen original)
(Tras la identificación,El borde etiquetado se dibuja por sí mismo según el resultado devuelto)
Baidu Flying Paddle requiere un entorno Windows
Windows 7/8/10 Pro/Enterprise (64 bits) La versión de GPU soporta CUDA 9.0/10.0/10.1/10.2/11.0, y solo soporta una sola tarjeta Versión de Python 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 bits) PIP versión 20.2.2+ (64 bits)
Nota: Si usas una versión superior de Python, como Python 3.9, obtendrás el siguiente error:
ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle Solución:
Descarga una versión soportada, por ejemplo: versión 3.8.8, dirección de descarga:El inicio de sesión del hipervínculo es visible.
Necesitas confirmar que Python y pip son de 64 bits, que la arquitectura del procesador es x86_64 (o x64, Intel 64, AMD64), y actualmente PaddlePaddle no soporta la arquitectura arm64. La primera línea de abajo saca "64 bits", y la segunda línea "x86_64", "x64" o "AMD64".
D:\itsvse>python --version Python 3.8.8
D:\itsvse>pip --version PIP 20.2.3 de C:\Program Files\python38\lib\site-packages\pip (Python 3.8)
D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())" 64 bits AMD64 Windows 10 instala la versión de CPU de PaddlePaddle
Mandar:
Verifica la instalación
Una vez completada la instalación, puedes usar python o python3 para introducir el intérprete de python, importar paddle y luego escribir paddle.utils.run_check()
si aparece¡PaddlePaddle está instalado con éxito!, indicando que has instalado correctamente. Como se muestra a continuación:
(No ejecutar) comando de desinstalación:
Instalar PaddleHub
Mandar:
Descargar Clone PaddleOCR
Usa el comando git clone para descargar condicionalmente, y descárgalo incondicionalmente directamente en un paquete comprimido y luego descomprimirlo, dirección:El inicio de sesión del hipervínculo es visible.
Lo descargué directamente y lo descomprimí en la carpeta :D:\itsvse\PaddleOCR-release-2.0.
Descargar el modelo de inferencia
Antes de instalar el módulo de servicio, necesitas preparar el modelo de inferencia y colocarlo en el camino correcto.
Modelo de Detección:El inicio de sesión del hipervínculo es visible. Clasificador de dirección:El inicio de sesión del hipervínculo es visible. Identifica el modelo:El inicio de sesión del hipervínculo es visible.
Después de descargarlo, lo coloqué bajo la carpeta D:\itsvse\PaddleOCR-release-2.0\deploy\model, como se muestra a continuación:
Instala el módulo de servicio de la serie de detección + identificación
Modifica la configuración de "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py" de la siguiente manera:
Utiliza la ventana cmd para ejecutar el siguiente comando en la carpeta D:\itsvse\PaddleOCR-release-2.0:
Comentario:Para modificar el archivo python bajo \hubserving\ocr_system, necesitas reinstalar el despliegue o ejecutar el comando anterior。
Los errores pueden reportarse de la siguiente manera:
ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb' Simplemente usa pip para instalar, por ejemplo: pip install imgaug
La instalación es la siguiente:
[2021-03-15 15:59:37,549] [INFO] - Desinstalada con éxito ocr_system [2021-03-15 15:59:38,237] [INFO] - Instalado correctamente ocr_system-1.0.0
Inicia el servicio de ocr_system
Aquí los parámetros de configuración utilizan el archivo de configuración, primero modifican la configuración "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json" de la siguiente manera:
Inicia el servicio con el siguiente comando:
Prueba la imagen con el cliente de Python
Pon la imagen que quieres probar en la carpeta "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1" y ejecuta el siguiente comando en D:\itsvse\PaddleOCR-release-2.0:
test_hubserving.py El código fuente es el siguiente:
Prueba la imagen usando el cliente .NET Core
Sube el código directamente, de la siguiente manera:
{"msg":"","results":[[{"confidence":0.9994004964828491,"text":"Blog Statistics","text_region":[[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"Hola a todos, Soy un pequeño desgraciado, y empecé un blog el 5 de abril de 2015","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.99851745367017,"text":"A esta fecha 2021-03-1516:19:52","text_region":[[23,111],[ 217,111],[217,126],[23,126]]},{"confianza":0.9762932062149048,"texto":"Acumulado sobre. .NET 1184 artículos, 6844154 veces en total, 10505 comentarios en total","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"confidence":0.9847920536994934,"text":"Total de 2807 artículos, lectura acumulada 14210224 veces, 19074 reseñas","text_region":[[24,177],[414,177],[414,188],[24,189]]}]],"status":"000"}
Como uso el lado del servidor para desplegar máquinas virtuales, a veces se reportan errores de memoria:
No alugar memoria de 268418688 tamaño. Solución temporal: reiniciar el servidor.
Recursos:
El inicio de sesión del hipervínculo es visible.
El inicio de sesión del hipervínculo es visible.
(Fin)
|