Este artículo es un artículo espejo de traducción automática, por favor haga clic aquí para saltar al artículo original.

Vista: 55804|Respuesta: 4

[.NET Core] .NET Core llama a Baidu PaddleOCR para reconocer imágenes y textos

[Copiar enlace]
Publicado en 15/3/2021 18:21:43 | | | |
Antes de conocer PaddleOCR, primero entendamos PaddlePaddle. Basándose en los años de investigación tecnológica y aplicaciones empresariales de Baidu, PaddlePaddle es la primera plataforma de software de código abierto, tecnológicamente líder y totalmente funcional de aprendizaje profundo de grado industrial de China, integrando marcos básicos de formación e inferencia en aprendizaje profundo, bibliotecas básicas de modelos, kits de desarrollo de extremo a extremo y componentes de herramientas enriquecidos. Actualmente, Flying Paddle ha reunido a más de 2,65 millones de desarrolladores, ha servido a 100.000 empresas y ha generado 340.000 modelos basados en la plataforma de aprendizaje profundo de código abierto Flying Paddle. Flying Paddle ayuda a los desarrolladores a realizar rápidamente ideas de IA y a lanzar servicios de IA con rapidez. Ayudar a que cada vez más industrias completen el empoderamiento de la IA y logren la actualización de la inteligencia industrial.

Página web oficial:El inicio de sesión del hipervínculo es visible.

PaddleOCR tiene como objetivo crear una biblioteca de herramientas OCR rica, líder y práctica para ayudar a los usuarios a entrenar mejores modelos e implementarlos.

Primer vistazo a los renders:


(Imagen original)


(Tras la identificación,El borde etiquetado se dibuja por sí mismo según el resultado devuelto

Baidu Flying Paddle requiere un entorno Windows

Windows 7/8/10 Pro/Enterprise (64 bits)
La versión de GPU soporta CUDA 9.0/10.0/10.1/10.2/11.0, y solo soporta una sola tarjeta
Versión de Python 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 bits)
PIP versión 20.2.2+ (64 bits)

Nota: Si usas una versión superior de Python, como Python 3.9, obtendrás el siguiente error:

ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle
Solución:

Descarga una versión soportada, por ejemplo: versión 3.8.8, dirección de descarga:El inicio de sesión del hipervínculo es visible.

Necesitas confirmar que Python y pip son de 64 bits, que la arquitectura del procesador es x86_64 (o x64, Intel 64, AMD64), y actualmente PaddlePaddle no soporta la arquitectura arm64. La primera línea de abajo saca "64 bits", y la segunda línea "x86_64", "x64" o "AMD64".



D:\itsvse>python --version
Python 3.8.8

D:\itsvse>pip --version
PIP 20.2.3 de C:\Program Files\python38\lib\site-packages\pip (Python 3.8)

D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())"
64 bits
AMD64
Windows 10 instala la versión de CPU de PaddlePaddle

Mandar:

Verifica la instalación

Una vez completada la instalación, puedes usar python o python3 para introducir el intérprete de python, importar paddle y luego escribir paddle.utils.run_check()

si aparece¡PaddlePaddle está instalado con éxito!, indicando que has instalado correctamente. Como se muestra a continuación:



(No ejecutar) comando de desinstalación:

Instalar PaddleHub

Mandar:


Descargar Clone PaddleOCR

Usa el comando git clone para descargar condicionalmente, y descárgalo incondicionalmente directamente en un paquete comprimido y luego descomprimirlo, dirección:El inicio de sesión del hipervínculo es visible.

Lo descargué directamente y lo descomprimí en la carpeta :D:\itsvse\PaddleOCR-release-2.0.

Descargar el modelo de inferencia

Antes de instalar el módulo de servicio, necesitas preparar el modelo de inferencia y colocarlo en el camino correcto.

Modelo de Detección:El inicio de sesión del hipervínculo es visible.
Clasificador de dirección:El inicio de sesión del hipervínculo es visible.
Identifica el modelo:El inicio de sesión del hipervínculo es visible.

Después de descargarlo, lo coloqué bajo la carpeta D:\itsvse\PaddleOCR-release-2.0\deploy\model, como se muestra a continuación:



Instala el módulo de servicio de la serie de detección + identificación

Modifica la configuración de "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py" de la siguiente manera:

Utiliza la ventana cmd para ejecutar el siguiente comando en la carpeta D:\itsvse\PaddleOCR-release-2.0:

Comentario:Para modificar el archivo python bajo \hubserving\ocr_system, necesitas reinstalar el despliegue o ejecutar el comando anterior

Los errores pueden reportarse de la siguiente manera:


ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb'
Simplemente usa pip para instalar, por ejemplo: pip install imgaug

La instalación es la siguiente:

[2021-03-15 15:59:37,549] [INFO] - Desinstalada con éxito ocr_system
[2021-03-15 15:59:38,237] [INFO] - Instalado correctamente ocr_system-1.0.0



Inicia el servicio de ocr_system

Aquí los parámetros de configuración utilizan el archivo de configuración, primero modifican la configuración "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json" de la siguiente manera:

Inicia el servicio con el siguiente comando:



Prueba la imagen con el cliente de Python

Pon la imagen que quieres probar en la carpeta "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1" y ejecuta el siguiente comando en D:\itsvse\PaddleOCR-release-2.0:



test_hubserving.py El código fuente es el siguiente:

Prueba la imagen usando el cliente .NET Core

Sube el código directamente, de la siguiente manera:

{"msg":"","results":[[{"confidence":0.9994004964828491,"text":"Blog Statistics","text_region":[[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"Hola a todos, Soy un pequeño desgraciado, y empecé un blog el 5 de abril de 2015","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.99851745367017,"text":"A esta fecha 2021-03-1516:19:52","text_region":[[23,111],[ 217,111],[217,126],[23,126]]},{"confianza":0.9762932062149048,"texto":"Acumulado sobre. .NET 1184 artículos, 6844154 veces en total, 10505 comentarios en total","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"confidence":0.9847920536994934,"text":"Total de 2807 artículos, lectura acumulada 14210224 veces, 19074 reseñas","text_region":[[24,177],[414,177],[414,188],[24,189]]}]],"status":"000"}


Como uso el lado del servidor para desplegar máquinas virtuales, a veces se reportan errores de memoria:

No alugar memoria de 268418688 tamaño.
Solución temporal: reiniciar el servidor.

Recursos:

El inicio de sesión del hipervínculo es visible.
El inicio de sesión del hipervínculo es visible.

(Fin)





Anterior:ASP.NET Validación unificada de modelos de modelo del filtro Core(4)
Próximo:2% y 3% de transacciones distribuidas
Publicado en 16/6/2021 12:38:26 |
Mark Yibo, ven a aprender
 Propietario| Publicado en 13/11/2024 9:44:47 |
Tutorial de instalación de PaddlePaddle para Windows
https://www.itsvse.com/thread-10873-1-1.html
 Propietario| Publicado en 31/12/2024 13:25:03 |
.NET/C# utiliza FastDeploy para desplegar modelos OCR que reconocen texto
https://www.itsvse.com/thread-10911-1-1.html
 Propietario| Publicado en 24/4/2025 9:20:18 |
.NET/C# utiliza reconocimiento de texto de Tesseract a OCR para imágenes
https://www.itsvse.com/thread-10994-1-1.html
Renuncia:
Todo el software, materiales de programación o artículos publicados por Code Farmer Network son únicamente para fines de aprendizaje e investigación; El contenido anterior no se utilizará con fines comerciales o ilegales; de lo contrario, los usuarios asumirán todas las consecuencias. La información de este sitio proviene de Internet, y las disputas de derechos de autor no tienen nada que ver con este sitio. Debes eliminar completamente el contenido anterior de tu ordenador en un plazo de 24 horas desde la descarga. Si te gusta el programa, por favor apoya el software genuino, compra el registro y obtén mejores servicios genuinos. Si hay alguna infracción, por favor contáctanos por correo electrónico.

Mail To:help@itsvse.com