Este artigo é um artigo espelhado de tradução automática, por favor clique aqui para ir para o artigo original.

Vista: 55804|Resposta: 4

[.NET Core] O .NET Core chama o Baidu PaddleOCR para reconhecer imagens e textos

[Copiar link]
Publicado em 15/03/2021 18:21:43 | | | |
Antes de conhecermos o PaddleOCR, vamos primeiro entender o PaddlePaddle. Baseada nos anos de pesquisa da Baidu em tecnologia de deep learning e aplicações de negócios, a PaddlePaddle é a primeira plataforma de deep learning de nível industrial open source, tecnologicamente líder e totalmente funcional da China, integrando frameworks centrais de treinamento e inferência de deep learning, bibliotecas básicas de modelos, kits de desenvolvimento de ponta a ponta e componentes de ferramentas ricos. Atualmente, o Flying Paddle reuniu mais de 2,65 milhões de desenvolvedores, atendeu 100.000 empresas e gerou 340.000 modelos baseados na plataforma open source de deep learning Flying Paddle. O Flying Paddle ajuda desenvolvedores a realizar rapidamente ideias de IA e lançar serviços de IA rapidamente. Ajudar cada vez mais indústrias a completar o empoderamento da IA e a realizar a atualização da inteligência industrial.

Site Oficial:O login do hiperlink está visível.

O PaddleOCR tem como objetivo criar uma biblioteca de ferramentas de OCR rica, avançada e prática para ajudar os usuários a treinar modelos melhores e implementá-los.

Primeira olhada nas renderizações:


(Foto original)


(Após a identificação,A borda rotulada é desenhada sozinha com base no resultado retornado

Baidu Flying Paddle requer ambiente Windows

Windows 7/8/10 Pro/Enterprise (64 bits)
A versão da GPU suporta CUDA 9.0/10.0/10.1/10.2/11.0 e suporta apenas uma única placa
Versão de Python 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 bits)
PIP versão 20.2.2+ (64 bits)

Nota: Se você estiver usando uma versão superior do Python, como o Python 3.9, receberá o seguinte erro:

ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle
Solução:

Baixe uma versão suportada, por exemplo: versão 3.8.8, endereço de download:O login do hiperlink está visível.

Você precisa confirmar que Python e pip são 64-bit, e que a arquitetura do processador é x86_64 (ou x64, Intel 64, AMD64), e atualmente o PaddlePaddle não suporta arquitetura arm64. A primeira linha abaixo mostra "64 bits", e a segunda linha mostra "x86_64", "x64" ou "AMD64".



D:\itsvse>python --version
Python 3.8.8

D:\itsvse>pip --version
PIP 20.2.3 de C:\Program Files\python38\lib\site-packages\pip (Python 3.8)

D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())"
64 bits
AMD64
O Windows 10 instala a versão do processador PaddlePaddle

Comando:

Verifique a instalação

Após a instalação terminar, você pode usar python ou python3 para inserir o interpretador python, digitar import paddle e então digitar paddle.utils.run_check()

se aparecerPaddlePaddle foi instalado com sucesso!, indicando que você instalou com sucesso. Como mostrado abaixo:



(Não executar) comando de desinstalar:

Instale o PaddleHub

Comando:


Baixar Clone PaddleOCR

Use o comando git clone para baixar condicionalmente, baixe incondicionalmente diretamente em um pacote comprimido e então descompacte, endereço:O login do hiperlink está visível.

Baixei diretamente e descompressei na pasta :D:\itsvse\PaddleOCR-release-2.0.

Baixe o modelo de inferência

Antes de instalar o módulo de serviço, você precisa preparar o modelo de inferência e colocá-lo no caminho correto.

Modelo de Detecção:O login do hiperlink está visível.
Classificador de Direção:O login do hiperlink está visível.
Identifique o modelo:O login do hiperlink está visível.

Depois de baixá-lo, coloquei na pasta D:\itsvse\PaddleOCR-release-2.0\deploy\model, como mostrado abaixo:



Instalar o módulo de serviço série de detecção + identificação

Modifique a configuração "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py" da seguinte forma:

Use a janela cmd para executar o seguinte comando na pasta D:\itsvse\PaddleOCR-release-2.0:

Comentário:Para modificar o arquivo python sob \hubserving\ocr_system, você precisa reinstalar a implantação ou executar o comando acima

Erros podem ser reportados da seguinte forma:


ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb'
Basta usar pip para instalar, por exemplo: pip install imgaug

A instalação é a seguinte:

[2021-03-15 15:59:37,549] [ INFO] - Desinstalei com sucesso ocr_system
[2021-03-15 15:59:38,237] [ INFO] - Instalado com sucesso ocr_system-1.0.0



Inicie o serviço ocr_system

Aqui, os parâmetros de configuração usam o arquivo de configuração, primeiro modificando a configuração "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json", da seguinte forma:

Inicie o serviço com o seguinte comando:



Teste a imagem com o cliente Python

Coloque a imagem que você deseja testar na pasta "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1" e execute o seguinte comando em D:\itsvse\PaddleOCR-release-2.0:



test_hubserving.py O código-fonte é o seguinte:

Teste a imagem usando o cliente .NET Core

Envie o código diretamente, conforme segue:

{"msg":"","results":[[{"confidence":0.9994004964828491,"text":"Blog Statistics","text_region":[[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"Olá a todos, Sou um pequeno, e comecei um blog em 5 de abril de 2015","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.9985174536705017,"text":"A partir deste momento2021-03-1516:19:52","text_region":[[23,111],[ 217.111],[217.126],[23.126]]},{"confiança":0.9762932062149048,"texto":"Acumulado sobre. .NET 1184 artigos, 6844154 vezes no total, 10.505 comentários no total","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"confidence":0.9847920536994934,"text":"Total de 2807 artigos, leitura acumulada 14210224 vezes, 19074 resenhas","text_region":[[24,177],[414,177],[414,188],[24,189]]}]],"status":"000"}


Como estou usando o lado do servidor para implantação em máquinas virtuais, às vezes são relatados erros de memória:

Não consigo lembrar 268418688 tamanho.
Solução temporária: reiniciar o servidor.

Recursos:

O login do hiperlink está visível.
O login do hiperlink está visível.

(Fim)





Anterior:ASP.NET Validação unificada do modelo ModelState do filtro Core(4)
Próximo:2% &&3% de transações distribuídas
Publicado em 16/06/2021 12:38:26 |
Mark Yibo, venha aprender
 Senhorio| Publicado em 13/11/2024 09:44:47 |
Tutorial de instalação do PaddlePaddle para Windows
https://www.itsvse.com/thread-10873-1-1.html
 Senhorio| Publicado em 31/12/2024 13:25:03 |
.NET/C# usa o FastDeploy para implantar modelos OCR para reconhecer texto
https://www.itsvse.com/thread-10911-1-1.html
 Senhorio| Publicado em 24/04/2025 09:20:18 |
.NET/C# usa reconhecimento de texto do Tesseract para OCR para imagens
https://www.itsvse.com/thread-10994-1-1.html
Disclaimer:
Todo software, material de programação ou artigos publicados pela Code Farmer Network são apenas para fins de aprendizado e pesquisa; O conteúdo acima não deve ser usado para fins comerciais ou ilegais, caso contrário, os usuários terão todas as consequências. As informações deste site vêm da Internet, e disputas de direitos autorais não têm nada a ver com este site. Você deve deletar completamente o conteúdo acima do seu computador em até 24 horas após o download. Se você gosta do programa, por favor, apoie um software genuíno, compre o registro e obtenha serviços genuínos melhores. Se houver qualquer infração, por favor, entre em contato conosco por e-mail.

Mail To:help@itsvse.com