Antes de conhecermos o PaddleOCR, vamos primeiro entender o PaddlePaddle. Baseada nos anos de pesquisa da Baidu em tecnologia de deep learning e aplicações de negócios, a PaddlePaddle é a primeira plataforma de deep learning de nível industrial open source, tecnologicamente líder e totalmente funcional da China, integrando frameworks centrais de treinamento e inferência de deep learning, bibliotecas básicas de modelos, kits de desenvolvimento de ponta a ponta e componentes de ferramentas ricos. Atualmente, o Flying Paddle reuniu mais de 2,65 milhões de desenvolvedores, atendeu 100.000 empresas e gerou 340.000 modelos baseados na plataforma open source de deep learning Flying Paddle. O Flying Paddle ajuda desenvolvedores a realizar rapidamente ideias de IA e lançar serviços de IA rapidamente. Ajudar cada vez mais indústrias a completar o empoderamento da IA e a realizar a atualização da inteligência industrial.
Site Oficial:O login do hiperlink está visível.
O PaddleOCR tem como objetivo criar uma biblioteca de ferramentas de OCR rica, avançada e prática para ajudar os usuários a treinar modelos melhores e implementá-los.
Primeira olhada nas renderizações:
(Foto original)
(Após a identificação,A borda rotulada é desenhada sozinha com base no resultado retornado)
Baidu Flying Paddle requer ambiente Windows
Windows 7/8/10 Pro/Enterprise (64 bits) A versão da GPU suporta CUDA 9.0/10.0/10.1/10.2/11.0 e suporta apenas uma única placa Versão de Python 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 bits) PIP versão 20.2.2+ (64 bits)
Nota: Se você estiver usando uma versão superior do Python, como o Python 3.9, receberá o seguinte erro:
ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle Solução:
Baixe uma versão suportada, por exemplo: versão 3.8.8, endereço de download:O login do hiperlink está visível.
Você precisa confirmar que Python e pip são 64-bit, e que a arquitetura do processador é x86_64 (ou x64, Intel 64, AMD64), e atualmente o PaddlePaddle não suporta arquitetura arm64. A primeira linha abaixo mostra "64 bits", e a segunda linha mostra "x86_64", "x64" ou "AMD64".
D:\itsvse>python --version Python 3.8.8
D:\itsvse>pip --version PIP 20.2.3 de C:\Program Files\python38\lib\site-packages\pip (Python 3.8)
D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())" 64 bits AMD64 O Windows 10 instala a versão do processador PaddlePaddle
Comando:
Verifique a instalação
Após a instalação terminar, você pode usar python ou python3 para inserir o interpretador python, digitar import paddle e então digitar paddle.utils.run_check()
se aparecerPaddlePaddle foi instalado com sucesso!, indicando que você instalou com sucesso. Como mostrado abaixo:
(Não executar) comando de desinstalar:
Instale o PaddleHub
Comando:
Baixar Clone PaddleOCR
Use o comando git clone para baixar condicionalmente, baixe incondicionalmente diretamente em um pacote comprimido e então descompacte, endereço:O login do hiperlink está visível.
Baixei diretamente e descompressei na pasta :D:\itsvse\PaddleOCR-release-2.0.
Baixe o modelo de inferência
Antes de instalar o módulo de serviço, você precisa preparar o modelo de inferência e colocá-lo no caminho correto.
Modelo de Detecção:O login do hiperlink está visível. Classificador de Direção:O login do hiperlink está visível. Identifique o modelo:O login do hiperlink está visível.
Depois de baixá-lo, coloquei na pasta D:\itsvse\PaddleOCR-release-2.0\deploy\model, como mostrado abaixo:
Instalar o módulo de serviço série de detecção + identificação
Modifique a configuração "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py" da seguinte forma:
Use a janela cmd para executar o seguinte comando na pasta D:\itsvse\PaddleOCR-release-2.0:
Comentário:Para modificar o arquivo python sob \hubserving\ocr_system, você precisa reinstalar a implantação ou executar o comando acima。
Erros podem ser reportados da seguinte forma:
ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb' Basta usar pip para instalar, por exemplo: pip install imgaug
A instalação é a seguinte:
[2021-03-15 15:59:37,549] [ INFO] - Desinstalei com sucesso ocr_system [2021-03-15 15:59:38,237] [ INFO] - Instalado com sucesso ocr_system-1.0.0
Inicie o serviço ocr_system
Aqui, os parâmetros de configuração usam o arquivo de configuração, primeiro modificando a configuração "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json", da seguinte forma:
Inicie o serviço com o seguinte comando:
Teste a imagem com o cliente Python
Coloque a imagem que você deseja testar na pasta "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1" e execute o seguinte comando em D:\itsvse\PaddleOCR-release-2.0:
test_hubserving.py O código-fonte é o seguinte:
Teste a imagem usando o cliente .NET Core
Envie o código diretamente, conforme segue:
{"msg":"","results":[[{"confidence":0.9994004964828491,"text":"Blog Statistics","text_region":[[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"Olá a todos, Sou um pequeno, e comecei um blog em 5 de abril de 2015","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.9985174536705017,"text":"A partir deste momento2021-03-1516:19:52","text_region":[[23,111],[ 217.111],[217.126],[23.126]]},{"confiança":0.9762932062149048,"texto":"Acumulado sobre. .NET 1184 artigos, 6844154 vezes no total, 10.505 comentários no total","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"confidence":0.9847920536994934,"text":"Total de 2807 artigos, leitura acumulada 14210224 vezes, 19074 resenhas","text_region":[[24,177],[414,177],[414,188],[24,189]]}]],"status":"000"}
Como estou usando o lado do servidor para implantação em máquinas virtuais, às vezes são relatados erros de memória:
Não consigo lembrar 268418688 tamanho. Solução temporária: reiniciar o servidor.
Recursos:
O login do hiperlink está visível.
O login do hiperlink está visível.
(Fim)
|