Prima di conoscere PaddleOCR, capiamoci prima di PaddlePaddle. Basandosi sugli anni di ricerca di Baidu in tecnologie di deep learning e applicazioni di business, PaddlePaddle è la prima piattaforma di deep learning di livello industriale open source, tecnologicamente leader e completamente funzionante in Cina, integrando framework di formazione e inferenza di deep learning, librerie di modelli di base, kit di sviluppo end-to-end e componenti di strumenti ricchi. Attualmente, Flying Paddle ha radunato più di 2,65 milioni di sviluppatori, servito 100.000 imprese e generato 340.000 modelli basati sulla piattaforma open source di deep learning Flying Paddle. Flying Paddle aiuta gli sviluppatori a realizzare rapidamente le idee dell'IA e a lanciare rapidamente i servizi di IA. Aiutare sempre più industrie a completare l'empowerment dell'IA e a realizzare l'aggiornamento dell'intelligenza industriale.
Sito ufficiale:Il login del link ipertestuale è visibile.
PaddleOCR mira a creare una libreria di strumenti OCR ricca, avanzata e pratica per aiutare gli utenti ad addestrare modelli migliori e implementarli.
Prima occhiata ai rendering:
(Immagine originale)
(Dopo l'identificazione,Il bordo etichettato viene disegnato da solo in base al risultato restituito)
Baidu Flying Paddle richiede l'ambiente Windows
Windows 7/8/10 Pro/Enterprise (64bit) La versione GPU supporta CUDA 9.0/10.0/10.1/10.2/11.0 e supporta solo una singola scheda Python versione 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 bit) PIP versione 20.2.2+ (64 bit)
Nota: Se stai usando una versione superiore di Python, come Python 3.9, riceverai il seguente errore:
ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle Soluzione:
Scarica una versione supportata, ad esempio: versione 3.8.8, indirizzo di download:Il login del link ipertestuale è visibile.
Devi confermare che Python e pip siano a 64 bit, e che l'architettura del processore sia x86_64 (o x64, Intel 64, AMD64), e attualmente PaddlePaddle non supporta l'architettura arm64. La prima riga qui sotto produce "64bit", mentre la seconda linea "x86_64", "x64" o "AMD64".
D:\itsvse>python --version Python 3.8.8
D:\itsvse>pip --version PIP 20.2.3 da C:\Program Files\python38\lib\site-packages\pip (Python 3.8)
D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())" 64 bit AMD64 Windows 10 installa la versione CPU PaddlePaddle
Comando:
Verifica l'installazione
Dopo il completamento dell'installazione, puoi usare python o python3 per inserire l'interprete python, inserire import paddle e poi digitare paddle.utils.run_check()
se apparePaddlePaddle è stato installato con successo!, che indica che hai installato con successo. Come mostrato di seguito:
(Non eseguire) comando disinstalla:
Installa PaddleHub
Comando:
Scarica Clone PaddleOCR
Usa il comando git clone per scaricare condizionatamente, scaricalo incondizionatamente direttamente in un pacchetto compresso e poi scomprimilo, indirizzo:Il login del link ipertestuale è visibile.
L'ho scaricato direttamente e l'ho scompresso nella cartella :D:\itsvse\PaddleOCR-release-2.0.
Scarica il modello di inferenza
Prima di installare il modulo di servizio, devi preparare il modello di inferenza e inserirlo nel percorso corretto.
Modello di rilevamento:Il login del link ipertestuale è visibile. Classificatore di Direzione:Il login del link ipertestuale è visibile. Identifica il modello:Il login del link ipertestuale è visibile.
Dopo averlo scaricato, l'ho inserito nella cartella D:\itsvse\PaddleOCR-release-2.0\deploy\model, come mostrato qui sotto:
Installa il modulo di servizio serie di rilevamento + identificazione
Modifica la configurazione "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py" come segue:
Usa la finestra cmd per eseguire il seguente comando nella cartella D:\itsvse\PaddleOCR-release-2.0:
Osservazione:Per modificare il file python sotto \hubserving\ocr_system, devi reinstallare il deployment o eseguire il comando sopra。
Gli errori possono essere segnalati come segue:
ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb' Basta usare pip per installare, ad esempio: installazione pip imgaug
L'installazione è la seguente:
[2021-03-15 15:59:37,549] [ INFO] - Disinstallato con successo ocr_system [2021-03-15 15:59:38,237] [ INFO] - Installato con successo ocr_system-1.0.0
Avvia il servizio ocr_system
Qui i parametri di configurazione utilizzano il file di configurazione, modificando prima la configurazione "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json" come segue:
Inizia il servizio con il seguente comando:
Testa l'immagine con il client Python
Metti l'immagine che vuoi testare nella cartella "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1" ed esegui il seguente comando in D:\itsvse\PaddleOCR-release-2.0:
test_hubserving.py Il codice sorgente è il seguente:
Prova l'immagine usando il client .NET Core
Carica direttamente il codice, come segue:
{"msg":"","results":[[{"confidence":0.9994004964828491,"text":"Blog Statistics","text_region":[[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"Ciao a tutti, Sono un piccolo, e ho iniziato un blog il 5 aprile 2015","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.9985174536705017,"text":"A questo punto2021-03-1516:19:52","text_region":[[23,111],[ 217,111],[217,126],[23,126]]},{"fiducia":0.9762932062149048,"testo":"Cumulativo riguardo. .NET 1184 articoli, 6844154 volte in totale, 10505 commenti in totale","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"confidence":0.9847920536994934,"testo":"Totale 2807 articoli, lettura cumulativa 14210224 volte, 19074 recensioni","text_region":[[24,177],[414,177],[414,188],[24,189]]}]],"status":"000"}
Poiché uso il lato server per la distribuzione di macchine virtuali, a volte vengono segnalati errori di memoria:
Non trovare memoria di 268418688 dimensione. Soluzione temporanea: riavviare il server.
Risorse:
Il login del link ipertestuale è visibile.
Il login del link ipertestuale è visibile.
(Fine)
|