Sebelum kita mengenal PaddleOCR, mari kita pahami terlebih dahulu PaddlePaddle. Berdasarkan penelitian dan aplikasi bisnis teknologi pembelajaran mendalam Baidu selama bertahun-tahun, PaddlePaddle adalah platform pembelajaran mendalam kelas industri sumber terbuka pertama di Tiongkok, terdepan secara teknologi, dan berfungsi penuh, mengintegrasikan pelatihan inti pembelajaran mendalam dan kerangka kerja inferensi, pustaka model dasar, kit pengembangan end-to-end, dan komponen alat yang kaya. Saat ini, Flying Paddle telah mengumpulkan lebih dari 2,65 juta pengembang, melayani 100.000 perusahaan, dan menghasilkan 340.000 model berdasarkan platform pembelajaran mendalam open source Flying Paddle. Flying Paddle membantu pengembang dengan cepat mewujudkan ide AI dan meluncurkan layanan AI dengan cepat. Bantu semakin banyak industri menyelesaikan pemberdayaan AI dan mewujudkan peningkatan cerdas industri.
Situs resmi:Login hyperlink terlihat.
PaddleOCR bertujuan untuk membuat pustaka alat OCR yang kaya, terkemuka, dan praktis untuk membantu pengguna melatih model yang lebih baik dan menerapkannya.
Pertama lihat renderingnya:
(Gambar asli)
(Setelah identifikasi,Batas berlabel digambar dengan sendirinya berdasarkan hasil yang ditampilkan)
Baidu Flying Paddle membutuhkan lingkungan Windows
Windows 7/8/10 Pro/Enterprise (64bit) Versi GPU mendukung CUDA 9.0/10.0/10.1/10.2/11.0, dan hanya mendukung satu kartu Versi Python 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 bit) PIP versi 20.2.2+ (64 bit)
Catatan: Jika Anda menggunakan versi Python yang lebih tinggi, seperti Python 3.9, Anda akan mendapatkan kesalahan berikut:
ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle Larutan:
Mendownload versi yang didukung, misalnya: versi 3.8.8, alamat download:Login hyperlink terlihat.
Anda perlu mengonfirmasi bahwa Python dan pip adalah 64-bit, dan arsitektur prosesor adalah arsitektur x86_64 (atau x64, Intel 64, AMD64), dan saat ini PaddlePaddle tidak mendukung arsitektur arm64. Baris pertama di bawah mengeluarkan "64bit", dan baris kedua mengeluarkan "x86_64", "x64" atau "AMD64".
D:\itsvse>python --version Python 3.8.8
D:\itsvse>pip --version pip 20.2.3 dari c:\program files\python38\lib\site-packages\pip (python 3.8)
D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())" 64bit AMD64 Windows 10 menginstal versi CPU PaddlePaddle
Perintah:
Verifikasi instalasi
Setelah penginstalan selesai, Anda dapat menggunakan python atau python3 untuk memasukkan penerjemah python, masukkan dayung impor, lalu ketik paddle.utils.run_check()
jika munculPaddlePaddle berhasil diinstal!, yang menunjukkan bahwa Anda telah berhasil menginstal. Seperti yang ditunjukkan di bawah ini:
(Jangan jalankan) perintah uninstall:
Instal PaddleHub
Perintah:
Unduh Clone PaddleOCR
Gunakan perintah git clone untuk mengunduh secara bersyarat, dan tanpa syarat mengunduhnya langsung ke dalam paket terkompresi dan kemudian mengekstraknya, alamat:Login hyperlink terlihat.
Saya mengunduhnya secara langsung dan membuka ritsletingnya ke folder :D:\itsvse\PaddleOCR-release-2.0.
Unduh model inferensi
Sebelum menginstal modul layanan, Anda perlu menyiapkan model inferensi dan meletakkannya di jalur yang benar.
Model Deteksi:Login hyperlink terlihat. Pengklasifikasi Arah:Login hyperlink terlihat. Identifikasi model:Login hyperlink terlihat.
Setelah mengunduhnya, saya menempatkannya di bawah folder D:\itsvse\PaddleOCR-release-2.0\deploy\model, seperti yang ditunjukkan di bawah ini:
Instal modul layanan seri deteksi + identifikasi
Ubah konfigurasi "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py" sebagai berikut:
Gunakan jendela cmd untuk menjalankan perintah berikut di bawah folder D:\itsvse\PaddleOCR-release-2.0:
Pernyataan:Untuk memodifikasi file python di bawah \hubserving\ocr_system, Anda perlu menginstal ulang penyebaran atau menjalankan perintah di atas。
Kesalahan dapat dilaporkan sebagai berikut:
ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb' Cukup gunakan pip untuk menginstal, misalnya: pip install imgaug
Pemasangannya adalah sebagai berikut:
[2021-03-15 15:59:37,549] [ INFO] - Berhasil menghapus ocr_system [2021-03-15 15:59:38,237] [ INFO] - Berhasil menginstal ocr_system-1.0.0
Mulai layanan ocr_system
Di sini parameter konfigurasi menggunakan file konfigurasi, pertama-tama memodifikasi konfigurasi "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json", sebagai berikut:
Mulai layanan dengan perintah berikut:
Uji gambar dengan klien python
Masukkan gambar yang ingin Anda uji ke dalam folder "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1", dan jalankan perintah berikut di D:\itsvse\PaddleOCR-release-2.0:
test_hubserving.py Kode sumbernya adalah sebagai berikut:
Menguji gambar menggunakan klien .NET Core
Unggah kode secara langsung, sebagai berikut:
{"msg":"","results":[[{"confidence":0.9994004964828491,"text":"Statistik Blog","text_region":[[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"Halo semuanya, Saya sedikit, dan saya memulai blog pada 5 April 2015","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.9985174536705017,"text":"Sampai saat ini2021-03-1516:19:52","text_region":[[23,111],[ 217,111],[217,126],[23,126]]},{"confidence":0.9762932062149048,"text":"Kumulatif tentang. .NET 1184 artikel, total 6844154 kali, total 10505 komentar","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"confidence":0.9847920536994934,"text":"Total 2807 artikel, bacaan kumulatif 14210224 kali, Ulasan 19074","text_region":[[24,177],[414,177],[414,188],[24,189]]}]],"status":"000"}
Karena saya menggunakan sisi server penyebaran mesin virtual, terkadang kesalahan memori dilaporkan:
Gagal mengalokasikan memori dengan ukuran 268418688. Solusi sementara, mulai ulang server.
Sumber daya:
Login hyperlink terlihat.
Login hyperlink terlihat.
(Akhir)
|