PaddleOCR'i tanımadan önce, önce PaddlePaddle'ı anlayalım. Baidu'nun yıllarca süren derin öğrenme teknolojisi araştırmaları ve iş uygulamalarına dayanan PaddlePaddle, Çin'in ilk açık kaynaklı, teknolojik olarak önde gelen ve tamamen işlevsel endüstriyel düzeyde derin öğrenme platformudur; derin öğrenme temel eğitim ve çıkarım çerçevelerini, temel model kütüphanelerini, uçtan uca geliştirme kitlerini ve zengin araç bileşenlerini entegre eder. Şu anda Flying Paddle, 2,65 milyondan fazla geliştirici toplamış, 100.000 işletmeye hizmet vermiş ve Flying Paddle açık kaynak derin öğrenme platformuna dayalı 340.000 model üretmiştir. Flying Paddle, geliştiricilerin yapay zeka fikirlerini hızla gerçekleştirmesine ve yapay zeka hizmetlerini hızla başlatmasına yardımcı oluyor. Daha fazla endüstrinin yapay zeka güçlendirmesini tamamlamasına ve endüstriyel zeki yükseltmesini gerçekleştirmesine yardımcı olmak.
Resmi Web Sitesi:Bağlantı girişi görünür.
PaddleOCR, kullanıcıların daha iyi modelleri eğitmesine ve uygulamalarına yardımcı olacak zengin, öncü ve pratik bir OCR araç kütüphanesi oluşturmayı hedefliyor.
İlk olarak renderlere bak:
(Orijinal fotoğraf)
(Tanımlamadan sonra,Etiketlenmiş sınır, geri dönen sonuca göre kendi başına çizilir)
Baidu Flying Paddle için Windows ortamı gereklidir
Windows 7/8/10 Pro/Enterprise (64bit) GPU sürümü CUDA 9.0/10.0/10.1/10.2/11.0 modellerini destekliyor ve sadece tek bir kartı destekliyor Python sürüm 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 bit) pip sürüm 20.2.2+ (64 bit)
Not: Python'un daha yüksek sürümlerini, örneğin Python 3.9'u kullanıyorsanız, aşağıdaki hatayı alırsınız:
ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle Çözüm:
Desteklenen bir sürümü indirin, örneğin: sürüm 3.8.8, indirme adresi:Bağlantı girişi görünür.
Python ve pip'in 64-bit olduğunu, işlemci mimarisinin x86_64 (veya x64, Intel 64, AMD64) mimarisi olduğunu ve şu anda PaddlePaddle'ın arm64 mimarisini desteklemediğini doğrulamanız gerekiyor. Aşağıdaki ilk satır "64bit" çıkışı verirken, ikinci satır "x86_64", "x64" veya "AMD64" çıkarır.
D:\itsvse>python --version Python 3.8.8
D:\itsvse>pip --version C:\program files\python38\lib\site-packages\pip (Python 3.8) dosyasından PIP 20.2.3
D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())" 64bit AMD64 Windows 10, PaddlePaddle CPU sürümünü yükledi
Komut:
Kurulumu doğrulayın
Kurulum tamamlandıktan sonra, python veya python3 kullanarak python yorumlayıcısına girebilir, import paddle girebilir ve ardından paddle.utils.run_check() yazabilirsiniz.
Eğer görünüyorsaPaddlePaddle başarıyla kuruldu!, başarılı bir şekilde kurulum yaptığınızı gösteriyor. Aşağıda gösterildiği gibi:
(Çalıştırmayın) kaldırma komutu:
PaddleHub'u Kurulum
Komut:
Clone PaddleOCR'i indir
git clone komutunu kullanarak koşullu indirin ve koşulsuz olarak doğrudan sıkıştırılmış bir pakete indirin ve sonra zip açın, adres:Bağlantı girişi görünür.
Doğrudan indirdim ve :D:\itsvse\PaddleOCR-release-2.0 klasörüne açtım.
Çıkarım modelini indirin
Servis modülünü kurmadan önce, çıkarım modelini hazırlamanız ve doğru yola koymanız gerekir.
Tespit Modeli:Bağlantı girişi görünür. Yön Sınıflandırıcısı:Bağlantı girişi görünür. Modeli belirleyin:Bağlantı girişi görünür.
İndirdikten sonra, aşağıda gösterildiği gibi D:\itsvse\PaddleOCR-release-2.0\deploy\model klasörüne koydum:
Tespit + tanımlama serisi servis modülünü kur
"D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py" yapılandırmasını aşağıdaki şekilde değiştirin:
D:\itsvse\PaddleOCR-release-2.0 klasörü altında aşağıdaki komutu çalıştırmak için cmd penceresini kullanın:
Açıklama:\hubserving\ocr_system altında python dosyasını değiştirmek için dağıtımı yeniden yüklemeniz veya yukarıdaki komutu çalıştırmanız gerekir。
Hatalar aşağıdaki şekilde bildirilebilir:
ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb' Kurulum için pip kullanın, örneğin: pip install imgaug
Kurulum şöyledir:
[2021-03-15 15:59:37,549] [ BİLGİ] - Başarıyla kaldırıldı ocr_system [2021-03-15 15:59:38,237] [ BİLGİLİ ] - ocr_system-1.0.0 başarıyla kuruldu
ocr_system hizmetini başlat
Burada yapılandırma parametreleri yapılandırma dosyasını kullanır, önce "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json" yapılandırmasını aşağıdaki şekilde değiştirir:
Hizmete aşağıdaki komutla başlayın:
Python istemcisiyle resmi test edin
Test etmek istediğiniz görüntüyü "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1" klasörüne koyun ve D:\itsvse\PaddleOCR-release-2.0'da aşağıdaki komutu çalıştırın:
test_hubserving.py Kaynak kodu şöyledir:
.NET Core istemcisiyle resmi test edin
Kodu doğrudan aşağıdaki şekilde yükleyin:
{"msg":"","results":[[{"confidence":0.9994004964828491,"text":"Blog Statistics","text_region":[[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"Herkese merhaba, Ben biraz pislikim ve 5 Nisan 2015'te bir blog başlattım","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.9985174536705017,"text":"Bu zamana itibarı2021-03-1516:19:52","text_region":[[23,111],[ 217,111],[217,126],[23,126]]},{"confidence":0.9762932062149048,"text":"Kümülatif hakkında. .NET 1184 makale, toplamda 6844154 kez, toplamda 10505 yorum","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"confidence":0.9847920536994934,"text":"Toplam 2807 makale, kümülatif okuma 14210224 kez, 19074 incelemeleri","text_region":[[24,177],[414,177],[414,188],[24,189]]}]],"status":"000"}
Sanal makine dağıtımının sunucu tarafını kullandığım için bazen bellek hataları bildiriliyor:
268418688 boyutta bellek ayıramadı. Geçici çözüm, sunucuyu yeniden başlatmak.
Kaynaklar:
Bağlantı girişi görünür.
Bağlantı girişi görünür.
(Son)
|