Zanim poznamy PaddleOCR, najpierw przyjrzyjmy się PaddlePaddle. Opierając się na wieloletnich badaniach technologii deep learning i zastosowaniach biznesowych Baidu, PaddlePaddle jest pierwszą w Chinach otwartoźródłową, technologicznie wiodącą i w pełni funkcjonalną platformą do głębokiego uczenia przemysłowego, integrującą podstawowe ramy treningowe i wnioskowania do głębokiego uczenia, podstawowe biblioteki modeli, kompleksowe zestawy deweloperskie oraz bogate komponenty narzędzi. Obecnie Flying Paddle zgromadził ponad 2,65 miliona deweloperów, obsłużył 100 000 przedsiębiorstw i wygenerował 340 000 modeli opartych na otwartoźródłowej platformie deep learning Flying Paddle. Flying Paddle pomaga deweloperom szybko realizować pomysły AI i szybko uruchamiać usługi AI. Pomagaj coraz większej liczbie branż w realizacji wzmocnienia AI i realizacji nowoczesnych rozwiązań przemysłowych.
Oficjalna strona internetowa:Logowanie do linku jest widoczne.
PaddleOCR ma na celu stworzenie bogatej, przełomowej i praktycznej biblioteki narzędzi OCR, która pomoże użytkownikom trenować lepsze modele i wdrażać je.
Najpierw spójrz na wizualizacje:
(Oryginalne zdjęcie)
(Po identyfikacji,Oznaczona ramka jest rysowana samodzielnie na podstawie zwróconego wyniku)
Baidu Flying Paddle wymaga środowiska Windows
Windows 7/8/10 Pro/Enterprise (64bit) Wersja GPU obsługuje CUDA 9.0/10.0/10.1/10.2/11.0 i obsługuje tylko jedną kartę Wersja Python 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64 bit) Wersja 20.2.2+ (64 bit)
Uwaga: Jeśli używasz wyższej wersji Pythona, takiej jak Python 3.9, otrzymasz następujący błąd:
ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle Rozwiązanie:
Pobierz obsługiwaną wersję, na przykład: wersja 3.8.8, adres pobrania:Logowanie do linku jest widoczne.
Musisz potwierdzić, że Python i są 64-bitowe, a architektura procesora to architektura x86_64 (lub x64, Intel 64, AMD64), a obecnie PaddlePaddle nie obsługuje architektury arm64. Pierwsza linia poniżej daje sygnał "64bit", a druga linia "x86_64", "x64" lub "AMD64".
D:\itsvse>python --version Python 3.8.8
D:\itsvse>pip --version 20.2.3 z C:\Program Files\Python38\lib\site-packages\(Python 3.8)
D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())" 64bit AMD64 Windows 10 instaluje wersję CPU PaddlePaddle
Polecenie:
Sprawdź instalację
Po zakończeniu instalacji możesz użyć Pythona lub Python3, aby wprowadzić interpreter Pythona, wprowadzić Import Paddle, a następnie wpisać paddle.utils.run_check()
jeśli się pojawiPaddlePaddle został pomyślnie zainstalowany!, co oznacza, że zainstalowałeś go pomyślnie. Jak pokazano poniżej:
(Nie wykonuj) polecenie odinstaluj:
Zainstaluj PaddleHub
Polecenie:
Pobierz Clone PaddleOCR
Użyj polecenia git clone, aby pobrać warunkowo, a następnie bezwarunkowo pobierz go bezpośrednio do skompresowanego pakietu, a następnie rozpakuj go, adres:Logowanie do linku jest widoczne.
Pobrałem ją bezpośrednio i rozpakowałem do folderu :D:\itsvse\PaddleOCR-release-2.0.
Pobierz model wnioskowania
Przed instalacją modułu serwisowego musisz przygotować model wnioskowania i ustawić go na właściwej ścieżce.
Model detekcji:Logowanie do linku jest widoczne. Klasyfikator kierunku:Logowanie do linku jest widoczne. Zidentyfikuj model:Logowanie do linku jest widoczne.
Po pobraniu umieściłem go w folderze D:\itsvse\PaddleOCR-release-2.0\deploy\model, jak pokazano poniżej:
Zainstaluj moduł serwisowy detekcji + identyfikacji
Zmodyfikuj konfigurację "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py" w następujący sposób:
Użyj okna cmd, aby wykonać następujące polecenie w folderze D:\itsvse\PaddleOCR-release-2.0:
Uwaga:Aby zmodyfikować plik pythona w \hubserving\ocr_system, musisz ponownie zainstalować wdrożenie lub wykonać powyższe polecenie。
Błędy mogą być zgłaszane w następujący sposób:
ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb' Po prostu użyj do instalacji, na przykład: install imgaug
Instalacja wygląda następująco:
[2021-03-15 15:59:37,549] [ INFORMACJE] - Pomyślnie odinstalowałem ocr_system [2021-03-15 15:59:38,237] [ INFORMACJA ] - Pomyślnie zainstalowano ocr_system-1.0.0
Rozpocznij usługę ocr_system
Tutaj parametry konfiguracyjne wykorzystują plik konfiguracyjny, najpierw zmodyfikuj konfigurację "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json", w następujący sposób:
Rozpocznij nabożeństwo następującym poleceniem:
Przetestuj obraz za pomocą klienta Pythona
Włóż obraz, który chcesz przetestować, do folderu "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1" i uruchom następujące polecenie w D:\itsvse\PaddleOCR-release-2.0:
test_hubserving.py Kod źródłowy przedstawia się następująco:
Przetestuj obraz za pomocą klienta .NET Core
Bezpośrednio przesłaj kod, w następujący sposób:
{"msg":"","results":[{"confidence":0.9994004964828491,"text":"Blog Statistics","text_region":[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"Witam wszystkich, Jestem małym i zacząłem prowadzić bloga 5 kwietnia 2015","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"pewność":0.9985174536705017,"tekst":"Na ten moment 2021-03-1516:19:52","text_region":[[23,111],[ 217,111],[217,126],[23,126]]},{"pewność":0.9762932062149048,"tekst":"Kumulatywne o. .NET 1184 artykułów, łącznie 6844154 razy, łącznie 10505 komentarzy","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"pewność":0.9847920536994934,"text":"Łącznie 2807 artykułów, łącznie czytanych 14210224 razy, 19074 recenzje","text_region":[24,177],[414,177],[414,188],[24,189]]}],"status":"000"}
Ponieważ korzystam ze strony serwera przy wdrażaniu maszyn wirtualnych, czasami zgłaszane są błędy pamięci:
Nie udało się przydzielić pamięci o 268418688 rozmiarze. Tymczasowe rozwiązanie, zrestartuj serwer.
Zasoby:
Logowanie do linku jest widoczne.
Logowanie do linku jest widoczne.
(Koniec)
|