PaddleOCR을 알아보기 전에, 먼저 PaddlePaddle을 먼저 이해해 봅시다. 바이두의 다년간의 딥러닝 기술 연구와 비즈니스 응용을 바탕으로 한 PaddlePaddle은 중국 최초의 오픈 소스이자 기술적으로 선도적이며 완전한 산업용 딥러닝 플랫폼으로, 딥러닝 핵심 학습 및 추론 프레임워크, 기본 모델 라이브러리, 엔드 투 엔드 개발 키트, 풍부한 도구 구성 요소를 통합했습니다. 현재 플라잉 패들은 265만 명 이상의 개발자를 모았고, 10만 개의 기업에 서비스를 제공하며, 플라잉 패들 오픈 소스 딥러닝 플랫폼을 기반으로 34만 개의 모델을 생성했습니다. 플라잉 패들은 개발자들이 AI 아이디어를 빠르게 실현하고 AI 서비스를 신속하게 출시할 수 있도록 돕습니다. 더 많은 산업이 AI 역량을 완성하고 산업 지능 업그레이드를 실현할 수 있도록 돕습니다.
공식 웹사이트:하이퍼링크 로그인이 보입니다.
PaddleOCR은 사용자가 더 나은 모델을 훈련하고 구현할 수 있도록 풍부하고 선도적이며 실용적인 OCR 도구 라이브러리를 만드는 것을 목표로 합니다.
렌더링을 먼저 살펴보세요:
(원본 사진)
(확인 후,라벨이 붙은 경계선은 반환된 결과를 바탕으로 스스로 그립니다)
바이두 플라잉 패들은 윈도우 환경이 필요합니다
윈도우 7/8/10 프로/엔터프라이즈 (64비트) GPU 버전은 CUDA 9.0/10.0/10.1/10.2/11.0을 지원하며, 단일 카드만 지원합니다 파이썬 버전 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64비트) PIP 버전 20.2.2+ (64비트)
참고: Python 3.9와 같은 상위 버전의 Python을 사용 중이라면 다음과 같은 오류가 발생할 수 있습니다:
ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle 용액:
지원 버전을 다운로드하세요. 예를 들어: 버전 3.8.8, 다운로드 주소:하이퍼링크 로그인이 보입니다.
Python과 pip이 64비트임을 확인해야 하며, 프로세서 아키텍처가 x86_64(또는 x64, Intel 64, AMD64) 아키텍처인지, 현재 PaddlePaddle은 arm64 아키텍처를 지원하지 않습니다. 아래 첫 번째 줄은 "64bit"를, 두 번째 줄은 "x86_64", "x64" 또는 "AMD64"를 출력합니다.
D:\itsvse>python --version 파이썬 3.8.8
D:\itsvse>pip --version C:\Program Files\Python38\Lib\Site-Packages\PIP (Python 3.8)에서 PIP 20.2.3
D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())" 64비트 AMD64 Windows 10은 PaddlePaddle CPU 버전을 설치합니다
명령:
설치 상태 확인해 보세요
설치가 완료되면 python이나 python3를 사용해 python 인터프리터에 입력하고, import paddle을 입력한 후 paddle.utils.run_check()를 입력할 수 있습니다.
만약 나타나면패들패들이 성공적으로 설치되었습니다!, 성공적으로 설치되었음을 나타냅니다. 아래에 나와 있습니다:
(실행하지 않음) 삭제 명령어:
PaddleHub 설치
명령:
클론 패들OCR 다운로드
git clone 명령어를 사용해 조건부 다운로드, 그리고 무조건적으로 압축된 패키지로 직접 다운로드한 후 압축을 풀어주세요. 주소:하이퍼링크 로그인이 보입니다.
직접 다운로드해서 압축 해제해서 폴더 :D:\itsvse\PaddleOCR-release-2.0에 넣었습니다.
추론 모델 다운로드
서비스 모듈을 설치하기 전에 추론 모델을 준비하고 올바른 경로에 배치해야 합니다.
탐지 모델:하이퍼링크 로그인이 보입니다. 방향 분류기:하이퍼링크 로그인이 보입니다. 모델 식별:하이퍼링크 로그인이 보입니다.
다운로드한 후, 아래와 같이 D:\itsvse\PaddleOCR-release-2.0\deploy\model 폴더 아래에 배치했습니다:
탐지 + 식별 시리즈 서비스 모듈을 설치하세요
"D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py" 구성을 다음과 같이 수정하세요:
d:\itsvse\PaddleOCR-release-2.0 폴더 아래의 cmd 창을 사용하여 다음 명령을 실행하세요:
말:\hubserving\ocr_system 아래의 파이썬 파일을 수정하려면 배포를 재설치하거나 위 명령을 실행해야 합니다。
오류는 다음과 같이 보고될 수 있습니다:
ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb' 예를 들어, pip install imgaug 같은 방법으로 설치하세요.
설치 방식은 다음과 같습니다:
[2021-03-15 15:59:37,549] [ 정보] - 성공적으로 삭제 ocr_system [2021-03-15 15:59:38,237] [ 정보] - ocr_system-1.0.0 성공적으로 설치 완료
ocr_system 서비스 시작하세요
여기서 구성 매개변수는 구성 파일을 사용하며, 먼저 "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json" 구성을 다음과 같이 수정합니다:
다음 명령어로 서비스를 시작합니다:
파이썬 클라이언트로 이미지를 테스트해 보세요
테스트하고 싶은 이미지를 "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1" 폴더에 넣고, D:\itsvse\PaddleOCR-release-2.0에서 다음 명령을 실행하세요:
test_hubserving.py 소스 코드는 다음과 같습니다:
.NET Core 클라이언트로 화면을 테스트해 보세요
코드를 직접 업로드하세요, 다음과 같습니다:
{"msg":"","results":[[{"confidence":0.9994004964828491,"text":"Blog Statistics","text_region":[[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"안녕하세요 여러분, 나는 작은 쓰레기야, 그리고 2015년 4월 5일에 블로그를 시작했어","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.9985174536705017,"text":"현재2021-03-1516:19:52","text_region":[[23,111],[ 217,111],[217,126],[23,126]]},{"confidence":0.9762932062149048,"text":"누적된 about. .NET 1184개의 기사, 총 6844154회, 총 10505개의 댓글","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"confidence":0.9847920536994934,"text":"총 2807개의 기사, 누적 읽14210224 횟수, 19074 리뷰","text_region":[[24,177],[414,177],[414,188],[24,189]]],"status":000"}
가상 머신 배포의 서버 측을 사용하고 있기 때문에, 때때로 메모리 오류가 보고됩니다:
268418688 크기의 메모리를 할당하지 못하세요. 임시 해결책으로는 서버를 재시작하세요.
리소스:
하이퍼링크 로그인이 보입니다.
하이퍼링크 로그인이 보입니다.
(끝)
|