.NET Core는 이미지와 텍스트를 인식하기 위해 Baidu PaddleOCR을 호출합니다

작은 쓰레기 같은 놈들 · 게시됨 2021. 3. 15. 오후 6:21:43

PaddleOCR을 알아보기 전에, 먼저 PaddlePaddle을 먼저 이해해 봅시다. 바이두의 다년간의 딥러닝 기술 연구와 비즈니스 응용을 바탕으로 한 PaddlePaddle은 중국 최초의 오픈 소스이자 기술적으로 선도적이며 완전한 산업용 딥러닝 플랫폼으로, 딥러닝 핵심 학습 및 추론 프레임워크, 기본 모델 라이브러리, 엔드 투 엔드 개발 키트, 풍부한 도구 구성 요소를 통합했습니다. 현재 플라잉 패들은 265만 명 이상의 개발자를 모았고, 10만 개의 기업에 서비스를 제공하며, 플라잉 패들 오픈 소스 딥러닝 플랫폼을 기반으로 34만 개의 모델을 생성했습니다. 플라잉 패들은 개발자들이 AI 아이디어를 빠르게 실현하고 AI 서비스를 신속하게 출시할 수 있도록 돕습니다. 더 많은 산업이 AI 역량을 완성하고 산업 지능 업그레이드를 실현할 수 있도록 돕습니다.

공식 웹사이트:하이퍼링크 로그인이 보입니다.

PaddleOCR은 사용자가 더 나은 모델을 훈련하고 구현할 수 있도록 풍부하고 선도적이며 실용적인 OCR 도구 라이브러리를 만드는 것을 목표로 합니다.

렌더링을 먼저 살펴보세요:

(원본 사진)

(확인 후,라벨이 붙은 경계선은 반환된 결과를 바탕으로 스스로 그립니다）

바이두 플라잉 패들은 윈도우 환경이 필요합니다

윈도우 7/8/10 프로/엔터프라이즈 (64비트)
GPU 버전은 CUDA 9.0/10.0/10.1/10.2/11.0을 지원하며, 단일 카드만 지원합니다
파이썬 버전 2.7.15+/3.5.1+/3.6+/3.7+/3.8+ (64비트)
PIP 버전 20.2.2+ (64비트)

참고: Python 3.9와 같은 상위 버전의 Python을 사용 중이라면 다음과 같은 오류가 발생할 수 있습니다:

ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle

용액:

지원 버전을 다운로드하세요. 예를 들어: 버전 3.8.8, 다운로드 주소:하이퍼링크 로그인이 보입니다.

로그인이 보이네요.

Python과 pip이 64비트임을 확인해야 하며, 프로세서 아키텍처가 x86_64(또는 x64, Intel 64, AMD64) 아키텍처인지, 현재 PaddlePaddle은 arm64 아키텍처를 지원하지 않습니다. 아래 첫 번째 줄은 "64bit"를, 두 번째 줄은 "x86_64", "x64" 또는 "AMD64"를 출력합니다.

D:\itsvse>python --version
파이썬 3.8.8

D:\itsvse>pip --version
C:\Program Files\Python38\Lib\Site-Packages\PIP (Python 3.8)에서 PIP 20.2.3

D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())"
64비트
AMD64

Windows 10은 PaddlePaddle CPU 버전을 설치합니다

명령:

로그인이 보이네요.

설치 상태 확인해 보세요

설치가 완료되면 python이나 python3를 사용해 python 인터프리터에 입력하고, import paddle을 입력한 후 paddle.utils.run_check()를 입력할 수 있습니다.

만약 나타나면패들패들이 성공적으로 설치되었습니다!, 성공적으로 설치되었음을 나타냅니다. 아래에 나와 있습니다:

(실행하지 않음) 삭제 명령어:

로그인이 보이네요.

PaddleHub 설치

명령:

로그인이 보이네요.

클론 패들OCR 다운로드

git clone 명령어를 사용해 조건부 다운로드, 그리고 무조건적으로 압축된 패키지로 직접 다운로드한 후 압축을 풀어주세요. 주소:하이퍼링크 로그인이 보입니다.

직접 다운로드해서 압축 해제해서 폴더 :D:\itsvse\PaddleOCR-release-2.0에 넣었습니다.

추론 모델 다운로드

서비스 모듈을 설치하기 전에 추론 모델을 준비하고 올바른 경로에 배치해야 합니다.

탐지 모델:하이퍼링크 로그인이 보입니다.
방향 분류기:하이퍼링크 로그인이 보입니다.
모델 식별:하이퍼링크 로그인이 보입니다.

다운로드한 후, 아래와 같이 D:\itsvse\PaddleOCR-release-2.0\deploy\model 폴더 아래에 배치했습니다:

탐지 + 식별 시리즈 서비스 모듈을 설치하세요

"D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py" 구성을 다음과 같이 수정하세요:

로그인이 보이네요.

d:\itsvse\PaddleOCR-release-2.0 폴더 아래의 cmd 창을 사용하여 다음 명령을 실행하세요:

로그인이 보이네요.

말:\hubserving\ocr_system 아래의 파이썬 파일을 수정하려면 배포를 재설치하거나 위 명령을 실행해야 합니다。

오류는 다음과 같이 보고될 수 있습니다:

ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb'

예를 들어, pip install imgaug 같은 방법으로 설치하세요.

설치 방식은 다음과 같습니다:

[2021-03-15 15:59:37,549] [ 정보] - 성공적으로 삭제 ocr_system
[2021-03-15 15:59:38,237] [ 정보] - ocr_system-1.0.0 성공적으로 설치 완료

ocr_system 서비스 시작하세요

여기서 구성 매개변수는 구성 파일을 사용하며, 먼저 "D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json" 구성을 다음과 같이 수정합니다:

로그인이 보이네요.

다음 명령어로 서비스를 시작합니다:

로그인이 보이네요.

파이썬 클라이언트로 이미지를 테스트해 보세요

테스트하고 싶은 이미지를 "D:\itsvse\PaddleOCR-release-2.0\doc\imgs1" 폴더에 넣고, D:\itsvse\PaddleOCR-release-2.0에서 다음 명령을 실행하세요:

로그인이 보이네요.

test_hubserving.py 소스 코드는 다음과 같습니다:

로그인이 보이네요.

.NET Core 클라이언트로 화면을 테스트해 보세요

코드를 직접 업로드하세요, 다음과 같습니다:

로그인이 보이네요.

{"msg":"","results":[[{"confidence":0.9994004964828491,"text":"Blog Statistics","text_region":[[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"안녕하세요 여러분, 나는 작은 쓰레기야, 그리고 2015년 4월 5일에 블로그를 시작했어","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.9985174536705017,"text":"현재2021-03-1516:19:52","text_region":[[23,111],[ 217,111],[217,126],[23,126]]},{"confidence":0.9762932062149048,"text":"누적된 about. .NET 1184개의 기사, 총 6844154회, 총 10505개의 댓글","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"confidence":0.9847920536994934,"text":"총 2807개의 기사, 누적 읽14210224 횟수, 19074 리뷰","text_region":[[24,177],[414,177],[414,188],[24,189]]],"status":000"}

가상 머신 배포의 서버 측을 사용하고 있기 때문에, 때때로 메모리 오류가 보고됩니다:

268418688 크기의 메모리를 할당하지 못하세요.

임시 해결책으로는 서버를 재시작하세요.

리소스:

하이퍼링크 로그인이 보입니다.
하이퍼링크 로그인이 보입니다.

(끝)

테이고 · 게시됨 2021. 6. 16. 오후 12:38:26

마크 이보, 배우러 와

작은 쓰레기 같은 놈들 · 게시됨 2024. 11. 13. 오전 9:44:47

Windows PaddlePaddle 설치 튜토리얼
https://www.itsvse.com/thread-10873-1-1.html

작은 쓰레기 같은 놈들 · 게시됨 2024. 12. 31. 오후 1:25:03

.NET/C#은 FastDeploy를 사용하여 텍스트를 인식하는 OCR 모델을 배포합니다
https://www.itsvse.com/thread-10911-1-1.html

작은 쓰레기 같은 놈들 · 게시됨 2025. 4. 24. 오전 9:20:18

.NET/C#은 Tesseract를 사용해 이미지의 텍스트 인식을 OCR 처리합니다
https://www.itsvse.com/thread-10994-1-1.html

[.NET 코어] .NET Core는 이미지와 텍스트를 인식하기 위해 Baidu PaddleOCR을 호출합니다

관련 게시물

본 섹션