.NET CoreはBaidu PaddleOCRを呼び出して画像やテキストを認識します

クズども · 掲載地 2021/03/15 18:21:43

PaddleOCRを知る前に、まずPaddlePaddleを理解しましょう。百度の長年の深層学習技術研究とビジネス応用に基づき、PaddlePaddleは中国初のオープンソースで技術的に先進的かつ完全に機能する産業用深層学習プラットフォームであり、深層学習のコアトレーニングと推論フレームワーク、基本的なモデルライブラリ、エンドツーエンドの開発キット、豊富なツールコンポーネントを統合しています。現在、Flying Paddleは265万人以上の開発者を集め、10万の企業にサービスを提供、Flying Paddleのオープンソースディープラーニングプラットフォームに基づく34万のモデルを生成しています。 Flying Paddleは開発者がAIのアイデアを迅速に実現し、AIサービスを迅速に立ち上げる手助けをします。より多くの産業がAIのエンパワーメントを完成させ、産業のインテリジェントなアップグレードを実現できるよう支援しましょう。

公式ウェブサイト:ハイパーリンクのログインが見えます。

PaddleOCRは、ユーザーがより良いモデルを訓練し実装できるよう、豊かで先進的かつ実用的なOCRツールライブラリを作成することを目指しています。

レンダリングの最初の見方:

(元の写真)

(同定後、ラベル付けされた境界線は、返された結果に基づいて自動的に描画されます）

BaiduのフライングパドルはWindows環境が必要です

Windows 7/8/10 Pro/Enterprise(64ビット)
GPU版はCUDA 9.0/10.0/10.1/10.2/11.0をサポートし、1枚のカードのみをサポートします
Pythonバージョン 2.7.15+/3.5.1+/3.6+/3.7+/3.8+(64ビット)
PIPバージョン20.2.2+(64ビット)

注意:Python 3.9などの上位バージョンのPythonを使用している場合、以下のエラーが表示されます。

ERROR: Could not find a version that satisfies the requirement paddlepaddle (from versions: none)
ERROR: No matching distribution found for paddlepaddle

解決：

サポートされているバージョンをダウンロードしてください。例えば:バージョン3.8.8、ダウンロードアドレス:ハイパーリンクのログインが見えます。

ログインが見えます。

Pythonとpipが64ビットであること、プロセッサアーキテクチャがx86_64(またはx64、Intel 64、AMD64)であること、そして現在PaddlePaddleはarm64アーキテクチャをサポートしていないことを確認する必要があります。下の最初のラインは「64bit」を出力し、2ライン目は「x86_64」「x64」または「AMD64」を出力します。

D:\itsvse>python --version
Python 3.8.8

D:\itsvse>pip --version
pip 20.2.3 from c:\program files\python38\lib\site-packages\pip (Python 3.8)

D:\itsvse>python -c "import platform;print(platform.architecture()[0]);print(platform.machine())"
64ビット
AMD64

Windows 10はPaddlePaddleのCPUバージョンをインストールします

命令：

ログインが見えます。

設置状況を確認してください

インストールが完了したら、pythonやpython3を使ってPythonインタプリタに入り、import paddleを入力してpaddle.utils.run_check()と入力できます。

もし現れたらPaddlePaddleが無事にインストールされました!、インストールが成功したことを示します。以下に示すように:

(実行しない)アンインストールコマンド:

ログインが見えます。

PaddleHubをインストールしてください

命令：

ログインが見えます。

クローンパドルOCRをダウンロードしてください

git cloneコマンドを使って条件付きでダウンロードし、無条件に圧縮パッケージに直接ダウンロードし、その後解凍します。アドレス:ハイパーリンクのログインが見えます。

直接ダウンロードして、フォルダ:D:\itsvse\PaddleOCR-release-2.0に解凍しました。

推論モデルをダウンロードしてください

サービスモジュールを取り付ける前に、推論モデルを準備し、正しい経路に配置する必要があります。

検出モデル:ハイパーリンクのログインが見えます。
方向分類器:ハイパーリンクのログインが見えます。
モデルを特定する:ハイパーリンクのログインが見えます。

ダウンロード後、以下のようにD:\itsvse\PaddleOCR-release-2.0\deploy\modelフォルダの下に置きました。

検出+識別シリーズサービスモジュールを設置してください

「D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\params.py」構成を以下のように修正します:

ログインが見えます。

コマンドウィンドウを使って、D:\itsvse\PaddleOCR-release-2.0フォルダ内の以下のコマンドを実行してください:

ログインが見えます。

所見：\hubserving\ocr_systemのpythonファイルを変更するには、デプロイメントを再インストールするか、上記のコマンドを実行する必要があります。

誤差は以下のように報告できます:

ModuleNotFoundError: No module named 'imgaug'
ModuleNotFoundError: No module named 'pyclipper'
ModuleNotFoundError: No module named 'lmdb'

例えば、pip install imgaug を使ってインストールしてください。

設置の様子は以下の通りです。

[2021-03-15 15:59:37,549] [情報] - アンインストール成功ocr_system
[2021-03-15 15:59:38,237] [情報] - ocr_system-1.0.0 のインストールに成功しました

ocr_systemサービスを開始

ここでは設定パラメータが設定ファイルを使い、まず「D:\itsvse\PaddleOCR-release-2.0\deploy\hubserving\ocr_system\config.json」設定を次のように修正します。

ログインが見えます。

次のコマンドで礼拝を開始します:

ログインが見えます。

Pythonクライアントで画像をテストしてください

テストしたいイメージを「D:\itsvse\PaddleOCR-release-2.0\doc\imgs1」フォルダに入れ、D:\itsvse\PaddleOCR-release-2.0で以下のコマンドを実行します。

ログインが見えます。

test_hubserving.py ソースコードは以下の通りです:

ログインが見えます。

.NET Coreクライアントを使って画像をテストしてください

コードを直接アップロードする方法は以下の通りです:

ログインが見えます。

{"msg":"","results":[[{"confidence":0.9994004964828491,"text":"Blog Statistics","text_region":[[23,18],[85,18],[85,33],[23,32]]},{"confidence":0.9951881170272827,"text":"皆さん、こんにちは、私はちょっとしたクズで、2015年4月5日にブログを始めました","text_region":[[22,74],[471,74],[471,93],[22,93]]},{"confidence":0.9985174536705017,"text":"截至この時刻2021-03-1516:19:52","text_region":[[23,111],[ 217,111],[217,126],[23,126]]},{"confidence":0.9762932062149048,"text":"累積について。 .NET 1184件の記事、合計6844154回、合計10505件のコメント","text_region":[[24,153],[448,153],[448,165],[24,165]]},{"confidence":0.98479205369994934,"text":"合計2807件の記事、累計読14210224回、 19074年のレビュー","text_region":[[24,177],[414,177],[414,188],[24,189]]],"status":000"}

サーバー側の仮想マシン展開を使用しているため、時々メモリエラーが報告されます:

容量268418688メモリの割り当てに失敗すること。

一時的な解決策として、サーバーを再起動してください。

リソース：

ハイパーリンクのログインが見えます。
ハイパーリンクのログインが見えます。

(終わり)

テイゴ · 掲載地 2021/06/16 12:38:26

マーク・イーボー、学びに来て

クズども · 掲載地 2024/11/13 9:44:47

Windows PaddlePaddleインストールチュートリアル
https://www.itsvse.com/thread-10873-1-1.html

クズども · 掲載地 2024/12/31 13:25:03

.NET/C#はFastDeployを使用してOCRモデルを展開し、テキストを認識しています
https://www.itsvse.com/thread-10911-1-1.html

クズども · 掲載地 2025/04/24 9:20:18

.NET/C#はTesseractを使って画像のテキスト認識をOCRします
https://www.itsvse.com/thread-10994-1-1.html

[.NET Core] .NET CoreはBaidu PaddleOCRを呼び出して画像やテキストを認識します

関連記事

閲覧したセクション