c# OCRを使って中国語の画像を認識する

クズども · 掲載地 2016/11/23 14:33:25

現在も市場には多くのOCR(光学文字認識)コンポーネントが存在しており、有名なTesseractや非常にプロフェッショナルなAspriseなどがあります。これらは非常にプロフェッショナルで使いやすいものの、中国対応に友好的でないため使いやすいわけではありません。もし企業がOCRスイートの開発を専門とし、長期にわたる研究開発に費やす意欲があるなら、Tesseractが推奨されます。Tesseractは深く設定でき、オープンソースです。
さまざまな解決策を試した結果、MicrosoftのOCRコンポーネントは中国語の認知に良い効果があり、シンプルであることが分かりました。このコンポーネントはOffice 2007をベースにしており、以下の効果を持ちます:

C#およびOffice 2007のOCRコンポーネントを使ってグラフィックやテキストを変換します

Office 2007をインストールしてください。 (コンポーネントオプションをインストールする際は、Tools–> Microsoft Office Document Imagingで手動でインストールする必要があります)
Office SP2パッチインストール(301MB):http://download.microsoft.com/download/A/3/9/A39E919E-AFA8-4128-9249-51629206C70F/office2007sp2-kb953195-fullfile-zh-cn.exe
Visual Studio C#プロジェクトのCOMコンポーネントを参照:Microsoft Office Document Imaging 12.0型ライブラリ
次に、以下のコードを書きます(この記事はwinfromテストプロジェクトを使用しています):

ログインが見えます。

次にCドライブにtext.jpgファイルを入れて、上記のコードをテストし始めます。

その他の注意事項:「追加情報:COMクラス工場でCLSID {40942A6C-1520-4132-BDF8-BDC1F71F547B}のコンポーネント取得が以下のエラーで失敗した場合80040154、プロジェクトビルドターゲットを任意のCPUからx86に変更してみてください。

元のリンク:http://www.wxzzz.com/1602.html

[出典] c# OCRを使って中国語の画像を認識する

関連記事

閲覧したセクション