この記事は機械翻訳のミラー記事です。元の記事にジャンプするにはこちらをクリックしてください。

眺める: 21372|答える: 0

[出典] c# OCRを使って中国語の画像を認識する

[リンクをコピー]
掲載地 2016/11/23 14:33:25 | | | |
現在も市場には多くのOCR(光学文字認識)コンポーネントが存在しており、有名なTesseractや非常にプロフェッショナルなAspriseなどがあります。これらは非常にプロフェッショナルで使いやすいものの、中国対応に友好的でないため使いやすいわけではありません。 もし企業がOCRスイートの開発を専門とし、長期にわたる研究開発に費やす意欲があるなら、Tesseractが推奨されます。Tesseractは深く設定でき、オープンソースです。
さまざまな解決策を試した結果、MicrosoftのOCRコンポーネントは中国語の認知に良い効果があり、シンプルであることが分かりました。 このコンポーネントはOffice 2007をベースにしており、以下の効果を持ちます:


C#およびOffice 2007のOCRコンポーネントを使ってグラフィックやテキストを変換します
  • Office 2007をインストールしてください。 (コンポーネントオプションをインストールする際は、Tools–> Microsoft Office Document Imagingで手動でインストールする必要があります)
  • Office SP2パッチインストール(301MB):http://download.microsoft.com/download/A/3/9/A39E919E-AFA8-4128-9249-51629206C70F/office2007sp2-kb953195-fullfile-zh-cn.exe
  • Visual Studio C#プロジェクトのCOMコンポーネントを参照:Microsoft Office Document Imaging 12.0型ライブラリ
  • 次に、以下のコードを書きます(この記事はwinfromテストプロジェクトを使用しています):

次にCドライブにtext.jpgファイルを入れて、上記のコードをテストし始めます。

その他の注意事項:「追加情報:COMクラス工場でCLSID {40942A6C-1520-4132-BDF8-BDC1F71F547B}のコンポーネント取得が以下のエラーで失敗した場合80040154、プロジェクトビルドターゲットを任意のCPUからx86に変更してみてください。


元のリンク:http://www.wxzzz.com/1602.html





先の:StringDictionaryにおけるSyncRootの使用
次に:C# HttpListenerでウェブサービスを書くと503エラーが発生します
免責事項:
Code Farmer Networkが発行するすべてのソフトウェア、プログラミング資料、記事は学習および研究目的のみを目的としています。 上記の内容は商業的または違法な目的で使用されてはならず、そうでなければ利用者はすべての結果を負うことになります。 このサイトの情報はインターネットからのものであり、著作権紛争はこのサイトとは関係ありません。 ダウンロード後24時間以内に上記の内容を完全にパソコンから削除してください。 もしこのプログラムを気に入ったら、正規のソフトウェアを支持し、登録を購入し、より良い本物のサービスを受けてください。 もし侵害があれば、メールでご連絡ください。

Mail To:help@itsvse.com