Tento článek je zrcadlovým článkem o strojovém překladu, klikněte zde pro přechod na původní článek.

Pohled: 760|Odpověď: 0

[Zdroj] .NET/C# využívá Tesseract k OCR rozpoznávání textu pro obrázky

[Kopírovat odkaz]
Zveřejněno 2025-4-24 09:20:01 | | | |
Požadavky: Použijte technologii OCR k rozpoznání textu obrázku, pokud obsahuje nějaký text, backend nejprve projde screeningem a dá přednost. Požadavky jsou poměrně jednoduché.

Přezkoumání:

.NET/C# využívá FastDeploy k nasazení OCR modelů pro rozpoznávání textu
https://www.itsvse.com/thread-10911-1-1.html

.NET Core volá Baidu PaddleOCR pro rozpoznávání obrázků a textů
https://www.itsvse.com/thread-9590-1-1.html

Tesseract OCR

Tesseract byl původně vyvinut v letech 1985 až 1994 v HP Laboratories v Bristolu, Velká Británie, a HP v Greeley, Colorado, USA. V roce 1996 byl Tesseract dále upraven pro portování na Windows systémy a v roce 1998 byl částečně C++izován. V roce 2005 HP učinilo Tesseract open source. Vyvíjel ho Google od roku 2006 do listopadu 2018.

Tesseract 4 přidává OCR engine založený na neuronové síti (LSTM), který se zaměřuje na rozpoznávání řádků, ale stále podporuje starší Tesseract OCR engine Tesseract 3, který funguje rozpoznáváním znakových vzorů. Použijte starší režim OCR engine (--oem 0) pro zajištění kompatibility s Tesseract 3. Vyžaduje také tréninkové datové soubory, které podporují starší enginy, například soubory z úložiště tessdata.

Adresa Tesseractu:Přihlášení k hypertextovému odkazu je viditelné.
tessdata:Přihlášení k hypertextovému odkazu je viditelné.
Dokumentace:Přihlášení k hypertextovému odkazu je viditelné.

C# se nazývá Tesseract

Pokud jde o použití C# pro volání Tesseractu, existují dvě běžně používané knihovny: Tesseract a TesseractOCR, z nichž TesseractOCR je založen na sekundárním vývoji knihovny Tesseract, a kód obou open source knihoven je ve skutečnosti podobný, rozdíl je v tom, že TesseractOCR volá nejnovější verzi (5.5.0) .dll dynamické linkové knihovny, takže se doporučujeTesseractOCR

Kód Tesseract:Přihlášení k hypertextovému odkazu je viditelné.
Kód TesseractOCR:Přihlášení k hypertextovému odkazu je viditelné.

Nejprve si musíte stáhnout Chinese Simplified (chi_sim.traineddata) model. (vynecháno)

Kód je následující:


Najděte screenshot z internetu k otestování – původní obrázek je následující:



Výsledky rozpoznání OCR jsou následující:



(Konec)




Předchozí:.NET/C# pro vytvoření pevného odkazu
Další:Zrychlení knihovny strojového učení scikit-learn pomocí sklearnex
Zřeknutí se:
Veškerý software, programovací materiály nebo články publikované organizací Code Farmer Network slouží pouze k učení a výzkumu; Výše uvedený obsah nesmí být používán pro komerční ani nelegální účely, jinak nesou všechny důsledky uživatelé. Informace na tomto webu pocházejí z internetu a spory o autorská práva s tímto webem nesouvisí. Musíte výše uvedený obsah ze svého počítače zcela smazat do 24 hodin od stažení. Pokud se vám program líbí, podporujte prosím originální software, kupte si registraci a získejte lepší skutečné služby. Pokud dojde k jakémukoli porušení, kontaktujte nás prosím e-mailem.

Mail To:help@itsvse.com