.NET/C# využívá Tesseract k OCR rozpoznávání textu pro obrázky

Malý hajzl · Zveřejněno 24.04.2025 9:20:01

Požadavky: Použijte technologii OCR k rozpoznání textu obrázku, pokud obsahuje nějaký text, backend nejprve projde screeningem a dá přednost. Požadavky jsou poměrně jednoduché.

Přezkoumání:

.NET/C# využívá FastDeploy k nasazení OCR modelů pro rozpoznávání textu
https://www.itsvse.com/thread-10911-1-1.html

.NET Core volá Baidu PaddleOCR pro rozpoznávání obrázků a textů
https://www.itsvse.com/thread-9590-1-1.html

Tesseract OCR

Tesseract byl původně vyvinut v letech 1985 až 1994 v HP Laboratories v Bristolu, Velká Británie, a HP v Greeley, Colorado, USA. V roce 1996 byl Tesseract dále upraven pro portování na Windows systémy a v roce 1998 byl částečně C++izován. V roce 2005 HP učinilo Tesseract open source. Vyvíjel ho Google od roku 2006 do listopadu 2018.

Tesseract 4 přidává OCR engine založený na neuronové síti (LSTM), který se zaměřuje na rozpoznávání řádků, ale stále podporuje starší Tesseract OCR engine Tesseract 3, který funguje rozpoznáváním znakových vzorů. Použijte starší režim OCR engine (--oem 0) pro zajištění kompatibility s Tesseract 3. Vyžaduje také tréninkové datové soubory, které podporují starší enginy, například soubory z úložiště tessdata.

Adresa Tesseractu:Přihlášení k hypertextovému odkazu je viditelné.
tessdata:Přihlášení k hypertextovému odkazu je viditelné.
Dokumentace:Přihlášení k hypertextovému odkazu je viditelné.

C# se nazývá Tesseract

Pokud jde o použití C# pro volání Tesseractu, existují dvě běžně používané knihovny: Tesseract a TesseractOCR, z nichž TesseractOCR je založen na sekundárním vývoji knihovny Tesseract, a kód obou open source knihoven je ve skutečnosti podobný, rozdíl je v tom, že TesseractOCR volá nejnovější verzi (5.5.0) .dll dynamické linkové knihovny, takže se doporučujeTesseractOCR。

Kód Tesseract:Přihlášení k hypertextovému odkazu je viditelné.
Kód TesseractOCR:Přihlášení k hypertextovému odkazu je viditelné.

Nejprve si musíte stáhnout Chinese Simplified (chi_sim.traineddata) model. (vynecháno)

Kód je následující:

Přihlášení je viditelné.

Najděte screenshot z internetu k otestování – původní obrázek je následující:

Výsledky rozpoznání OCR jsou následující:

(Konec)

[Zdroj] .NET/C# využívá Tesseract k OCR rozpoznávání textu pro obrázky

Související příspěvky

Prohlížené sekce