Acest articol este un articol oglindă al traducerii automate, vă rugăm să faceți clic aici pentru a sări la articolul original.

Vedere: 760|Răspunde: 0

[Sursă] .NET/C# folosește recunoașterea textului Tesseract pentru OCR pentru imagini

[Copiază linkul]
Postat la 2025-4-24 09:20:01 | | | |
Cerințe: Folosiți tehnologia OCR pentru a recunoaște textul imaginii; dacă acesta conține text, backend-ul va trece inițial de screening și va acorda prioritate. Cerințele sunt relativ simple.

Recenzie:

.NET/C# folosește FastDeploy pentru a implementa modele OCR pentru a recunoaște textul
https://www.itsvse.com/thread-10911-1-1.html

.NET Core apelează Baidu PaddleOCR pentru a recunoaște imagini și texte
https://www.itsvse.com/thread-9590-1-1.html

Tesseract OCR

Tesseract a fost dezvoltat inițial între 1985 și 1994 la HP Laboratories din Bristol, Marea Britanie, și HP în Greeley, Colorado, SUA. În 1996, Tesseract a fost modificat suplimentar pentru portarea pe sistemele Windows, iar în 1998 a fost parțial C++izat. În 2005, HP a făcut Tesseract open source. A fost dezvoltat de Google între 2006 și noiembrie 2018.

Tesseract 4 adaugă un motor OCR bazat pe Rețele Neuronale (LSTM) care se concentrează pe recunoașterea liniilor, dar care susține în continuare motorul OCR vechi Tesseract 3, care funcționează prin recunoașterea tiparelor de caractere. Folosește modul vechi de motor OCR (--oem 0) pentru a permite compatibilitatea cu Tesseract 3. De asemenea, necesită fișiere de antrenament care suportă motoare mai vechi, cum ar fi fișierele din depozitul tessdata.

Adresa Tesseract:Autentificarea cu hyperlink este vizibilă.
Tessdata:Autentificarea cu hyperlink este vizibilă.
Documentație:Autentificarea cu hyperlink este vizibilă.

C# numește Tesseract

În ceea ce privește folosirea C# pentru apelarea Tesseract, există două biblioteci folosite frecvent: Tesseract și TesseractOCR, dintre care TesseractOCR se bazează pe dezvoltarea secundară a bibliotecii Tesseract, iar codul celor două biblioteci open source este de fapt similar, diferența fiind că TesseractOCR apelează cea mai recentă versiune (5.5.0) a bibliotecii .dll dynamic link, deci este recomandatTesseractOCR

Cod Tesseract:Autentificarea cu hyperlink este vizibilă.
Cod TesseractOCR:Autentificarea cu hyperlink este vizibilă.

Mai întâi, trebuie să descarci Chineza Simplificată (chi_sim.traineddata) model. (omitat)

Codul este următorul:


Găsește o captură de ecran de pe Internet pentru a o testa, imaginea originală este următoarea:



Rezultatele recunoașterii OCR sunt următoarele:



(Sfârșit)




Precedent:.NET/C# pentru a crea un hard link
Următor:Accelerează biblioteca de învățare automată scikit-learn cu sklearnex
Disclaimer:
Tot software-ul, materialele de programare sau articolele publicate de Code Farmer Network sunt destinate exclusiv scopurilor de învățare și cercetare; Conținutul de mai sus nu va fi folosit în scopuri comerciale sau ilegale, altfel utilizatorii vor suporta toate consecințele. Informațiile de pe acest site provin de pe Internet, iar disputele privind drepturile de autor nu au legătură cu acest site. Trebuie să ștergi complet conținutul de mai sus de pe calculatorul tău în termen de 24 de ore de la descărcare. Dacă îți place programul, te rugăm să susții software-ul autentic, să cumperi înregistrarea și să primești servicii autentice mai bune. Dacă există vreo încălcare, vă rugăm să ne contactați prin e-mail.

Mail To:help@itsvse.com