Denne artikel er en spejling af maskinoversættelse, klik venligst her for at springe til den oprindelige artikel.

Udsigt: 760|Svar: 0

[Kilde] .NET/C# bruger Tesseract til OCR-tekstgenkendelse til billeder

[Kopier link]
Opslået den 24-4-2025 09:20:01 | | | |
Krav: Brug OCR-teknologi til at genkende billedtekst; hvis den indeholder noget tekst, vil backend først bestå screeningen og give prioritet. Kravene er relativt simple.

Anmeldelse:

.NET/C# bruger FastDeploy til at deploye OCR-modeller, der genkender tekst
https://www.itsvse.com/thread-10911-1-1.html

.NET Core kalder Baidu PaddleOCR for at genkende billeder og tekster
https://www.itsvse.com/thread-9590-1-1.html

Tesserakt OCR

Tesseract blev oprindeligt udviklet mellem 1985 og 1994 hos HP Laboratories i Bristol, Storbritannien, og HP i Greeley, Colorado, USA. I 1996 blev Tesseract yderligere modificeret til portering til Windows-systemer, og i 1998 blev det delvist C++-iseret. I 2005 gjorde HP Tesseract open source. Det blev udviklet af Google fra 2006 til november 2018.

Tesseract 4 tilføjer en Neural Network (LSTM)-baseret OCR-motor, der fokuserer på linjegenkendelse, men understøtter stadig Tesseract 3's ældre Tesseract OCR-motor, som fungerer ved at genkende tegnmønstre. Brug den gamle OCR-motortilstand (--OEM 0) for at muliggøre kompatibilitet med Tesseract 3. Det kræver også træningsdatafiler, der understøtter ældre motorer, såsom filer fra tessdata-arkivet.

Tesserakt-adresse:Hyperlink-login er synlig.
tessdata:Hyperlink-login er synlig.
Dokumentation:Hyperlink-login er synlig.

C# kalder Tesseract

Med hensyn til at bruge C# til at kalde Tesseract, er der to almindeligt anvendte biblioteker: Tesseract og TesseractOCR, hvoraf TesseractOCR er baseret på Tesseract-bibliotekets sekundære udvikling, og koden for de to open source-biblioteker er faktisk ens; forskellen er, at TesseractOCR kalder den nyeste version (5.5.0) af det .dll dynamiske linkbibliotek, så det anbefalesTesseractOCR

Tesserakt-kode:Hyperlink-login er synlig.
TesseractOCR-kode:Hyperlink-login er synlig.

Først skal du downloade den kinesiske forenklede (chi_sim.traineddata) model. (udeladt)

Koden er som følger:


Find et screenshot fra internettet for at teste, det originale billede er som følger:



OCR-genkendelsesresultaterne er som følger:



(Slut)




Tidligere:.NET/C#-fil for at oprette et hårdt link
Næste:Accelerer scikit-learn maskinlæringsbiblioteket med sklearnex
Ansvarsfraskrivelse:
Al software, programmeringsmaterialer eller artikler udgivet af Code Farmer Network er kun til lærings- og forskningsformål; Ovenstående indhold må ikke bruges til kommercielle eller ulovlige formål, ellers skal brugerne bære alle konsekvenser. Oplysningerne på dette site kommer fra internettet, og ophavsretstvister har intet med dette site at gøre. Du skal slette ovenstående indhold fuldstændigt fra din computer inden for 24 timer efter download. Hvis du kan lide programmet, så understøt venligst ægte software, køb registrering og få bedre ægte tjenester. Hvis der er nogen overtrædelse, bedes du kontakte os via e-mail.

Mail To:help@itsvse.com