Šis raksts ir mašīntulkošanas spoguļraksts, lūdzu, noklikšķiniet šeit, lai pārietu uz oriģinālo rakstu.

Skats: 760|Atbildi: 0

[Avots] .NET/C# izmanto Tesseract, lai OCR teksta atpazīšanu attēliem

[Kopēt saiti]
Publicēts 2025-4-24 09:20:01 | | | |
Prasības: Izmantojiet OCR tehnoloģiju, lai atpazītu attēla tekstu, ja tajā ir teksts, aizmugurējā sistēma sākotnēji izturēs skrīningu un piešķirs prioritāti. Prasības ir salīdzinoši vienkāršas.

Pārskats:

.NET/C# izmanto FastDeploy, lai izvietotu OCR modeļus teksta atpazīšanai
https://www.itsvse.com/thread-10911-1-1.html

.NET Core izsauc Baidu PaddleOCR, lai atpazītu attēlus un tekstus
https://www.itsvse.com/thread-9590-1-1.html

Tesseract OCR

Tesseract sākotnēji tika izstrādāts no 1985. līdz 1994. gadam HP laboratorijās Bristolē, Lielbritānijā, un HP Greeley, Kolorādo, ASV. 1996. gadā Tesseract tika tālāk modificēts pārnešanai uz Windows sistēmām, un 1998. gadā tas tika daļēji C++ized. 2005. gadā HP padarīja Tesseract atvērtā koda. To izstrādāja Google no 2006. gada līdz 2018. gada novembrim.

Tesseract 4 pievieno neironu tīkla (LSTM) balstītu OCR dzinēju, kas koncentrējas uz līniju atpazīšanu, bet joprojām atbalsta Tesseract 3 mantoto Tesseract OCR dzinēju, kas darbojas, atpazīstot rakstzīmju modeļus. Izmantojiet mantoto OCR dzinēja režīmu (--oem 0), lai iespējotu saderību ar Tesseract 3. Tam ir nepieciešami arī apmācības datu faili, kas atbalsta vecākus dzinējus, piemēram, failus no tessdata repozitorija.

Tesseract adrese:Hipersaites pieteikšanās ir redzama.
tessdata:Hipersaites pieteikšanās ir redzama.
Dokumentācija:Hipersaites pieteikšanās ir redzama.

C# izsauc Tesseract

Attiecībā uz C# izmantošanu, lai izsauktu Tesseract, ir divas bieži izmantotas bibliotēkas: Tesseract un TesseractOCR, no kurām TesseractOCR ir balstīts uz Tesseract bibliotēkas sekundāro izstrādi, un abu atvērtā koda bibliotēku kods faktiski ir līdzīgs, atšķirība ir tāda, ka TesseractOCR izsauc .dll dinamisko saišu bibliotēkas jaunāko versiju (5.5.0), tāpēc tas ir ieteicamsTesseractOCR

Tesseract kods:Hipersaites pieteikšanās ir redzama.
TesseractOCR kods:Hipersaites pieteikšanās ir redzama.

Pirmkārt, jums ir jālejupielādē ķīniešu vienkāršotā (chi_sim.apmācītie dati) modeli. (izlaists)

Kods ir šāds:


Atrodiet ekrānuzņēmumu no interneta, lai pārbaudītu, oriģinālais attēls ir šāds:



OCR atzīšanas rezultāti ir šādi:



(Beigas)




Iepriekšējo:.NET/C# failu, lai izveidotu cieto saiti
Nākamo:Paātriniet scikit-learn mašīnmācīšanās bibliotēku, izmantojot sklearnex
Atruna:
Visa programmatūra, programmēšanas materiāli vai raksti, ko publicē Code Farmer Network, ir paredzēti tikai mācību un pētniecības mērķiem; Iepriekš minēto saturu nedrīkst izmantot komerciāliem vai nelikumīgiem mērķiem, pretējā gadījumā lietotājiem ir jāuzņemas visas sekas. Informācija šajā vietnē nāk no interneta, un autortiesību strīdiem nav nekāda sakara ar šo vietni. Iepriekš minētais saturs ir pilnībā jāizdzēš no datora 24 stundu laikā pēc lejupielādes. Ja jums patīk programma, lūdzu, atbalstiet oriģinālu programmatūru, iegādājieties reģistrāciju un iegūstiet labākus oriģinālus pakalpojumus. Ja ir kādi pārkāpumi, lūdzu, sazinieties ar mums pa e-pastu.

Mail To:help@itsvse.com