.NET/C# kasutab Tesseracti OCR-i tekstituvastuseks piltide jaoks

Väike sodi · Postitatud 24.04.2025 09:20:01

Nõuded: Kasuta OCR-tehnoloogiat pilditeksti äratundmiseks, kui see sisaldab teksti, läbib taustasüsteem esmalt kontrolli ja annab prioriteedi. Nõuded on suhteliselt lihtsad.

Läbivaatamine:

.NET/C# kasutab FastDeploy'i, et juurutada OCR-mudeleid teksti äratundmiseks
https://www.itsvse.com/thread-10911-1-1.html

.NET Core kutsub Baidu PaddleOCR-i, et tuvastada pilte ja tekste
https://www.itsvse.com/thread-9590-1-1.html

Tesserakti OCR

Tesserakti arendati algselt aastatel 1985–1994 HP laborites Bristolis, Ühendkuningriigis, ja HP-s Greeley's, Colorados, USA-s. 1996. aastal muudeti Tesseracti veelgi Windowsi süsteemidele portimiseks ning 1998. aastal muudeti see osaliselt C++-le. 2005. aastal tegi HP Tesseracti avatud lähtekoodiga. Seda arendas Google aastatel 2006 kuni november 2018.

Tesseract 4 lisab närvivõrgu (LSTM) põhise OCR-mootori, mis keskendub joonte äratundmisele, kuid toetab siiski Tesseract 3 pärandmootorit Tesseract OCR, mis töötab tegelaste mustrite äratundmise kaudu. Kasuta pärandit OCR-mootori režiimi (--oem 0), et võimaldada ühilduvust Tesseract 3-ga. See nõuab ka treeningandmefaile, mis toetavad vanemaid mootoreid, näiteks tessdata hoidla faile.

Tesserakti aadress:Hüperlingi sisselogimine on nähtav.
Tessdata:Hüperlingi sisselogimine on nähtav.
Dokumentatsioon:Hüperlingi sisselogimine on nähtav.

C# kutsub Tesserakti

Mis puudutab C# kasutamist Tesseracti kutsumiseks, siis on kaks laialdaselt kasutatavat teeki: Tesseract ja TesseractOCR, millest TesseractOCR põhineb Tesseracti teegi teisese arenduse põhjal, ning kahe avatud lähtekoodiga teegi kood on tegelikult sarnane, erinevus seisneb selles, et TesseractOCR kutsub .dll dünaamilise lingi raamatukogu uusimat versiooni (5.5.0), seega on see soovitatavTesseractOCR。

Tesserakti kood:Hüperlingi sisselogimine on nähtav.
TesseractOCR kood:Hüperlingi sisselogimine on nähtav.

Esiteks pead alla laadima Hiina lihtsustatud (chi_sim.traineddata) mudel. (välja jäetud)

Kood on järgmine:

Sisselogimine on nähtav.

Leia internetist ekraanipilt testimiseks, originaalpilt on järgmine:

OCR-i tunnustamise tulemused on järgmised:

(Lõpp)

[Allikas] .NET/C# kasutab Tesseracti OCR-i tekstituvastuseks piltide jaoks

Seotud postitused

Vaadatud sektsioonid