Nõuded: Kasuta OCR-tehnoloogiat pilditeksti äratundmiseks, kui see sisaldab teksti, läbib taustasüsteem esmalt kontrolli ja annab prioriteedi. Nõuded on suhteliselt lihtsad.
Läbivaatamine:
Tesserakti OCR
Tesserakti arendati algselt aastatel 1985–1994 HP laborites Bristolis, Ühendkuningriigis, ja HP-s Greeley's, Colorados, USA-s. 1996. aastal muudeti Tesseracti veelgi Windowsi süsteemidele portimiseks ning 1998. aastal muudeti see osaliselt C++-le. 2005. aastal tegi HP Tesseracti avatud lähtekoodiga. Seda arendas Google aastatel 2006 kuni november 2018.
Tesseract 4 lisab närvivõrgu (LSTM) põhise OCR-mootori, mis keskendub joonte äratundmisele, kuid toetab siiski Tesseract 3 pärandmootorit Tesseract OCR, mis töötab tegelaste mustrite äratundmise kaudu. Kasuta pärandit OCR-mootori režiimi (--oem 0), et võimaldada ühilduvust Tesseract 3-ga. See nõuab ka treeningandmefaile, mis toetavad vanemaid mootoreid, näiteks tessdata hoidla faile.
Tesserakti aadress:Hüperlingi sisselogimine on nähtav. Tessdata:Hüperlingi sisselogimine on nähtav. Dokumentatsioon:Hüperlingi sisselogimine on nähtav.
C# kutsub Tesserakti
Mis puudutab C# kasutamist Tesseracti kutsumiseks, siis on kaks laialdaselt kasutatavat teeki: Tesseract ja TesseractOCR, millest TesseractOCR põhineb Tesseracti teegi teisese arenduse põhjal, ning kahe avatud lähtekoodiga teegi kood on tegelikult sarnane, erinevus seisneb selles, et TesseractOCR kutsub .dll dünaamilise lingi raamatukogu uusimat versiooni (5.5.0), seega on see soovitatavTesseractOCR。
Tesserakti kood:Hüperlingi sisselogimine on nähtav. TesseractOCR kood:Hüperlingi sisselogimine on nähtav.
Esiteks pead alla laadima Hiina lihtsustatud (chi_sim.traineddata) mudel. (välja jäetud)
Kood on järgmine:
Leia internetist ekraanipilt testimiseks, originaalpilt on järgmine:
OCR-i tunnustamise tulemused on järgmised:
(Lõpp) |