Bu makale makine çevirisi ayna makalesidir, orijinal makaleye geçmek için lütfen buraya tıklayın.

Görünüm: 760|Yanıt: 0

[Kaynak] .NET/C#, görüntüler için Tesseract'tan OCR metin tanıma kullanır

[Bağlantıyı kopyala]
2025-4-24 09:20:01 tarihinde yayınlandı | | | |
Gereksinimler: OCR teknolojisini kullanarak görüntü metni tanıyabilir, eğer metin içeriyorsa, arka uç ilk olarak taramayı geçer ve öncelik verir. Gereksinimler nispeten basit.

Eleştiri:

.NET/C#, metni tanımak için OCR modellerini dağıtmak için FastDeploy kullanır
https://www.itsvse.com/thread-10911-1-1.html

.NET Core, Baidu PaddleOCR'i çağırarak görüntüleri ve metinleri tanır
https://www.itsvse.com/thread-9590-1-1.html

Tesserakt OCR

Tesseract, ilk olarak 1985 ile 1994 yılları arasında İngiltere'nin Bristol kentindeki HP Laboratuvarlarında ve ABD'nin Colorado eyaletindeki Greeley merkezindeki HP'de geliştirilmiştir. 1996'da Tesseract, Windows sistemlerine port için daha fazla modifiye edildi ve 1998'de kısmen C++'a dönüştürüldü. 2005 yılında HP, Tesseract'ı açık kaynak yaptı. Google tarafından 2006'dan Kasım 2018'e kadar geliştirilmiştir.

Tesseract 4, hat tanımaya odaklanan ancak karakter kalıplarını tanıyarak çalışan Tesseract 3'ün eski Tesseract OCR motorunu destekleyen Neural Network (LSTM) tabanlı bir OCR motoru ekliyor. Tesseract 3 ile uyumluluğu sağlamak için eski OCR motor modunu (--oem 0) kullanın. Ayrıca, tessdata deposundan gelen dosyalar gibi eski motorları destekleyen veri dosyalarını da eğitmeyi gerektirir.

Tesseract Adresi:Bağlantı girişi görünür.
tessdata:Bağlantı girişi görünür.
Belge:Bağlantı girişi görünür.

C# Tesseract'i çağırır

Tesseract'ı çağırmak için C# kullanmaya gelince, yaygın olarak kullanılan iki kütüphane vardır: Tesseract ve TesseractOCR; TesseractOCR, Tesseract kütüphanesinin ikincil geliştirmesine dayanır ve iki açık kaynak kütüphanenin kodu aslında benzerdir; fark şu ki, TesseractOCR .dll dinamik bağlantı kütüphanesinin en son sürümünü (5.5.0) çağırır, bu yüzden tavsiye edilirTesseractOCR

Tesseract Kodu:Bağlantı girişi görünür.
TesseractOCR Kodu:Bağlantı girişi görünür.

Öncelikle, Çince Basitleştirilmiş (chi_sim.traineddata) modeli. (atlandı)

Kod şöyledir:


İnternetten bir ekran görüntüsü bulup test edin, orijinal fotoğraf şöyledir:



OCR tanıma sonuçları aşağıdaki gibidir:



(Son)




Önceki:.NET/C# dosyası ile sert bağlantı oluşturmak için
Önümüzdeki:sklearnex ile scikit-learn makine öğrenme kütüphanesini hızlandırın
Feragatname:
Code Farmer Network tarafından yayımlanan tüm yazılım, programlama materyalleri veya makaleler yalnızca öğrenme ve araştırma amaçları içindir; Yukarıdaki içerik ticari veya yasa dışı amaçlarla kullanılamaz, aksi takdirde kullanıcılar tüm sonuçları ödemelidir. Bu sitedeki bilgiler internetten alınmakta olup, telif hakkı anlaşmazlıklarının bu siteyle hiçbir ilgisi yoktur. Yukarıdaki içeriği indirmeden sonraki 24 saat içinde bilgisayarınızdan tamamen silmelisiniz. Programı beğendiyseniz, lütfen orijinal yazılımı destekleyin, kayıt satın alın ve daha iyi orijinal hizmetler alın. Herhangi bir ihlal olursa, lütfen bizimle e-posta yoluyla iletişime geçin.

Mail To:help@itsvse.com