|
PDF, Portable Document Format'ın kısaltmasıdır; bu "taşınabilir belge formatı" anlamına gelir ve Adobe Systems tarafından uygulamalardan, işletim sistemlerinden ve donanımdan bağımsız olarak dosya alışverişi için geliştirilen bir dosya formatıdır. PDF dosyaları, herhangi bir yazıcıda doğru renkleri ve doğru baskı sonuçlarını garanti eden PostScript dil görsel modeline dayanır; yani PDF, orijinalin her karakterini, rengini ve görselini sadık bir şekilde yeniden üretir. PDF dosya formatlarının karmaşıklığı göz önüne alındığında, PDF'ler genellikle üçüncü parti bileşenler aracılığıyla manipüle edilir ve bu makale itext7 kullanır. itext7 bileşenini NuGet üzerinden tanıttıktan sonra, aşağıdaki kodla bir PDF dosyasından metin çıkarabilirsiniz: Örnek kod: Eğer PDF dosyanız bir görsele dayalı taranmış bir versiyonsa, bu makaledeki kod metni çıkaramaz ve OCR teknolojisine ihtiyacınız vardır.
|