|
PDF yra "Portable Document Format" trumpinys, reiškiantis "nešiojamojo dokumento formatas", ir yra "Adobe Systems" sukurtas failo formatas, skirtas keistis failais nepriklausomai nuo programų, operacinių sistemų ir aparatinės įrangos. PDF failai yra pagrįsti PostScript kalbos vaizdo modeliu, kuris garantuoja tikslias spalvas ir tikslius spausdinimo rezultatus bet kuriame spausdintuve, o tai reiškia, kad PDF tiksliai atkuria kiekvieną originalo simbolį, spalvą ir vaizdą. Atsižvelgiant į PDF failų formatų sudėtingumą, PDF failais paprastai manipuliuojama naudojant trečiųjų šalių komponentus, todėl šiame straipsnyje naudojamas itext7. Įdiegę itext7 komponentą naudodami "NuGet", galite išgauti tekstą iš PDF failo naudodami šį kodą: Pavyzdžio kodas: Atminkite, kad jei jūsų PDF failas yra nuskaityta versija, pagrįsta vaizdu, šiame straipsnyje pateiktas kodas negali išskleisti teksto ir jums reikia OCR technologijos.
|