|
PDF ir saīsinājums no Portable Document Format, kas nozīmē "portatīvais dokumentu formāts", un tas ir failu formāts, ko izstrādājusi Adobe Systems failu apmaiņai neatkarīgi no lietojumprogrammām, operētājsistēmām un aparatūras. PDF failu pamatā ir PostScript valodas attēla modelis, kas garantē precīzas krāsas un precīzus drukas rezultātus jebkurā printerī, kas nozīmē, ka PDF failā precīzi tiek reproducētas visas oriģināla rakstzīmes, krāsas un attēli. Ņemot vērā PDF failu formātu sarežģītību, PDF faili parasti tiek manipulēti, izmantojot trešo pušu komponentus, un šajā rakstā tiek izmantots itext7. Pēc itext7 komponenta ieviešanas, izmantojot NuGet, varat iegūt tekstu no PDF faila, izmantojot šādu kodu: Parauga kods: Ņemiet vērā, ka, ja PDF fails ir skenēta versija, kuras pamatā ir attēls, tad šajā rakstā norādītais kods nevar izvilkt tekstu, un jums ir nepieciešama OCR tehnoloģija.
|