|
A PDF a Portable Document Format rövidítése, ami "hordozható dokumentumformátumot" jelent, és az Adobe Systems által kifejlesztett fájlformátum, amely alkalmazásoktól, operációs rendszerektől és hardvertől független módon szolgál fájlcserére. A PDF fájlok a PostScript nyelvi képmodellen alapulnak, amely garantálja a pontos színeket és a pontos nyomtatási eredményeket bármely nyomtatón, ami azt jelenti, hogy a PDF hűen reprodukálja az eredeti karakterét, színét és képét. Tekintettel a PDF fájlformátumok összetettségére, a PDF-eket általában harmadik féltől származó komponensek kezelik, és ez a cikk itext7-et használ. Az itext7 komponens bevezetése után a következő kóddal lehet szöveget kinyerni egy PDF fájlból: Mintakód: Fontos megjegyezni, hogy ha a PDF fájlod képen alapuló beszkennelt verzió, akkor a cikkben szereplő kód nem tud szöveget kinyerni, és OCR technológiára van szükséged.
|