|
PDF er en forkortelse for Portable Document Format, hvilket betyder "bærbart dokumentformat", og er et filformat udviklet af Adobe Systems til filudveksling på en måde, der er uafhængig af applikationer, operativsystemer og hardware. PDF-filer er baseret på PostScript-sprogets billedmodel, som garanterer nøjagtige farver og nøjagtige printresultater på enhver printer, hvilket betyder, at PDF'en nøjagtigt gengiver hvert tegn, hver farve og hvert billede af originalen. I betragtning af kompleksiteten i PDF-filformater manipuleres PDF'er generelt gennem tredjepartskomponenter, og denne artikel bruger itext7. Efter at have introduceret itext7-komponenten via NuGet, kan du udtrække tekst fra en PDF-fil ved hjælp af følgende kode: Eksempelkode: Bemærk, at hvis din PDF-fil er en scannet version baseret på et billede, kan koden i denne artikel ikke udtrække tekst, og du har brug for OCR-teknologi.
|