|
PDF er en forkortelse for Portable Document Format, som betyr "portabelt dokumentformat", og er et filformat utviklet av Adobe Systems for filutveksling på en måte som er uavhengig av applikasjoner, operativsystemer og maskinvare. PDF-filer er basert på PostScript-språkets bildemodell, som garanterer nøyaktige farger og nøyaktige utskriftsresultater på enhver skriver, noe som betyr at PDF-filen trofast gjengir alle tegn, farger og bilder av originalen. Med tanke på kompleksiteten i PDF-filformater, manipuleres PDF-filer vanligvis gjennom tredjepartskomponenter, og denne artikkelen bruker itext7. Etter å ha introdusert itext7-komponenten gjennom NuGet, kan du hente ut tekst fra en PDF-fil ved å bruke følgende kode: Eksempelkode: Merk at hvis PDF-filen din er en skannet versjon basert på et bilde, kan ikke koden i denne artikkelen hente ut tekst, og du trenger OCR-teknologi.
|