|
PDF è l'abbreviazione di Portable Document Format, che significa "portable document format", ed è un formato di file sviluppato da Adobe Systems per lo scambio di file in modo indipendente da applicazioni, sistemi operativi e hardware. I file PDF si basano sul modello di immagine linguistico PostScript, che garantisce colori accurati e risultati di stampa accurati su qualsiasi stampante, il che significa che il PDF riproduce fedelmente ogni caratteri, colore e immagine dell'originale. Data la complessità dei formati di file PDF, i PDF sono generalmente manipolati tramite componenti di terze parti, e questo articolo utilizza itext7. Dopo aver introdotto il componente itext7 tramite NuGet, puoi estrarre testo da un file PDF usando il seguente codice: Codice di esempio: Nota che se il tuo file PDF è una versione scansionata basata su un'immagine, allora il codice in questo articolo non può estrarre testo e serve la tecnologia OCR.
|