Tento článek je zrcadlovým článkem o strojovém překladu, klikněte zde pro přechod na původní článek.

Pohled: 5826|Odpověď: 4

[Konzolový program] Extrahujte veškerý text z PDF souboru pomocí C# (podporuje .NET Core)

[Kopírovat odkaz]
Zveřejněno 29.06.2022 15:31:16 | | |
PDF je zkratka pro Portable Document Format, což znamená "přenosný formát dokumentu", a je to formát souboru vyvinutý společností Adobe Systems pro výměnu souborů způsobem nezávislým na aplikacích, operačních systémech a hardwaru. PDF soubory jsou založeny na modelu obrazu jazyka PostScript, který zaručuje přesné barvy a přesné tiskové výsledky na jakékoli tiskárně, což znamená, že PDF věrně reprodukuje každý znak, barvu a obrázek originálu.
Vzhledem ke složitosti formátů PDF jsou PDF obvykle zpracovávány pomocí třetích stran a tento článek používá itext7.
Po zavedení komponenty itext7 přes NuGet můžete text extrahovat z PDF souboru pomocí následujícího kódu:
Ukázkový kód:
Všimněte si, že pokud je váš PDF soubor naskenovanou verzí založenou na obrázku, pak kód v tomto článku nemůže extrahovat text a potřebujete technologii OCR.





Předchozí:Operátor RxJS finalize vykoná logiku po ukončení Observable
Další:Praktický boj Číslo řádku a číslo sloupce na začátku jsou umístěny v abnormálním zdrojovém souboru prostřednictvím mapového souboru
Zveřejněno 30.06.2022 21:35:46 |
Učte se učit.
Zveřejněno 28.07.2022 9:00:24 |
Nauč se to
Zveřejněno 13.10.2022 13:43:30 |
Formálně potřebuješ, nauč se učit! ~~~~~~''
Zveřejněno 14.10.2022 9:37:59 |
Použijte C# k extrakci veškerého textu z PDF souboru
Zřeknutí se:
Veškerý software, programovací materiály nebo články publikované organizací Code Farmer Network slouží pouze k učení a výzkumu; Výše uvedený obsah nesmí být používán pro komerční ani nelegální účely, jinak nesou všechny důsledky uživatelé. Informace na tomto webu pocházejí z internetu a spory o autorská práva s tímto webem nesouvisí. Musíte výše uvedený obsah ze svého počítače zcela smazat do 24 hodin od stažení. Pokud se vám program líbí, podporujte prosím originální software, kupte si registraci a získejte lepší skutečné služby. Pokud dojde k jakémukoli porušení, kontaktujte nás prosím e-mailem.

Mail To:help@itsvse.com