Tento článek je zrcadlovým článkem o strojovém překladu, klikněte zde pro přechod na původní článek.

Pohled: 48991|Odpověď: 3

[Zdroj] .NET/C# pro určení, zda je BOM tag zahrnut

[Kopírovat odkaz]
Zveřejněno 16.07.2021 13:22:54 | | | |
Co je to BOM?

Značka pořadí bajtů (BOM), nebo také značka pořadí bajtů, je speciální značka vložená do souboru Unicode kódovaného pomocí UTF-8, UTF16 nebo UTF-32 pro identifikaci typu kódování souboru Unicode. Pro UTF-8 není BOM vyžadován, protože se používá k označení typu kódování a pořadí bajtů (big-endian nebo little-endian) vícebajtového kódovaného souboru. V UTF-8 je počet bitů zakódovaných pro každý znak vyjádřen prvním bajtem a mezi big-endianem a little-endianem není rozdíl.
UTF-8 nevyžaduje kusovník, ačkoli standard Unicode umožňuje použití BOMů v UTF-8. Proto je UTF-8 bez BOM standardní formou a je to hlavně zvyk Microsoftu umisťovat BOM do souboru UTF-8 (mimochodem: je také zvykem Microsoftu volat UTF-16 s BOM "Unicode" bez zacházení do detailů).
Kusovníky jsou připraveny pro UTF-16 a UTF-32 pro označení pořadí bajtů. Microsoft používá BOM v UTF-8, protože umožňuje jasné rozlišení mezi kódováním UTF-8 a ASCII, jinak by otevření CSV souboru v Excelu mohlo být zkreslené. Takový soubor však může způsobit problémy i v jiných operačních systémech než Windows.
Rozdíl mezi "UTF-8" a "UTF-8 s BOM" je v tom, zda BOM existuje, nebo ne. To znamená, zda je na začátku souboru U+EFF.
Webové kódy UTF-8 by neměly používat kusovníky, jinak jsou chyby běžné. Při výstupu CSV souboru z http odpovědi není ve výchozím nastavení zahrnut na utf8
BOM, ale Windows Excel používá BOM k potvrzení kódování UTF8 a všechny musí BOM zapsat na začátek souboru.



Když poprvé vyvíjíte generátor Java kódu, dáte soubor přímoZápis do souboru UTF-8, který obsahuje tag BOMTo povede k chybám v balení, a to následovně:

Nelegální postavy: '\ufeff'


Jak mohu pomocí .NET / C# zjistit, zda soubor obsahuje tagy BOM? , kód je následující:





Kolegové, připojeniPřevádí formát BOM UTF-8 na formát UTF-8 (bez tagů BOM), celý kód je následující:

(Konec)

Partitura

Počet účastníků1MB+1 přispět+1 Zhroucení důvod
Mo Feng 123 + 1 + 1 Velmi silné!

Zobrazit všechna hodnocení





Předchozí:SQL SERVER odstraní funkci delete partition a partition scheme
Další:Prostorová plocha každé tabulky v databázi SQL Server
Zveřejněno 16.07.2021 22:41:40 |
 Pronajímatel| Zveřejněno 01.11.2024 15:00:47 |
UTF-8 odstraní značku BOM

 Pronajímatel| Zveřejněno 25.06.2025 16:13:03 |
utf-8 nezapisuje do BOM
Zřeknutí se:
Veškerý software, programovací materiály nebo články publikované organizací Code Farmer Network slouží pouze k učení a výzkumu; Výše uvedený obsah nesmí být používán pro komerční ani nelegální účely, jinak nesou všechny důsledky uživatelé. Informace na tomto webu pocházejí z internetu a spory o autorská práva s tímto webem nesouvisí. Musíte výše uvedený obsah ze svého počítače zcela smazat do 24 hodin od stažení. Pokud se vám program líbí, podporujte prosím originální software, kupte si registraci a získejte lepší skutečné služby. Pokud dojde k jakémukoli porušení, kontaktujte nás prosím e-mailem.

Mail To:help@itsvse.com