Ta članek je zrcalni članek strojnega prevajanja, kliknite tukaj za skok na izvirni članek.

Pogled: 48991|Odgovoriti: 3

[Vir] .NET/C# za ugotavljanje, ali je vključena oznaka BOM

[Kopiraj povezavo]
Objavljeno na 16. 07. 2021 13:22:54 | | | |
Kaj je BOM?

Oznaka za urejanje bajtov (BOM) ali oznaka za urejanje bajtov je posebna oznaka, ki se vstavi v Unicode datoteko, kodirano z UTF-8, UTF16 ali UTF-32, da identificira tip kodiranja Unicode datoteke. Za UTF-8 BOM ni potreben, saj se uporablja za označevanje tipa kodiranja in vrstnega reda bajtov (big-endian ali little-endian) večbajtne kodirane datoteke. V UTF-8 je število bitov, kodiranih za vsak znak, izraženo s prvim bajtom, in ni razlike med big-endianom in little-endianom.
UTF-8 ne zahteva BOM-a, čeprav standard Unicode dovoljuje uporabo BOM-ov v UTF-8. Zato je UTF-8 brez BOM-a standardna oblika, in predvsem je Microsoftova navada, da BOM postavi v datoteko UTF-8 (mimogrede: tudi Microsoft običajno kliče UTF-16 z BOM-om "Unicode" brez podrobnosti).
Za označevanje vrstnega reda bajtov se pripravljajo BOM-i za UTF-16 in UTF-32. Microsoft uporablja BOM v UTF-8, ker omogoča jasno razlikovanje med UTF-8 in ASCII kodiranjem, sicer bi lahko bilo odpiranje CSV datoteke v Excelu popačeno. A takšna datoteka lahko povzroči težave tudi v operacijskih sistemih, ki niso Windows.
Razlika med "UTF-8" in "UTF-8 z BOM" je v tem, ali BOM obstaja ali ne. To pomeni, ali je na začetku datoteke U+FEFF.
Spletna koda UTF-8 ne sme uporabljati BOM-ov, sicer so napake pogoste. Pri izhodu CSV datoteke iz http odgovora ta privzeto ni vključena, ko je nastavljena na utf8
BOM, vendar Windows Excel uporablja BOM za potrditev UTF8 kodiranja, vsi pa morajo BOM zapisati na začetek datoteke.



Ko prvič razvijate Java generator kode, boste datoteko vstavili neposrednoZapišite v datoteko UTF-8, ki vsebuje oznako BOMTo bo povzročilo napake pri pakiranju, kot sledi:

Nezakoniti liki: '\ufeff'


Kako naj uporabim .NET / C#, da ugotovim, ali datoteka vsebuje oznake BOM? , koda je naslednja:





Sodelavci, priloženiPretvarja format BOM UTF-8 v format UTF-8 (brez oznak BOM), celotna koda je naslednja:

(Konec)

Partitura

Število udeležencev1MB+1 prispevati+1 Propad razlog
Mo Feng 123 + 1 + 1 Zelo močno!

Oglejte si vse ocene





Prejšnji:SQL SERVER odstrani funkcijo brisanja particije in shemo particije
Naslednji:Prostorska potisa vsake tabele v bazi SQL Server
Objavljeno na 16. 07. 2021 22:41:40 |
 Najemodajalec| Objavljeno na 1. 11. 2024 15:00:47 |
UTF-8 odstrani oznako BOM

 Najemodajalec| Objavljeno na 25. 06. 2025 16:13:03 |
utf-8 ne piše v BOM
Disclaimer:
Vsa programska oprema, programski materiali ali članki, ki jih izdaja Code Farmer Network, so namenjeni zgolj učnim in raziskovalnim namenom; Zgornja vsebina ne sme biti uporabljena v komercialne ali nezakonite namene, sicer uporabniki nosijo vse posledice. Informacije na tej strani prihajajo z interneta, spori glede avtorskih pravic pa nimajo nobene zveze s to stranjo. Zgornjo vsebino morate popolnoma izbrisati z računalnika v 24 urah po prenosu. Če vam je program všeč, podprite pristno programsko opremo, kupite registracijo in pridobite boljše pristne storitve. Če pride do kakršne koli kršitve, nas prosimo kontaktirajte po elektronski pošti.

Mail To:help@itsvse.com