Tämä artikkeli on konekäännöksen peiliartikkeli, klikkaa tästä siirtyäksesi alkuperäiseen artikkeliin.

Näkymä: 48991|Vastaus: 3

[Lähde] .NET/C# määrittääkseen, sisältyykö BOM-tunniste

[Kopioi linkki]
Julkaistu 16.7.2021 13.22.54 | | | |
Mikä on BOM?

Tavujärjestysmerkki (BOM) tai tavujärjestysmerkki on erityinen merkki, joka lisätään Unicode-tiedostoon, joka on koodattu UTF-8-, UTF16- tai UTF-32-tiedostoilla tunnistamaan Unicode-tiedoston koodaustyypin. UTF-8:ssa BOM:ia ei tarvita, sillä sitä käytetään monitavuisen tiedoston koodaustyypin ja tavujärjestyksen (big-endian tai little-endian) merkitsemiseen. UTF-8:ssa kunkin merkin koodattujen bittien määrä ilmaistaan ensimmäisellä tavulla, eikä big-endianin ja little-endianin välillä ole eroa.
UTF-8 ei vaadi BOM:ia, vaikka Unicode-standardi sallii BOM:ien käytön UTF-8:ssa. Siksi UTF-8 ilman BOM:ia on standardimuoto, ja Microsoftilla on tapana sijoittaa BOM UTF-8-tiedostoon (muuten: Microsoftilla on myös tapa kutsua UTF-16:ta BOM:lla "Unicodeksi" menemättä yksityiskohtiin).
BOM:t valmistellaan UTF-16:lle ja UTF-32:lle tavujärjestyksen merkitsemiseksi. Microsoft käyttää BOM:ia UTF-8:ssa, koska se mahdollistaa selkeän eron UTF-8:n ja ASCII-koodauksen välillä, muuten CSV-tiedoston avaaminen Excelissä voi olla sekava. Mutta tällainen tiedosto voi aiheuttaa ongelmia myös muissa käyttöjärjestelmissä kuin Windowsissa.
Ero "UTF-8":n ja "UTF-8:n BOM:lla" välillä on siinä, onko olemassa BOM:ia vai ei. Eli siitä, onko tiedoston alussa U+FEFF.
UTF-8:n verkkokoodissa ei tulisi käyttää BOMeja, muuten virheet ovat yleisiä. Kun CSV-tiedosto lähetetään http-vastauksesta, sitä ei oletuksena sisällytetä, kun se on asetettu utf8-arvoon
BOM, mutta Windows Excel käyttää BOM:ia UTF8-koodauksen vahvistamiseen, ja kaikkien täytyy kirjoittaa BOM tiedoston alkuun.



Kun kehität ensimmäistä kertaa Java-koodigeneraattorin, laitat tiedoston suoraanKirjoita UTF-8-tiedostoon, joka sisältää BOM-taginTämä johtaa pakkausvirheisiin seuraavasti:

Laittomat hahmot: '\ufeff'


Miten käytän .NET / C# -tiedostoja selvittääkseni, sisältääkö tiedosto BOM-tageja? , koodi on seuraava:





Kollegat, liitettyMuuntaa UTF-8 BOM-muodon UTF-8 (ilman BOM-tageja) muotoon, koko koodi on seuraava:

(Loppu)

Pistetilanne

Osallistujien määrä1MB+1 myötävaikuttaa+1 Romahdus syy
Mo Feng 123 + 1 + 1 Erittäin voimakas!

Katso kaikki arviot





Edellinen:SQL SERVER poistaa osion poistamisen toiminnon ja osiointijärjestelmän
Seuraava:Jokaisen taulukon tila SQL Server -tietokannassa
Julkaistu 16.7.2021 22.41.40 |
 Vuokraisäntä| Julkaistu 1.11.2024 15.00.47 |
UTF-8 poistaa BOM-tunnisteen

 Vuokraisäntä| Julkaistu 25.6.2025 16.13.03 |
UTF-8 ei kirjoita BOM:lle
Vastuuvapauslauseke:
Kaikki Code Farmer Networkin julkaisemat ohjelmistot, ohjelmamateriaalit tai artikkelit ovat tarkoitettu vain oppimis- ja tutkimustarkoituksiin; Yllä mainittua sisältöä ei saa käyttää kaupallisiin tai laittomiin tarkoituksiin, muuten käyttäjät joutuvat kantamaan kaikki seuraukset. Tämän sivuston tiedot ovat peräisin internetistä, eikä tekijänoikeuskiistat liity tähän sivustoon. Sinun tulee poistaa yllä oleva sisältö kokonaan tietokoneeltasi 24 tunnin kuluessa lataamisesta. Jos pidät ohjelmasta, tue aitoa ohjelmistoa, osta rekisteröityminen ja hanki parempia aitoja palveluita. Jos rikkomuksia ilmenee, ota meihin yhteyttä sähköpostitse.

Mail To:help@itsvse.com