Questo articolo è un articolo speculare di traduzione automatica, clicca qui per saltare all'articolo originale.

Vista: 48991|Risposta: 3

[Fonte] .NET/C# per determinare se è incluso un tag BOM

[Copiato link]
Pubblicato su 16/07/2021 13:22:54 | | | |
Cos'è la BOM?

Il marchio dell'ordine dei byte (BOM), o marchio dell'ordine dei byte, è un marchio speciale inserito in un file Unicode codificato con UTF-8, UTF16 o UTF-32 per identificare il tipo di codifica di un file Unicode. Per UTF-8, non è necessario un MAP, poiché viene utilizzato per segnare il tipo di codifica e l'ordine dei byte (big-endian o little-endian) di un file codificato a più byte. In UTF-8, il numero di bit codificati per ogni carattere è espresso dal primo byte, e non c'è distinzione tra big-endian e little-endian.
UTF-8 non richiede una lista di beni, anche se lo standard Unicode consente l'uso delle liste di qualità in UTF-8. Pertanto, UTF-8 senza BOM è la forma standard, ed è principalmente abitudine di Microsoft inserire una BOM in un file UTF-8 (tra l'altro: è anche abitudine di Microsoft chiamare UTF-16 con una BOM "Unicode" senza entrare nei dettagli).
Le liste di materiali sono preparate per UTF-16 e UTF-32 per segnare l'ordine dei byte. Microsoft utilizza BOM in UTF-8 perché permette una chiara distinzione tra la codifica UTF-8 e ASCII; altrimenti aprire un file CSV in Excel potrebbe risultare confuso. Ma un file del genere può causare problemi in sistemi operativi diversi da Windows.
La differenza tra "UTF-8" e "UTF-8 con BOM" sta nel fatto che esista o meno una BOM. Cioè, se c'è un U+FEFF all'inizio del file.
Il codice web UTF-8 non dovrebbe utilizzare BOM, altrimenti gli errori sono comuni. Quando si invia un file CSV da HTTP Response, non viene incluso di default se impostato su utf8
BOM, ma Windows Excel usa BOM per confermare la codifica UTF8, e tutti devono scrivere BOM all'inizio del file.



Quando sviluppi per la prima volta un generatore di codice Java, inserirai direttamente il fileScrivi in un file UTF-8 che contiene il tag BOMQuesto porterà a errori di imballaggio, come segue:

Personaggi illegali: '\ufeff'


Come posso usare .NET / C# per determinare se un file contiene tag BOM? , il codice è il seguente:





Colleghi, in attaccoConverte il formato BOM UTF-8 nel formato UTF-8 (senza tag BOM), il codice completo è il seguente:

(Fine)

Punteggio

Numero di partecipanti1MB+1 contribuire+1 Collasso ragione
Mo Feng 123 + 1 + 1 Molto potente!

Vedi tutte le valutazioni





Precedente:SQL SERVER elimina la funzione di eliminazione delle partizioni e lo schema delle partizioni
Prossimo:L'impronta di spazio di ogni tabella nel database SQL Server
Pubblicato su 16/07/2021 22:41:40 |
 Padrone di casa| Pubblicato su 01/11/2024 15:00:47 |
UTF-8 rimuove il tag BOM

 Padrone di casa| Pubblicato su 25/06/2025 16:13:03 |
UTF-8 non scrive sulla lista di materiali
Disconoscimento:
Tutto il software, i materiali di programmazione o gli articoli pubblicati dalla Code Farmer Network sono destinati esclusivamente all'apprendimento e alla ricerca; I contenuti sopra elencati non devono essere utilizzati per scopi commerciali o illegali, altrimenti gli utenti dovranno sostenere tutte le conseguenze. Le informazioni su questo sito provengono da Internet, e le controversie sul copyright non hanno nulla a che fare con questo sito. Devi eliminare completamente i contenuti sopra elencati dal tuo computer entro 24 ore dal download. Se ti piace il programma, ti preghiamo di supportare software autentico, acquistare la registrazione e ottenere servizi autentici migliori. In caso di violazione, vi preghiamo di contattarci via email.

Mail To:help@itsvse.com