Šis raksts ir mašīntulkošanas spoguļraksts, lūdzu, noklikšķiniet šeit, lai pārietu uz oriģinālo rakstu.

Skats: 48991|Atbildi: 3

[Avots] .NET/C#, lai noteiktu, vai ir iekļauts MK tags

[Kopēt saiti]
Publicēts 16.07.2021 13:22:54 | | | |
Kas ir MK?

Baitu secības atzīme (MK) vai baitu secības atzīme ir īpaša atzīme, kas ievietota unikoda failā, kas kodēts ar UTF-8, UTF16 vai UTF-32, lai identificētu unikoda faila kodējuma tipu. UTF-8 MK nav nepieciešama, jo to izmanto, lai atzīmētu vairāku baitu kodēta faila kodējuma tipu un baitu secību (big-endian vai little-endian). UTF-8 katrai rakstzīmei kodēto bitu skaits tiek izteikts ar pirmo baitu, un nav atšķirības starp big-endian un little-endian.
UTF-8 nav nepieciešama MK, lai gan Unicode standarts ļauj izmantot MK UTF-8. Tāpēc UTF-8 bez MK ir standarta forma, un galvenokārt Microsoft ieradums ir ievietot MK UTF-8 failā (starp citu: tas ir arī Microsoft ieradums izsaukt UTF-16 ar MK "Unicode", neiedziļinoties detaļās).
MK tiek sagatavotas UTF-16 un UTF-32, lai atzīmētu baitu secību. Microsoft izmanto MK UTF-8, jo tas ļauj skaidri atšķirt UTF-8 un ASCII kodējumu, pretējā gadījumā CSV faila atvēršana programmā Excel var tikt izkropļota. Bet šāds fails var radīt problēmas operētājsistēmās, kas nav Windows.
Atšķirība starp "UTF-8" un "UTF-8 ar MK" ir tā, vai ir MK vai nav. Tas ir, vai faila sākumā ir U+FEFF.
UTF-8 tīmekļa kodam nevajadzētu izmantot MK, pretējā gadījumā kļūdas ir bieži sastopamas. Izvadot CSV failu no http atbildes, tas pēc noklusējuma netiek iekļauts, ja iestatīts uz utf8
MK, bet Windows Excel izmanto MK, lai apstiprinātu UTF8 kodējumu, un visiem ir jāraksta MK faila sākumā.



Kad pirmo reizi izstrādājat Java koda ģeneratoru, jūs ievietosiet failu tiešiRakstīšana UTF-8 failā, kurā ir MK tagsTas novedīs pie iepakošanas kļūdām:

Nelikumīgas rakstzīmes: '\ufeff'


Kā izmantot .NET / C#, lai noteiktu, vai failā ir MK tagi? , kods ir šāds:





Kolēģi, pievienotiKonvertē UTF-8 MK formātu UTF-8 (bez MK tagiem) formātā, pilns kods ir šāds:

(Beigas)

Vērtējums

Dalībnieku skaits1MB+1 Veicināt+1 Sakļaut iemesls
Mo Feng 123 + 1 + 1 Ļoti spēcīgs!

Skatīt visus vērtējumus





Iepriekšējo:SQL SERVER noņem dzēšanas nodalījuma funkciju un nodalījuma shēmu
Nākamo:Katras tabulas atstarpe SQL Server datu bāzē
Publicēts 16.07.2021 22:41:40 |
 Saimnieks| Publicēts 01.11.2024 15:00:47 |
UTF-8 noņem MK tagu

 Saimnieks| Publicēts 25.06.2025 16:13:03 |
utf-8 neraksta MK
Atruna:
Visa programmatūra, programmēšanas materiāli vai raksti, ko publicē Code Farmer Network, ir paredzēti tikai mācību un pētniecības mērķiem; Iepriekš minēto saturu nedrīkst izmantot komerciāliem vai nelikumīgiem mērķiem, pretējā gadījumā lietotājiem ir jāuzņemas visas sekas. Informācija šajā vietnē nāk no interneta, un autortiesību strīdiem nav nekāda sakara ar šo vietni. Iepriekš minētais saturs ir pilnībā jāizdzēš no datora 24 stundu laikā pēc lejupielādes. Ja jums patīk programma, lūdzu, atbalstiet oriģinālu programmatūru, iegādājieties reģistrāciju un iegūstiet labākus oriģinālus pakalpojumus. Ja ir kādi pārkāpumi, lūdzu, sazinieties ar mums pa e-pastu.

Mail To:help@itsvse.com