Šis raksts ir mašīntulkošanas spoguļraksts, lūdzu, noklikšķiniet šeit, lai pārietu uz oriģinālo rakstu.

Skats: 6768|Atbildi: 0

UTF-8 kodēšanas problēma MK ir detalizēti aprakstīta

[Kopēt saiti]
Publicēts 30.10.2014 17:38:44 | | |
UTF-8 MK jautājumi, kas jāuzmanās WordPress
Es saskāros ar problēmu ļoti agri, tas ir, pēc noteikta spraudņa instalēšanas pēc noklikšķināšanas, lai aktivizētu, parādīsies balts ekrāns. Es nekad neesmu sapratis, kāds ir iemesls, un iepriekšējais risinājums ir tāds, ka, ja tajā nav ķīniešu rakstzīmju, tieši pārsūtiet failu uz ASCII kodu, ko parasti var atrisināt. Kad es šodien saņēmu emuāru savam brālim, šī situācija atkal notika. Pēc ilgstošas izpētes es beidzot atradu atbildi.

Unicode specifikācijā ir MK jēdziens. MK — baitu kārtas atzīme, kas ir baitu kārtas atzīme. Atrodiet piezīmi par MK šeit:

UCS kodā ir rakstzīme ar nosaukumu "ZERO WIDTH NO-BREAK SPACE", kas ir kodēta kā FEFF. FFFE ir neeksistējoša rakstzīme UCS, tāpēc tai nevajadzētu parādīties faktiskajā pārraidē. UCS specifikācija iesaka pārsūtīt rakstzīmi "ZERO WIDTH NO-BREAK SPACE" pirms baitu plūsmas pārsūtīšanas. Tādā veidā, ja uztvērējs saņem FEFF, tas norāda, ka baitu plūsma ir Big-Endian; Ja tiek saņemts FFFE, tas norāda, ka baitu straume ir Little-Endian. Tāpēc rakstzīmi "ZERO WIDTH NO-BREAK SPACE" sauc arī par MK.

UTF-8 nav nepieciešama MK, lai norādītu baitu secību, bet tā var izmantot MK, lai norādītu, kā tā ir kodēta. Rakstzīmes "ZERO WIDTH NO-BREAK SPACE" UTF-8 kodējums ir EF BB BF. Tātad, ja uztvērējs saņem baitu plūsmu, kas sākas ar EF BB BF, viņi zina, ka tas ir UTF-8 kodējums.

Sistēma Windows izmanto MK, lai atzīmētu, kā tiek kodēti teksta faili.

Turklāt FAQ-BOM unicode tīmekļa vietnē detalizēti izskaidro MK. Oficiālā dabiskā autoritāte, bet angļu valodā, šķiet, ir darbietilpīgāka.

UTF-8 kodētā failā MK aizņem trīs baitus. Ja izmantojat Notepad, lai saglabātu teksta failu kā UTF-8 kodējumu, atveriet failu ar UE un pārslēdzieties uz heksadecimālo rediģēšanas stāvokli, lai sākumā redzētu FFFE. Tas ir labs veids, kā identificēt UTF-8 kodētos failus, programmatūra izmanto MK, lai noteiktu, vai fails ir kodēts UTF-8, un daudzas programmatūras pieprasa, lai importētajam failam būtu MK. Tomēr joprojām ir daudz programmatūras, kas neatpazīst BOM. Kad es pētīju Firefox, es zināju, ka agrīnajās Firefox versijās paplašinājumiem nevarēja būt BOM, bet Firefox 1.5 un jaunākās versijas ir sākušas atbalstīt BOM. Tagad es uzzināju, ka PHP arī neatbalsta BOM.

PHP tika izstrādāts, neņemot vērā MK, kas nozīmē, ka tas neignorē trīs MK rakstzīmes UTF-8 kodētā faila sākumā. Tā kā tam jābūt
Kā es redzēju Bo-Blog wiki, Bo-Blog, kas arī izmanto PHP, ir satraukts par BOM. Tiek minēta vēl viena problēma: "Sakarā ar COOKIE nosūtīšanas mehānisma ierobežojumu, failos, kuriem jau ir MK šo failu sākumā, COOKIE nevar nosūtīt (jo PHP jau ir nosūtījis faila galveni pirms COOKIE nosūtīšanas), tāpēc pieteikšanās un atteikšanās funkcijas nav derīgas. Visas funkcijas, kas balstās uz COOKIE un SESSION, nav derīgas. Tam vajadzētu būt tukšas lapas iemeslam WordPress fonā, jo jebkurš no izpildītajiem failiem satur MK, un visas trīs rakstzīmes tiks nosūtītas, izraisot funkcionalitāti, kas ir atkarīga no sīkdatnēm un sesijām.

Risinājums ir saglabāt failu kā ASCII kodu, ja tajā ir tikai angļu valodas rakstzīmes (vai rakstzīmes ASCII kodējumā). Ja izmantojat redaktoru, piemēram, UE, noklikšķiniet uz File->Convert->UTF-8 uz ASCII vai atlasiet ASCII kodējumu sadaļā Saglabāt kā. Ja tā ir rindiņa, kas beidzas DOS formātā, varat to atvērt, izmantojot Notepad, noklikšķiniet uz Saglabāt kā un atlasiet ASCII kodējumu. Ja tajā ir ķīniešu rakstzīmes, varat izmantot UE saglabāšanas kā funkciju un atlasīt "UTF-8 no BOM". Lūdzu, skatiet zemāk redzamo attēlu:

Saskaņā ar Bo-Blog wiki instrukcijām: Editplus ir jāsaglabā kā gb un pēc tam kā UTF-8. Tomēr, to darot, esiet uzmanīgi, visas rakstzīmes, kas nav iekļautas GBK kodējumā, tiks zaudētas. Ja failā ir rakstzīmes, kas nav ķīniešu valoda, neizmantojiet šo metodi. (No šī mazā aspekta UE - UltraEdite-32 patiešām ir daudz labāks nekā Editplus, Editplus ir pārāk viegls)

Vēl viens veids, kā es atradu, ir izmantot failu redaktoru, ko nodrošina Wordpress. Šī metode nav ierobežota, un nav nepieciešams lejupielādēt īpašu redaktoru, galu galā visi izmanto WordPress. Vispirms ieslēdziet faila rakstīšanas atļauju, kuru vēlaties rediģēt ftp, pēc tam ievadiet WordPress fonu - > pārvaldības > failu redaktoru, ievadiet faila rediģēšanas ceļu un noklikšķiniet uz Rediģēt failu. Parādītajā rediģēšanas ekrānā nevarēsit redzēt pirmās trīs rakstzīmes, bet tas ir labi, novietojiet kursoru pirms visa faila pirmās rakstzīmes un nospiediet taustiņu Backspace. Labi, noklikšķiniet uz Atjaunināt failu, atsvaidziniet to ftp, jūs varat redzēt, ka fails ir par 3 baitiem mazāks, un esat pabeidzis.

Visbeidzot, tā ir liela problēma, visi tie, kas vēlas rakstīt savus spraudņus, rediģēt citu cilvēku spraudņus savām vajadzībām un ir jāmaina veidne (tiek lēsts, ka tas ir vajadzīgs ikvienam), vislabāk ir saprast iepriekš minētās zināšanas, lai nebūtu pārslogoti, ja rodas problēma.





Iepriekšējo:Skatieties, kā pamatskolas skolēni spēlē LOL un nogalina visu dažu sekunžu laikā! (Jaunākais atskaņotāja oriģināls)
Nākamo:Luo Yonghao atbildēja, ka "āmura mobilie tālruņi zem 2500 ir mazbērni"
Atruna:
Visa programmatūra, programmēšanas materiāli vai raksti, ko publicē Code Farmer Network, ir paredzēti tikai mācību un pētniecības mērķiem; Iepriekš minēto saturu nedrīkst izmantot komerciāliem vai nelikumīgiem mērķiem, pretējā gadījumā lietotājiem ir jāuzņemas visas sekas. Informācija šajā vietnē nāk no interneta, un autortiesību strīdiem nav nekāda sakara ar šo vietni. Iepriekš minētais saturs ir pilnībā jāizdzēš no datora 24 stundu laikā pēc lejupielādes. Ja jums patīk programma, lūdzu, atbalstiet oriģinālu programmatūru, iegādājieties reģistrāciju un iegūstiet labākus oriģinālus pakalpojumus. Ja ir kādi pārkāpumi, lūdzu, sazinieties ar mums pa e-pastu.

Mail To:help@itsvse.com