Mojibake

Mojibake (文字化け, tariama /modʑibake/) - taip vadinami neteisingi, neįskaitomi simboliai, kurie rodomi, kai kompiuterio programinė įranga nesugeba teisingai rodyti teksto. Naudojant kompiuterius tekstas koduojamas naudojant simbolių koduotę. Perduodant kiekvienas simbolis pakeičiamas jo padėtimi (arba skaičiumi) koduotėje. Norint vėl rodyti simbolį, pozicija vėl pakeičiama simboliu. Kai pradinė koduotė nenurodyta, gali būti naudojamas kitas simbolis, kai rodant skaičius vėl pakeičiamas simboliu. Šiai problemai išspręsti buvo įvestas Unikodas: UTF-8 gali užkoduoti daugumą įprastų ženklų 2 baitais.

Prieš įvedant "Unicode" buvo naudojami kiti ženklų kodai. Pavyzdžiui, ISO-8859 yra 15 skirtingų kodų. Tai yra tie patys dažniausiai anglų kalboje naudojami ženklai. Jie turi keletą "specialiųjų ženklų" blokų, kurie kiekvienoje koduotėje pateikiami skirtingai.



Taip gali atrodyti svetainė, jei naudojama netinkama šrifto koduotė.Zoom
Taip gali atrodyti svetainė, jei naudojama netinkama šrifto koduotė.

Japonų Vikipedijos straipsnyje apie Mojibake naudojama UTF-8 koduotė. Šioje ekrano nuotraukoje parodyta, kaip jis atrodo iššifruotas naudojant standartinį "Windows" CP1252 kodavimą.Zoom
Japonų Vikipedijos straipsnyje apie Mojibake naudojama UTF-8 koduotė. Šioje ekrano nuotraukoje parodyta, kaip jis atrodo iššifruotas naudojant standartinį "Windows" CP1252 kodavimą.

Žodžio kilmė

"Mojibake" yra japoniškas žodis. Žodis 文字化け ([moʥibake]) sudarytas iš dviejų dalių. 文字 (moji) reiškia raidę, simbolį. 化け (bake) iš veiksmažodžio 化ける (bakeru) reiškia pasirodyti persirengus, įgauti pavidalą, pasikeisti į blogąją pusę. Pažodžiui tai reiškia "charakterio mutaciją".



Klausimai ir atsakymai

K: Kas yra "mojibake"?


A: "Mojibake" - tai terminas, kuriuo vadinami neteisingi ir neįskaitomi simboliai, atsirandantys, kai kompiuterio programinė įranga nesugeba teisingai atvaizduoti teksto.

K: Kaip koduojamas tekstas, kai naudojamasi kompiuteriu?


A: Tekstas koduojamas naudojant simbolių kodavimą, kai kiekvienas simbolis pakeičiamas jo padėtimi arba numeriu kodavime.

K: Kas atsitinka, kai perduodant tekstą nenurodoma pradinė koduotė?


A: Kai originali koduotė nenurodyta, gali būti naudojamas kitas simbolis, kai skaičius pakeičiamas rodomu simboliu.

K: Kas yra "Unicode" ir kaip jis išsprendžia šią problemą?


A: Unikodas yra simbolių kodavimo standartas, pagal kurį daugumą simbolių galima atvaizduoti dviem baitais. Juo išsprendžiama skirtingų simbolių kodavimų naudojimo problema ir užtikrinama, kad simboliai būtų rodomi teisingai.

K.: Kokie yra kitų simbolių kodų, naudotų prieš "Unicode", pavyzdžiai?


A: ISO-8859 yra kito simbolių kodavimo, naudoto prieš "Unicode", pavyzdys.

K: Kiek skirtingų kodavimų yra ISO-8859?


A: ISO-8859 yra 15 skirtingų kodų.

K: Ar ISO-8859 specialieji simboliai yra vienodi visose koduotėse?


A: Ne, ISO-8859 specialieji simboliai kiekvienoje koduotėje pateikiami skirtingai.

AlegsaOnline.com - 2020 / 2023 - License CC3