Mojibake

Mojibake (文字化け, udtales /modʑibake/) er betegnelsen for ukorrekte, ulæselige tegn, der vises, når computersoftware ikke viser teksten korrekt. Når man bruger computere, er tekst kodet ved hjælp af en tegnkodning. Ved overførsel erstattes hvert tegn med dets position (eller nummer) i kodningen. For at vise tegnet igen erstattes positionen igen med tegnet. Når den oprindelige kodning ikke er angivet, kan der anvendes et andet tegn, når nummeret igen erstattes med det tegn, der skal vises. Unicode blev indført for at løse dette problem: UTF-8 er i stand til at kode de mest almindelige tegn i 2 bytes.

Før Unicode blev indført, blev der brugt andre tegnkodninger. ISO-8859 indeholder f.eks. 15 forskellige kodninger. Disse er de samme for de tegn, der almindeligvis anvendes på engelsk. De har flere "blokke" af "specialtegn", som er arkiveret forskelligt for hver kodning.



Sådan kan et websted se ud, hvis der anvendes en forkert kodning af skrifttypen.Zoom
Sådan kan et websted se ud, hvis der anvendes en forkert kodning af skrifttypen.

Den japanske Wikipedia-artikel om Mojibake bruger UTF-8-kodning. Dette skærmbillede viser, hvordan den ser ud, når den afkodes ved hjælp af standard Windows CP1252-enkodning.Zoom
Den japanske Wikipedia-artikel om Mojibake bruger UTF-8-kodning. Dette skærmbillede viser, hvordan den ser ud, når den afkodes ved hjælp af standard Windows CP1252-enkodning.

Ordets oprindelse

Mojibake er et japansk ord. Ordet 文字化け ([moʥibake]) består af to dele. 文字 (moji) betyder bogstav, tegn. 化け (bake), fra verbet 化けける (bakeru), betyder at optræde forklædt, at tage form af, at ændre sig til det værre. Bogstaveligt betyder det "karaktermutation".



Spørgsmål og svar

Q: Hvad er "mojibake"?


A: Mojibake er betegnelsen for forkerte og ulæselige tegn, der vises, når computersoftware ikke kan vise tekst korrekt.

Q: Hvordan kodes tekst, når man bruger computere?


A: Tekst kodes ved hjælp af en tegnkodning, hvor hvert tegn erstattes af dets position eller nummer i kodningen.

Q: Hvad sker der, når den oprindelige kodning ikke er angivet, når man overfører tekst?


A: Når den oprindelige kodning ikke er angivet, kan der bruges et andet tegn, når nummeret erstattes med det tegn, der skal vises.

Q: Hvad er Unicode, og hvordan løser det dette problem?


A: Unicode er en tegnkodningsstandard, der kan repræsentere de fleste tegn i to bytes. Det løser problemet med at bruge forskellige tegnkodninger og sikrer, at tegnene vises korrekt.

Q: Hvad er nogle eksempler på andre tegnkodninger, der blev brugt før Unicode?


A: ISO-8859 er et eksempel på en anden tegnkodning, der blev brugt før Unicode.

Q: Hvor mange forskellige kodninger indeholder ISO-8859?


A: ISO-8859 indeholder 15 forskellige kodninger.

Q: Er specialtegnene i ISO-8859 de samme for alle kodningerne?


A: Nej, specialtegnene i ISO-8859 er arkiveret forskelligt for hver kodning.

AlegsaOnline.com - 2020 / 2023 - License CC3