ISO 639 er et sæt internationale standarder, der indeholder en liste over korte koder for sprognavne. Først var der ISO 639-1. For at opregne flere sprog blev ISO 639-2 lavet. Senere versioner omfatter ISO 639-3 og ISO 639-5.
Hvert sprog har en kode på 3 bogstaver. Nedenstående liste viser alle koderne i ISO 639-2.
Indhold
- A
- B
- C
- D
- E
- F
- G
- H
- I
- J
- K
- L
- M
- N
- O
- P
- Q
- R
- S
- T
- U
- V
- W
- X
- Y
- Z
Hvad adskiller ISO 639-2 fra andre dele af ISO 639
ISO 639-1 bruger to-bogstavskoder og dækker primært de mest udbredte sprog. ISO 639-2 indførte tre-bogstavskoder for at kunne dække langt flere sprog, herunder dem uden to-bogstavskode. ISO 639-3 dækker endnu flere individuelle sprog (fx dialekter og mindre sprog) og ISO 639-5 beskriver sproggrupper og familier.
Bogstaver: bibliografiske (B) og terminologiske (T) koder
I ISO 639-2 findes for en række sprog to forskellige tre-bogstavskoder:
- B (bibliografisk) — historisk brugt i bibliografiske systemer.
- T (terminologisk) — baseret på navnet på sproget på dets eget sprog eller en nyere standardisering.
Det betyder, at nogle sprog har både en B- og en T-kode. Eksempler (ikke udtømmende):
- Albansk: alb (B) / sqi (T)
- Armenisk: arm (B) / (T)
- Kinesisk: chi (B) / zho (T)
- Hollandsk: dut (B) / nld (T)
Bemærk: i praksis bruges T-koder ofte i tekniske sammenhænge i dag, men begge typer kan forekomme i eksisterende databaser og metadata.
Særlige koder og reserverede værdier
ISO 639-2 indeholder også generiske eller særlige koder, der bruges til metadata og katalogisering:
- und — undetermined (uspecificeret sprog)
- mul — multiple languages (flere sprog)
- mis — miscellaneous (sprog, der ikke er kodet individuelt)
- zxx — ingen sproglig indhold (fx instrumental musik)
Vedligeholdelse og kilder
ISO 639-2 blev udarbejdet for at udvide dækningen af sprog ud over de få med to-bogstavskoder. Vedligeholdelsen af ISO 639-2 har historisk været knyttet til biblioteker og standardiseringsorganer; opdateringer foregår gennem en vedligeholdelsesproces defineret af ISO. ISO 639-3 administreres af SIL International, mens ISO‑639‑5 dækker grupper/familier.
Anvendelse og praktiske råd
- Brug ISO 639-1 (to-bogstav) i systemer der understøtter det, da det er kortere og bredt understøttet (fx HTML lang-attributter), men hvis sproget ikke har en to-bogstavskode, anvendes ISO 639-2 tre-bogstavskoden.
- For meget detaljeret klassifikation af mindre eller historiske sprog bør ISO 639-3 konsulteres.
- Ved dataudveksling og bibliografisk arbejde skal man være opmærksom på B/T-differencen, da nogle ældre registre bruger bibliografiske koder.
- Til standardiserede internet- og softwareformater er det ofte bedst at følge RFC/BCP-anbefalinger (fx BCP 47/RFC 5646), som bruger ISO 639-koder i kombination med andre subtags.
Hvordan læser man nedenstående liste
Den alfabetiske indholdsfortegnelse ovenfor leder til de respektive bogstaver i den komplette liste. Hvert sprog i listen er angivet med sin tre-bogstavskode, evt. tilhørende to-bogstavskode (hvis relevant), og ofte en kort sprogbetegnelse eller note om B/T-status. Listen er nyttig til katalogisering, metadata, sprogidentifikation og teknisk lokaliseringsarbejde.
Hvis du har brug for hjælp til at slå en konkret kode op eller ønsker en samlet tabel med både ISO 639-1 og ISO 639-2 koder for et udvalg af sprog, sig til — så kan jeg indsætte en overskuelig liste med eksempler.