Et substitutionschiffer (ofte også kaldet substitutionsciffer) er en enkel form for kryptografi, hvor hvert bogstav i en klartekst erstattes af et andet bogstav efter en bestemt regel. Reglen kan være så enkel som "flyt hvert bogstav tre pladser frem i alfabetet" eller en vilkårlig blanding af bogstaver — så længe hver klartekstbogstav altid bliver byttet til det samme chifferbogstav.

Hvordan det virker

I en monoalfabetisk substitutionschiffer benyttes ét fast erstatningsalfabet: hver forekomst af et givet bogstav i klarteksten bliver udskiftet med samme bogstav i chifferteksten. For eksempel kan en regel være at erstatte:

  • A → D, B → E, C → F, … (et simpelt skub af alfabetet)
  • Eller en vilkårlig ombytning: A → Q, B → X, C → M, …

Et simpelt eksempel på en substitutionsmetode er Cæsar-chifferet, hvor man skubber alle bogstaver et fast antal pladser i alfabetet (klassisk er skubbet 3 pladser: A → D, B → E osv.). Substitutionschiffer kan også være mere komplicerede typer som homofone substitutioner (hvor et klartekstbogstav kan blive kodet som flere mulige chifferbogstaver) eller polygrafiske skemaer (der arbejder med par eller grupper af bogstaver).

Eksempel på Cæsar-chiffer

Ved et Cæsar-chiffer med skub på 3 bliver ordet "Hej" til "Khj" (H → K, e → h, j → m osv.). Cæsar-chifferet er let at bryde, fordi der kun findes 25 mulige skift for det latinske alfabet — man kan simpelthen prøve dem alle.

Frekvensanalyse — hvordan man bryder et substitutionschiffer

Substitutionschifrer er svage mod en metode, der kaldes frekvensanalyse. Ideen er, at bogstaver i et givet sprog forekommer med forskellige hyppigheder. I engelsk er f.eks. E det mest almindelige bogstav efterfulgt af T, A, O, I, N, og i dansk er E også særligt hyppig sammen med fx R, N, T. Når et langt nok stykke tekst er krypteret med en simpel substitution, bevares disse frekvensmønstre — blot med andre bogstaver.

Grundlæggende fremgangsmåde ved frekvensanalyse:

  • Tæl hvor ofte hvert chifferbogstav forekommer i den krypterede tekst.
  • Sammenlign fordelingen med kendte bogstavfrekvenser for det sprog, du tror teksten er skrevet på (fx engelsk eller dansk) og lav et første gæt: dét chifferbogstav, der forekommer hyppigst, kan svare til E.
  • Se på ordmønstre og korte ord: to-bogstavs- og tre-bogstaver-ord (fx "og", "en", "the", "and") og gentagne mønstre (som dobbelt-bogstaver) kan bekræfte eller afkræfte gæt.
  • Brug digrafer og trgrafer (almindelige par og tripletter som "TH", "HE", "IN" i engelsk) til yderligere spor.
  • Iterer: indfør enkelte korrektioner, se om resultatet giver meningsfulde ord, og ret til indtil hele teksten læses.

For korte beskeder er frekvensanalyse ofte upræcis, fordi statistikken er for lille. For meget lange tekster bliver den derimod pålidelig. Kryptogrammer (meddelelser skjult med et substitutionschiffer) er et almindeligt puslespil i aviser og blade netop fordi denne teknik gør det muligt at løse dem uden kendskab til nøglen.

Svagheder og moderne alternativer

Enkle substitutionschifrer er ikke sikre til beskyttelse af fortrolige eller vigtige oplysninger. Der findes forbedringer (fx homofone eller polialfabetiske systemer) som kan gøre frekvensanalyse sværere, men de ægte sikre metoder i dag bygger på moderne kryptografi — matematiske systemer som symmetrisk kryptering (f.eks. AES) og asymmetrisk kryptering (f.eks. RSA) — og ikke på simple substitutionsregler.

Afslutningsvis er substitutionschifrer fremragende til undervisning, historiske studier og puslespil, fordi principperne er lette at forstå og de giver mulighed for at lære grundlæggende idéer i kryptografi og analyse. Til praktisk informationssikkerhed skal man dog vælge moderne, velstuderede metoder.