Hollands skema-sætning, også kaldet den grundlæggende sætning for genetiske algoritmer, er en ulighed, der følger af en grovkornet ligning for evolutionær dynamik. Skema-teoremet siger i sin enkleste form, at korte, lave skemaer med en fitness over gennemsnittet øges i hyppighed i successive generationer, typisk eksponentielt når betingelserne er gunstige. Sætningen blev foreslået af John Holland i 1970'erne og blev i første omgang bredt opfattet som grundlaget for forklaringer på de genetiske algoritmers styrke. Denne fortolkning er dog blevet nuanceret og kritiseret i senere arbejde, hvor man bl.a. viser, at skema-teoremet kan betragtes som et specialtilfælde af Price-ligningen med skemaindikatorfunktionen som den makroskopiske måling.
Et skema er en skabelon, der identificerer en delmængde af strenge ved at spesificere værdier på nogle positioner og lade andre positioner være vilkårlige (ofte skrevet med et wildcard-symbol, fx “*”). Eksempel: skemaet 1*0*1 matcher alle bitstrenge af længde 5, hvor positionerne 1, 3 og 5 er hhv. 1, 0 og 1, mens positionerne 2 og 4 kan være enten 0 eller 1. Skemaer er et specialtilfælde af cylindermængder og udgør derfor et topologisk rum, hvilket gør det muligt at betragte algebraiske og måltekniske egenskaber ved udvalg af skemaer.
Formelt indhold og notation
Nogle centrale begreber og notation, som Holland brugte:
- o(H) — skemaets orden: antallet af faste positioner (ikke-wildcards) i skemaet H.
- δ(H) — skemaets definerende længde: afstand mellem skemaets første og sidste faste position.
- m(H,t) — antal (eller andel) individer i populationen ved generation t, der matcher skemaet H.
- f(H) — gennemsnitlig fitness blandt alle individer, der matcher H; f̄ er den gennemsnitlige fitness i hele populationen.
- p_c — sandsynlighed for crossover; p_m — sandsynlighed for mutation per bit.
Den klassiske skema-ulikhed (et nedre bound) kan formuleres (i en forenklet form) som en forventning for antallet af skema-eksemplarer i næste generation:
E[m(H,t+1)] ≥ m(H,t) · (f(H)/f̄) · (1 − p_c · δ(H)/(l−1) − o(H) · p_m)
Her er l længden af hele strengen. Læseren bør bemærke, at denne formel er en forenkling og giver et konservativt estimat: den antager, at crossover og mutation kun kan ødelægge skemaet (disruptive effekter) og medregner ikke muligheder for, at de samme operationer kan skabe nye forekomster af H.
Intuition og implikationer
Essensen af teoremet er, at kortfattede (lave δ) og lave-ordens (lave o) skemaer, som har højere end gennemsnitsfitness, tenderer til at blive overrepræsenteret i efterfølgende generationer. Dette gav grobund for den såkaldte building-block hypothesis: at genetiske algoritmer samler og kombinerer små, fordelagtige byggesten (skemaer) for gradvist at konstruere bedre løsninger.
Begrænsninger og kritik
- Skema-teoremet giver et nedre bound (en ulighed), ikke en eksakt evolutionær ligning; derfor er det ikke et fuldstændigt prædiktionsværktøj for GA-adfærd i praksis.
- Formlen overser ofte skabelsesmekanismer: crossover og mutation kan både ødelægge og skabe skemaer, så et rent fokus på "bevarelse" er ufuldstændigt.
- Teoremet fremsætter ikke, og kan ikke bevise, at GAs altid er effektive — deres succes afhænger af problemets landskab, repræsentation, parametervalg og populationens mangfoldighed.
- Som nævnt ovenfor kan skema-teoremet udledes fra mere generelle rammer som Price-ligningen ved at vælge skemaets indikatorfunktion som måling; dette viser, at teoremet er en matematisk konsekvens af bredere evolutionære principper og ikke i sig selv en komplet forklaring på GAers effektivitet.
Praktiske konsekvenser for design af genetiske algoritmer
- Repræsentation: Kortere definerende længder for vigtige byggesten og kodningsvalg, der samler relevante variable tættere, reducerer sandsynligheden for ødelæggelse ved crossover.
- Parametervalg: Moderat crossover-sandsynlighed og lave mutationrater mindsker destruktion af små byggesten, men man må sikre tilstrækkelig mutation/variation for at opdage nye gode skemaer.
- Population og selektion: Tilstrækkelig stor population og passende selektionsstyrke bevarer mangfoldighed, så lovende skemaer ikke tabes tidligt.
- Rekombinationsoperatorer: Problemtilpassede crossover- og mutationsoperatorer kan reducere uheldig fragmentering af værdifulde skemaer og nogle gange aktivt genoprette dem.
Sammenfattende er Hollands skema-sætning et vigtigt teoretisk værktøj til at forstå nogle grundlæggende mekanismer i genetiske algoritmer: hvordan små fordelagtige mønstre kan forstærkes over tid. Den skal dog anvendes med omtanke og suppleres af bredere analyser (fx Price-ligning, empiriske eksperimenter og landskabsanalyser) for fuldt ud at beskrive og forudsige en GAs opførsel i konkrete problemer.

