Indhold
· 1 Indledning
o 1.1 Forskellen mellem fysiske diske og logiske diske
o 1.2 Læsning og skrivning af data
o 1.3 Hvad er RAID?
o 1.4 Hvorfor bruge RAID?
o 1.5 Historie
· 2 Grundlæggende begreber, der anvendes i RAID-systemer
o 2.1 Caching
o 2.2 Spejling: Mere end én kopi af dataene
o 2.3 Striber: En del af dataene er på en anden disk
o 2.4 Fejlretning og fejl
o 2.5 Hot spares: Brug af flere diske end nødvendigt
o 2.6 Stripe-størrelse og chunk-størrelse: Fordeling af data på flere diske
o 2.7 Sammensætning af en disk: JBOD, sammenkædning eller spanning
o 2.8 Kloning af drev
o 2.9 Forskellige opsætninger
· 3 Grundlæggende: enkle RAID-niveauer
o 3.1 RAID-niveauer i almindelig brug
§ 3.1.1 RAID 0 "striping"
§ 3.1.2 RAID 1 "spejling"
§ 3.1.3 RAID 5 "striping med distribueret paritet"
§ 3.1.4 Billeder
o 3.2 RAID-niveauer, der anvendes mindre
§ 3.2.1 RAID 2
§ 3.2.2 RAID 3 "striping med dedikeret paritet"
§ 3.2.3 RAID 4 "striping med dedikeret paritet"
§ 3.2.4 RAID 6
§ 3.2.5 Billeder
o 3.3 Ikke-standard RAID-niveauer
§ 3.3.1 Dobbelt paritet / Diagonal paritet
§ 3.3.2 RAID-DP
§ 3.3.3.3 RAID 1.5
§ 3.3.4 RAID 5E, RAID 5EE og RAID 6E
§ 3.3.5 RAID 7
§ 3.3.6 Intel Matrix RAID
§ 3.3.7 Linux MD RAID-driver til MD
§ 3.3.8 RAID Z
§ 3.3.9 Billeder
· 4 Sammenføjning af RAID-niveauer
· 5 Oprettelse af et RAID
o 5.1 Software RAID
o 5.2 Hardware RAID
o 5.3 Hardware-assisteret RAID
· 6 Forskellige udtryk vedrørende hardwarefejl
o 6.1 Fejlprocent
o 6.2 Gennemsnitlig tid til datatab
o 6.3 Gennemsnitlig tid til genopretning
o 6.4 Uoprettelig bitfejlrate
· 7 Problemer med RAID
o 7.1 Tilføjelse af diske på et senere tidspunkt
o 7.2 Sammenhængende fejl
o 7.3 Atomicitet
o 7.4 Data, der ikke kan genfindes
o 7.5 Pålidelighed af skrivecache
o 7.6 Udstyrets kompatibilitet
· 8 Hvad RAID kan og ikke kan gøre
o 8.1 Hvad RAID kan gøre
o 8.2 Hvad RAID ikke kan gøre
· 9 Eksempel
· 10 referencer
· 11 Andre websteder
RAID er et akronym, der står for Redundant Array of Inexpensive Disks eller Redundant Array of Independent Disks. RAID er et begreb, der anvendes inden for computerbrug. Med RAID gøres flere harddiske til én logisk disk. Der er forskellige måder, hvorpå dette kan gøres. Hver af de metoder, hvor harddiskene sættes sammen, har nogle fordele og ulemper i forhold til at bruge diskene som enkelte diske, der er uafhængige af hinanden.
Hvorfor bruge RAID?
De vigtigste grunde til at bruge RAID er:
- For at beskytte mod tab af data ved at have redundans (mere end én kopi eller ved hjælp af paritet).
- For at øge lagerkapaciteten ved at kombinere flere mindre diske til ét stort logisk drev.
- For at øge ydeevnen — især læsehastigheden — ved at fordele data over flere drev.
- For at få større fleksibilitet, f.eks. mulighed for at udskifte eller tilføje diske, mens systemet kører (hot-swap / online expansion).
Det er ikke muligt at opnå alle disse mål fuldstændigt på samme tid — der er altid kompromiser mellem hastighed, kapacitet, omkostning og beskyttelse.
Fordele og begrænsninger
- Fordele: øget fejl-tolerance (afhænger af RAID-type), bedre læse-/skriveperformance i visse opsætninger, centraliseret lagerstyring.
- Begrænsninger: RAID beskytter ikke mod alle former for datatab (f.eks. utilsigtet sletning eller korruption). Genopbygning af et array efter diskfejl kan tage lang tid på store diske, og der kan opstå yderligere fejl under genopbygning.
- Nogle RAID-opsætninger bruger ældre eller inkompatible hardware/drivere, hvilket kan skabe problemer ved udskiftning af komponenter.
Kort historisk note
Konceptet RAID blev formaliseret i en indflydelsesrig artikel fra 1988. Siden da er teknologien blevet videreudviklet, og omkostningerne er faldet, så RAID i dag findes i både servermiljøer og forbrugerudstyr (f.eks. netværkstilsluttede lagringsenheder til musik og film).
Grundlæggende begreber
Her er de centrale begreber, som går igen i de fleste RAID-systemer:
- Spejling (mirroring): Samme data skrives til to eller flere diske (f.eks. RAID 1). Beskytter mod diskfejl, men halverer effektiv kapacitet ved 2-vejs spejling.
- Striping: Data opdeles i blokke ("stripes" eller "chunks") og spredes over flere diske. Giver øget ydeevne, men ingen redundans alene (f.eks. RAID 0).
- Paritet: En form for fejlinformation, som gemmes sammen med dataene, så man kan genskabe tabte data hvis en disk fejler (bruges i RAID 5, RAID 6 m.fl.).
- Hot spare: En ekstra disk i systemet, som automatisk kan erstatte en defekt disk og starte genopbygning uden manuel indsats.
- Caching: Hukommelse i controlleren eller systemet, som kan øge hastigheden. Vær opmærksom på, at skrivecache uden batteri eller ikke‑volatil cache kan medføre datatab ved strømsvigt.
- Stripe-størrelse / chunk-størrelse: Bestemmer hvor store blokke der skrives til hver disk før næste disk bruges. Valg påvirker ydeevne afhængigt af arbejdsbelastning (store sekventielle vs. små tilfældige I/O).
- JBOD (Just a Bunch Of Disks): Diskene ses hver for sig eller kædes sammen uden RAID-paritet/spejling.
De mest almindelige RAID-niveauer
Nedenfor er en kort og praktisk gennemgang af de hyppigst brugte niveauer:
RAID 0 — Striping
- Fordel: Meget bedre ydeevne og fuld pladsudnyttelse (kapacitet = sum af alle diske).
- Ulempe: Ingen redundans — hvis én disk fejler, går alle data tabt.
- Anvendelse: Midlertidige data, caches, eller arbejdsområder hvor ydeevne er vigtigere end sikkerhed.
RAID 1 — Spejling
- Fordel: Høj redundans — hver blok findes på mindst to diske. Hurtige læsninger (kan læse fra flere diske samtidig).
- Ulempe: Halveret effektiv kapacitet ved 2-vejs spejling.
- Anvendelse: Systemdisk til vigtige servere, databaser hvor sikkerhed er vigtigere end lagringskapacitet.
RAID 5 — Striping med distribueret paritet
- Fordel: Balanceret mellem kapacitet, ydeevne og redundans. Kan tåle én disks fejl uden tab af data.
- Ulempe: Skriveperformance kan være påvirket pga. paritetsberegning. Ved genopbygning (rebuild) er array sårbart; risiko for fejl ved store diske pga. uoprettelige læsefejl (URE'er).
- Anvendelse: Generel filserverbrug med moderat krav til både sikkerhed og kapacitet.
RAID 6 — Dobbelt paritet
- Fordel: Tåler to samtidige diskfejl. Mindre sårbar ved genopbygning på store diske.
- Ulempe: Mere kompleks paritetsberegning; lidt mindre kapacitet end RAID5 (kapacitet = N-2 diske).
- Anvendelse: Store arrays og miljøer med store diske, hvor sandsynligheden for en ekstra fejl under genopbygning er høj.
RAID 10 (1+0) — Spejlede striber
- Kombinerer fordelene ved RAID 1 og RAID 0: striping for ydeevne og spejling for redundans.
- Fordel: Høj ydeevne og høj fejl-tolerance afhængig af hvilke diske der fejler.
- Ulempe: Kræver mindst 4 diske og medfører overhead på 50 % kapacitetsmæssigt (ved 2-vejs spejling).
- Anvendelse: Databaser og applikationer med høje krav til både ydeevne og sikkerhed.
Andre og ikke-standard niveauer
Der findes mange variationer og proprietære løsninger som RAID 5E, RAID 5EE, RAID 6E, RAID-DP (Double Parity), RAID Z (ZFS), samt hardware-leverandørers egne varianter (f.eks. Intel Matrix RAID, RAID 7). Disse løser ofte specifikke behov som forbedret genopbygning, performanceoptimering eller avanceret fejlkorrektion.
Software RAID vs. Hardware RAID
- Software RAID: Håndteres af operativsystemet (f.eks. Linux MD/RAID). Fordele: fleksibilitet, omkostningseffektivt, kan migreres mellem hardware. Ulemper: CPU-belastning, kan være langsommere i visse scenarier.
- Hardware RAID: Bruger en dedikeret controller, ofte med egen cache og firmware. Fordele: mindre belastning af system-CPU, bedre skrivecache-muligheder. Ulemper: afhængighed af controller-driver og firmware; ved controllerfejl kan recovery blive vanskelig hvis controller ikke kan erstattes med identisk model.
- Hardware-assisteret RAID: Hybridløsninger hvor CPU hjælper med paritetsberegning, eller hvor en controller hjælper med I/O uden at være fuldstændig ansvarlig for logisk array.
Problemer og risici
- Genopbygningstid: Store diske betyder lange genopbygningstider; længere tid med nedsat redundans øger risikoen for yderligere fejl.
- Uoprettelig bitfejlrate (URE): Sandsynligheden for at en sektor ikke kan læses under en genopbygning. Ved store diske kan sandsynligheden for at støde på en URE under genopbygning blive kritisk for RAID5.
- Sammenhængende fejl: Fejl på grund af firmware, batch-fejl i diske fra samme producent, eller miljømæssige problemer (strøm, køling) kan medføre flere samtidige fejl.
- Skrivecache og atomicitet: Risiko for korruption hvis skrivecache ikke er beskyttet (f.eks. batteri eller ikke‑flygtig cache) og systemet mister strøm midt i en skriveoperation.
- Kompatibilitet: At flytte diske mellem forskellige controllers kan være problematisk, især med proprietære metadata.
Hvad RAID kan og ikke kan gøre
RAID kan:
- Øge tilgængelighed og modstandsdygtighed over for diskfejl (afhængigt af niveau).
- Forbedre læse- og/eller skriveydelse ved parallel adgang til flere diske.
- Centralisere lager styringen.
RAID kan ikke erstatte backup:
- RAID beskytter ikke mod menneskelige fejl (sletning), softwarefejl, virusangreb eller fysisk skade der påvirker alle kopier.
- RAID beskytter ikke automatisk mod korruption eller datarot — versionering og separate backups er stadig nødvendigt.
Praktiske anbefalinger
- Tag altid regelmæssige backups, og opbevar mindst én backup offsite eller i skyen.
- Overvej RAID 6 eller RAID10 for store diske og kritiske data. RAID5 kan være risikabelt med meget store kapaciteter.
- Brug enterprise-klasse diske i kritiske miljøer, og hold firmware opdateret.
- Brug hot-spares og overvågning for hurtig detektion og automatisk genopbygning.
- Sørg for, at controllerens skrivecache er batteri- eller ikke‑flygtigt beskyttet, hvis du anvender skrivecache.
- Test genopbygningsprocedurer og dokumentér, hvordan man gendanner arrayet ved hardwarefejl (særligt hvis proprietære controllere er i brug).
Eksempel
Et typisk eksempel: Et selskab kører en filserver med seks 4 TB diske i RAID6. Effektiv kapacitet er 4 × 4 TB = 16 TB (to diske bruges til paritet). Dette giver mulighed for, at to diske kan fejle uden tab. Hvis en disk går tabt, vil en hot-spare eller en ny disk automatisk påbegynde genopbygning. Under genopbygning kan I/O være langsommere, og der er stadig en risiko, hvis en tredje disk fejler før genopbygningen er fuldført — derfor overvågning og hurtig udskiftning er vigtigt.
Afsluttende bemærkninger
RAID er et kraftfuldt værktøj til at kombinere flere fysiske diske til ét logisk lager med valgfri redundans og/eller performanceforbedring. Valget af RAID-niveau bør baseres på krav til tilgængelighed, ydeevne og budget — og altid kombineres med et solidt backup-regime.
Virksomheder har brugt RAID-systemer til at lagre deres data, siden teknologien blev udviklet. Siden opdagelsen er omkostningerne ved at bygge et RAID-system faldet meget. Af denne grund har selv nogle computere og apparater, der bruges i hjemmet, nogle RAID-funktioner. Sådanne systemer kan for eksempel bruges til at gemme musik eller film.














