Datalagring: Oversigt over hukommelseshierarki og lagringsmedier

Dybdegående guide til datalagring: forstå hukommelseshierarki, primær/sekundær/tertiær lagring og forskelle mellem HDD, SSD, flash og bånd.

Forfatter: Leandro Alegsa

Datalagring er betegnelsen for en række komponenter i en computer. Hovedformålet med disse komponenter er at lagre data. Den centrale databehandlingsenhed er derefter i stand til at hente og ændre dataene. I de fleste computere er der et computerhukommelseshierarki: Hukommelse, der er "tættere" på CPU'en, er normalt hurtigere at få adgang til, men den er også mindre; data, der lagres i denne type hukommelse, kræver normalt elektrisk strøm for at bevare dataene.

Hukommelse, der er længere væk, er normalt langsommere at få adgang til, men også større. Klassiske lagringsmedier for denne type data er bl.a. harddiske og USB-flashdrev. Nogle medier tilbyder endnu større kapacitet, men adgangen til dem er meget langsom. Eksempler på sådanne medier er bånddrev. Moderne CPU'er har registre, der kan lagre data, og de har også ofte flere niveauer af cache.

Endelig er der hovedhukommelsen, som CPU'en kan få adgang til. Disse tre er normalt omtalt som primær datalagring. Nogle computere har også en cache-hukommelse.

Sekundær lagring er normalt ikke direkte tilgængelig for CPU'en, og data skal overføres til primær lagring for at være tilgængelige. Sekundær lagring omfatter harddiske og ikke-flygtig hukommelse med vilkårlig adgang. Tertiær lagring bruges til arkivering og sikkerhedskopiering; meget ofte kopieres den til sekundær lagring før brug. Software distribueres undertiden via tertiære medier som f.eks. magnetbånd og cd-rom.

Hukommelseshierarkiets niveauer — oversigt

  • Registrene (i CPU): Mindst og hurtigst. Bruger typisk meget lave latenser og er direkte adresserbare af CPU-instruktioner.
  • Cache (L1, L2, L3): SRAM-baseret hukommelse tæt på CPU-kernen. Reducerer adgangen til langsommere hovedhukommelse ved at holde ofte anvendte data og instruktioner tæt på procesenheden.
  • Hovedhukommelse (RAM): Typisk DRAM, som er større end cache men langsommere. Bruges til at holde aktive programmer og data; flygtig og kræver strøm for at bevare indholdet.
  • Sekundær lagring: Ikke-flygtig, større kapacitet — fx harddiske, SSD'er og USB-flashdrev. Data flyttes fra sekundær til primær lagring for behandling.
  • Tertiær/arkivlagring: Meget omkostningseffektiv per GB, men med højere adgangstider — fx bånddrev, optiske medier eller kolde objektsky-løsninger.

Primær lagring — detaljer

Primær lagring dækker registre, cache og hovedhukommelse. Registrene og cache er ofte baseret på SRAM og har extremt lave latenser (nanosekund-klasse). Hovedhukommelse (DRAM) er langsommere end cache, men typisk meget hurtigere end sekundære medier. I moderne systemer spiller cache-hierarkiet en afgørende rolle for ydelsen: L1-cache er meget hurtig, men lille; L2 og L3 er større men lidt langsommere.

Vigtige punkter:

  • Volatilitet: Primær hukommelse er typisk flygtig — den mister indhold ved strømnedbrud.
  • Adgangsgranularitet: CPU arbejder med bytes/ord, mens cache og RAM er optimeret til hurtig, tilfældig adgang.
  • Virtuel hukommelse: Operativsystemer bruger paging/swap for at udvide RAM ved at flytte mindre brugte sider til sekundær lagring.

Sekundær lagring — moderne medier og egenskaber

Sekundær lagring omfatter traditionelle magnetiske harddiske, flash-baserede enheder (f.eks. SSD'er og USB-flashdrev) samt mere specialiserede medier. Nogle vigtige karakteristika:

  • HDD (Harddisk): God kapacitet pr. krone, velegnet til store mængder data. Bedre til sekventiel læsning/skrive end tilfældig I/O. Bruges ofte til backup, arkiv og lagring af store filer.
  • SSD (flash): Hurtigere adgangstider, højere IOPS og bedre tilfældig ydelse. Fås i SATA, NVMe (PCIe) formater — NVMe tilbyder markant lavere latenser og højere throughput. Flash er ikke-flygtig, men har begrænset antal skrivecyklusser; teknologier som wear leveling og ECC forbedrer holdbarheden.
  • USB-flash og SD-kort: Praktiske, bærbare og billige for moderate kapaciteter; ofte langsommere og mindre holdbare end interne SSD'er.
  • Bånd og optiske diske: Lavt energiforbrug og lav pris per GB til arkivering. Bånd er optimalt til store sekventielle backups og langtidsarkivering.

Tertiær lagring og arkivering

Tertiær lagring bruges når data sjældent tilgås, men skal bevares i årevis. Det omfatter magnetbånd, kolde cloud-arkiver og nogle gange optiske medier. Fordele er lav pris per GB og lang levetid (især for korrekt opbevaret bånd eller optiske medier). Ulempen er høje adgangstider og ofte behov for at migrere medier over tid pga. teknologisk forældelse.

Netværk, sky og objektlagring

Ud over lokale medier findes netværkslagring (NAS, SAN) og skybaserede løsninger. Disse tilbyder fleksibilitet, replikation og central administration:

  • NAS: Filbaseret netværkslagring, let at integrere i lokale netværk.
  • SAN: Blokbaseret lagring til højtydende servermiljøer, ofte over Fibre Channel eller iSCSI.
  • Objektlagring (fx i skyen): Skalerer til enorme mængder data, egnet til arkiv og distribuerede applikationer; typisk gemt som objekter med metadata, ikke som traditionelle filer.

Interfacer og protokoller

Adgangen til sekundær lagring afhænger af interface og protokol. Almindelige eksempler:

  • SATA: Udbredt til HDD og ældre SSD'er.
  • NVMe over PCIe: Moderne SSD'er med meget lav latenstid og høj båndbredde.
  • SCSI / SAS: Bruges i servermiljøer for pålidelighed og ydelse.
  • USB: Praktisk til eksterne drev og flash-enheder.
  • NFS, SMB/CIFS: Netværksfilsystemer til deling af filer over netværk.

Ydeevneparametre og adgangsmønstre

Når man vælger et lagringsmedium, er det vigtigt at forstå adgangsmønsteret:

  • Sekventiel adgang: Langsomere medier som bånd og mekaniske diske kan være effektive ved store sekventielle læs/skriv.
  • Tilfældig adgang: Kræver lav latenstid og høj IOPS — her klarer SSD'er sig langt bedre end traditionelle harddiske.
  • Gennemstrømning vs. latenstid: Gennemstrømning måles i MB/s, latenstid i ms eller µs. Valg afhænger af applikationen (f.eks. databaser vs. arkiver).

Pålidelighed, dataintegritet og sikkerhed

Moderne lagringssystemer bruger teknikker som ECC (error-correcting code), RAID, snapshots, deduplikation og kryptering for at sikre data. Flash-baserede medier har slitagebegrænsninger (TBW — terabytes written), og operativsystemer/firmware anvender wear leveling for at fordele skriverutiner.

Sikkerhedskopiering og arkiveringsstrategier

Gode praksisser inkluderer:

  • 3-2-1-reglen: Mindst 3 kopier af data på 2 forskellige medier, 1 kopi offsite (fx i sky eller på bånd).
  • Routinemæssige verificeringer og gendannelsestests for at sikre backup-integritet.
  • Brug af versionsstyring og snapshots for at kunne rulle tilbage ved fejl eller ransomware-angreb.

Valg af lagringsmedium — praktiske råd

Valget afhænger af krav til ydeevne, kapacitet, holdbarhed og omkostninger:

  • Til operativsystem og aktive databaser: NVMe SSD eller hurtig SAS SSD.
  • Til filservere og lagring af store datasæt: Kombination af HDD (til kapacitet) og SSD-cache til varme data.
  • Til backup og arkiv: Bånd eller kolde cloud-løsninger.
  • Til bærbarhed: USB-flash eller ekstern SSD afhængig af krav til hastighed og robusthed.

Samlet set er datalagring et komplekst område, hvor man balancerer hastighed, kapacitet, pris, holdbarhed og sikkerhed. For effektiv dataledelse kombineres ofte flere lagringsmedier og teknikker (caching, tiering, replikation og backup) for at opfylde både driftsmæssige og arkiveringsmæssige behov.

40 GB PATA-harddisk (HDD); når den er tilsluttet en computer, fungerer den som sekundær lagringsplads.Zoom
40 GB PATA-harddisk (HDD); når den er tilsluttet en computer, fungerer den som sekundær lagringsplads.

160 GB SDLT-båndkassette, et eksempel på offline lagring. Når den anvendes i et robotbåndbibliotek, klassificeres den i stedet som tertiær lagring.Zoom
160 GB SDLT-båndkassette, et eksempel på offline lagring. Når den anvendes i et robotbåndbibliotek, klassificeres den i stedet som tertiær lagring.

Spørgsmål og svar

Spørgsmål: Hvad er datalagring på en computer?


A: Datalagring er betegnelsen for en række komponenter i en computer, som bruges til at lagre data.

Spørgsmål: Hvad er formålet med disse komponenter?


A: Hovedformålet med disse komponenter er at lagre data, så de kan tilgås og ændres af den centrale procesenhed.

Spørgsmål: Hvordan fungerer hukommelseshierarkiet?


Svar: I de fleste computere er der et hukommelseshierarki, hvor hukommelse, der er tættere på CPU'en, har tendens til at være hurtigere at tilgå, men mindre i størrelse, mens hukommelse længere væk fra CPU'en har tendens til at være langsommere at tilgå, men større i størrelse.

Spørgsmål: Hvad er nogle eksempler på klassiske lagringsmedier?


A: Eksempler på klassiske lagringsmedier er harddiske og USB-flashdrev.

Spørgsmål: Hvilken type medie tilbyder større kapacitet, men adgangen til dem er meget langsom?


Svar: Medier som f.eks. bånddrev har større kapacitet end andre typer, men de er meget langsomme, når der skal gives adgang til dem.


Spørgsmål: Hvad er primære datalagringskomponenter?


A: Primære datalagringskomponenter omfatter registre, der findes på moderne CPU'er, som kan lagre data, flere niveauer af cache og hovedhukommelse, som CPU'en kan få adgang til.

Spørgsmål: Hvilken type lagring er der normalt ikke direkte adgang til fra CPU'en?


Svar: Sekundær lagring kan normalt ikke tilgås direkte af CPU'en og kræver, at dens indhold overføres til primær lagring, før den kan bruges. Eksempler herpå er harddiske og ikke-flygtig hukommelse med vilkårlig adgang.


Søge
AlegsaOnline.com - 2020 / 2025 - License CC3