RAID

Backup vs RAID

Backup vs RAID
Sikkerhedskopier er en vigtig del af vores digitale liv. Hver computer fra gigantiske databaser til en enkelt personlig computer eller mobil enhed har brug for en sikkerhedskopi. Et sted, hvor de mest relevante brugerdata kan lagres i lang tid og også lagres på en sådan måde, at de kan gendannes i nødstilfælde. Vi kan skelne mellem dataene på vores aktuelt kørende system, lad os kalde det live data, og sikkerhedskopieret data. Sidstnævnte opbevares væk fra det nuværende system, der bruger live data.

RAID, vedrører sig selv med live data, det er en mekanisme, hvormed et kørende system kombinerer flere diske til en enkelt lagringsenhed. Dataene spredes derefter på tværs af alle diskene på en sådan måde, at de kan overleve svigtet af mindst en (eller flere) af de fysiske diske. Den enkleste type RAID-array er RAID1 eller spejling. Det er her, du kopierer (eller spejler) de samme data på tværs af to eller flere diske, så hvis en af ​​diskene fejler, kan dataene stadig overleve og stadig bruges aktivt. Der er også andre RAID-konfigurationer, og vi vil diskutere dem, når vi går videre.

Om RAID

RAID eller Redundant Array of Inexpensive Disks er en mekanisme til lagring af data på tværs af diske. Der er et bredt “array” af RAID-opsætning, som du kan gå med, men de to grundlæggende mekanismer, som de alle er baseret på, er følgende:

1. Spejling:

Spejling indebærer, at dine datablokke kopieres, spejles på tværs af flere diske. Hvis du spejler dine data på tværs af tre diske, kan du overleve op til to diske, der fejler på et givet tidspunkt, de mislykkede diske kan derefter udskiftes med nye uden meget besvær. Tilsvarende, hvis du kopierer data på tværs n + 1 diske, kan du modstå op til n diske fejler. Ulempen ved dette er, at du kun får lagerkapaciteten svarende til den mindste disk i dit RAID-array.

2. Paritet:

En anden tilgang er at opdele dine data i to dele ved hjælp af de to blokke af brugerdata kan du oprette en tredje 'paritetsblok'. De tre blokke har alle samme størrelse og er spredt på forskellige enheder. Mindst tre enheder er nødvendige for at denne konfiguration fungerer. Hvis nogen af ​​disken fejler, kan du genskabe de blokke, der er gemt på den disk, ved hjælp af de to andre blokke. For eksempel, hvis den anden brugerblok går tabt, kan den første blok og paritetsblokken bruges til at beregne den anden brugerblok. Hvis du er interesseret i, hvordan dette fungerer, skal du tjekke denne vidunderlige forklaring.

Denne metode kan forbedres yderligere for at have 2 eller endda 3 paritetsblokke. Men mere end 3 paritetsblokke ses ikke så ofte i branchen. Hvis du har en paritetsblok, kan du overleve en diskfejl. To paritetsblokke betyder, at du kan modstå, at to diske fejler, og så videre.

Det er mere effektivt med hensyn til lagerudnyttelse end spejling. Hvis du har en paritetsblok, behøver du kun 50% mere fysisk lager pr. Faktiske brugerdata, som du lagrer. Dette betyder at gemme 1 GB data, du får brug for 1.5 GB lagerplads (plus der er en lille overhead til metadataene). Dette er langt mere effektivt end endda den mest effektive spejlingsplan, hvor du har brug for mindst 2 GB lagerplads for at spejle 1 GB data mellem to diske.

Ulempen er, at tilfældige skriveoperationer vil blive bremset takket være den ekstra bit beregning og skriveoperation, der er forbundet med paritetsblokken. Også pålideligheden er ikke så god som en n + 1 spejlede diske, hvor du kan forberede dig på et vilkårligt antal diske, der fejler.

RAID-konfigurationer kan være så komplekse eller så enkle, som du vil have dem, du kan kombinere paritets- og spejlingsstrategier og ændre dem efter din virksomheds smag. Der er dedikerede RAID-controllere, som du forbinder dine fysiske diske til, og OS ser derefter en enkelt logisk disk som vist af controlleren. LSI er en sådan leverandør af RAID-controllere. Du kan også udføre RAID i softwaren OpenZFS er sandsynligvis det bedste valg, du har i den henseende.

En sidste slags RAID, der får en hæderlig omtale, er RAID 0. Teknisk set er det ikke et RAID-skema, fordi der ikke er nogen redundans involveret her. Ideen bag RAID 0 er simpelthen at sprede dine data på tværs af flere lagerenheder uden nogen modstandsdygtighed over for diskfejl. Fordelen er, at du får ydelsesforbedringer ved at gøre dette. Hvis du skriver 1 GB data til en enkelt disk, går processen langsomt. Disken kan kun udføre et begrænset antal skriveoperationer pr. Sekund, og dit operativsystem skal vente på, at det er færdigt med denne operation, før nye data sendes sin vej. Hvis du spreder de samme 1 GB data på to sådanne diske, kan du skrive (og læse) fra dem begge samtidigt og få en hel del forbedring af ydeevnen.

Back Ups

Begrebet sikkerhedskopier kan diskuteres vigtigere end RAID. En sikkerhedskopi i forbindelse med lageradministration er en kendt god kopi af data fra et givet tidspunkt, hvorfra du kan gendanne filer tilbage til dit hovedsystem, når det er nødvendigt. Med hensyn til implementering er der også mange cloudhostede løsninger og mange offline-løsninger, der også kan bruges.

Tarsnap og Backblaze er mine foretrukne administrerede sikkerhedskopieringstjenester til både private og forretningsbrugssager. Du kan også medtage Google Drive, iCloud eller Dropbox i denne definition af en sikkerhedskopi løsning, men de er mere målrettet mod forbrugermarkedet end virksomheden. Imidlertid er det underliggende princip stadig det samme. Når du logger på en ny iPhone eller iPad, synkroniseres alle data, dine kontakter, fotos, mediebibliotek osv. Fra din iCloud-konto problemfrit, og når du fortsætter med at bruge din enhed, bliver de nyere data lydløst bakket op i skyen, og du don ' Jeg behøver ikke bekymre dig om det.

Din sikkerhedskopiløsning kan være så enkel som at kopiere data til en ekstern harddisk eller at bruge rsync (eller zfs send, hvis du bruger OpenZFS) til periodisk at generere en kopi af alle relevante oplysninger. Dette kan omfatte din Dokument-mappe, din database, dit kildelager eller endda hele dit rodfilsystem splat i en flad zip eller en tarball. De vigtige kriterier, som en god sikkerhedskopiløsning skal opfylde, er følgende:

  1. Sikkerhedskopier bør forekomme ofte - Hvis du sikkerhedskopierer data hver måned i stedet for hver uge, risikerer du at miste op til en måneds værdi af data, når katastrofen rammer.
  2. Dine sikkerhedskopier skal gå tilbage i tiden - Backuplageret er begrænset. Nogle gange skal du smide ældre sikkerhedskopier. Jo mere lagerplads du har, jo bedre kan dine sikkerhedskopier være. Antag at du sikkerhedskopierer dine data ugentligt, men smider sikkerhedskopier ældre end 2 uger. Hvis en fil ved et uheld slettes, og dette går ubemærket hen i to uger, har du ikke en måde at bringe den tilbage.
  3. Dine filer skal faktisk kunne genoprettes - Hvis du aldrig har prøvet at gendanne dine data fra sikkerhedskopien, har du ikke en sikkerhedskopi. Du skulle ikke være nødt til at lære at gendanne data på det kritiske tidspunkt, hvor du led et datatab. Planlæg forud og ved, hvordan du gendanner systemet fra den sidst kendte sikkerhedskopi.
  4. Din sikkerhedskopi skal adskilles fra det kørende system - Når katastrofe rammer, og alle dine filer på produktionsserveren bliver krypteret, slettet eller ødelagt, skal du sørge for, at det samme ikke sker med din sikkerhedskopi. En god måde at sikre dette på er at sikre, at din backupenhed ikke er 'forbundet' til dit produktionsmiljø, dvs.træk stikket ud af din USB-harddisk, afmonter dit NFS-filsystem, når du er færdig med at sikkerhedskopiere det. I det mindste, giv ikke produktionssystemet privilegiet at overskrive eller ændre dine backupdata. Gør det skrivebeskyttet.

Nu hvor vi ved lidt om både RAID og backup, lad os fremhæve nogle forskelle mellem dem.

Filer og blokke

RAID er altid beskæftiget med datablokke, ikke hvordan filsystemet præsenterer disse data for brugeren. Både software og hardware RAID beskæftiger sig med data som informationsblokke, størrelsen af ​​blokke kan variere fra 128 KiB til 1 MiB.

På den anden side er sikkerhedskopier meget mere fleksible. De udføres normalt på filsystemniveau, selvom der ikke er nogen hård og hurtig regel for, at dette skal være tilfældet. De er også mere granulære. Du kan gendanne en enkelt fil fra din sikkerhedskopi, hvis din løsning er fleksibel nok. RAID-arrays er ikke sikkerhedskopier, de er bare en måde at sprede data på flere diske. Hvis en fil slettes, frigøres alle dens spejlvendte blokke og paritetsblokke. Sådan er det.

Brug sager

Sikkerhedskopier er for alle. Tilgang og omfang kan variere fra personlig brugssag til virksomhed, men alle med et digitalt liv har brug for backup. RAID er mere en forretnings- / virksomhedsspecifik funktion. Du ser RAID-arrays i servere, lagerenheder som NAS og SAN, cloud hypervisors osv. Næsten stort set ethvert sted, der gemmer live kritiske data, bruger en eller anden form for RAID. Selv de servere, der kører dine cloudhostede sikkerhedskopier, bruger sandsynligvis RAID-arrays. Disse er ikke gensidigt eksklusive teknologier.

Dette betyder ikke, at du ikke kan bruge RAID til din personlige brugssag, det har bare mere nytte i virksomhederne. En del af årsagen bag dette er, at i virksomheden bankes diske med IO-operationer 24/7. I produktionsmiljø, som lagring af en database eller videostreamingtjeneste eller en skyhypervisor, vil serverens lagerenhed være under konstant grusom belastning, data læses konstant fra og skrives til disse enheder og ofte af flere applikationer samtidigt. Under disse forhold er dine drev meget mere tilbøjelige til at mislykkes. At have en RAID-konfiguration betyder, at hvis et drev mislykkes, har du lidt eller ingen nedetid. De fleste servere kan fortsætte med at fungere, selv efter en diskfejl, så du ikke mister nye oplysninger og anmodninger, der kommer ind hvert sekund.

En gennemsnitlig stationær computer kan næppe genskabe den samme stressende tilstand, selvom disken dør. Hvis du bruger en sikkerhedskopiløsning som Backblaze, kan du hente det meste af dine mistede data, og det er sandsynligvis det værste at miste et par timers arbejde. kan ske. Selv dette bliver en sjældenhed takket være cloudhostede løsninger som Adobe Creative Cloud, Office 365 osv.

RAID er ikke en erstatning for Backup

Hvis der er en enkelt take away, du ønsker fra denne artikel, skal det være dette. RAID er IKKE en erstatning for Backup. Sikkerhedskopier altid dine data! Der er mange mennesker derude, der tror, ​​at hvis du har RAID, betyder det, at dataene er sikre på tværs af flere diske, og det er derfor ikke nødvendigt at tage backup af dem. Intet er længere væk fra sandheden. RAID er beregnet til at håndtere et enkelt specifikt problem - diskene fejler eller giver fejlagtige data tilbage. At have RAID beskytter dig ikke mod en million andre trusler som følgende:

  1. Brugerfejl og utilsigtet sletning
  2. Program- eller OS-fejl, der forårsager udbredt datakorruption
  3. Ransomware eller anden malware, der krypterer, sletter eller ødelægger dine data
  4. Fejl i RAID-controllere selv

Dataene på dit RAID-array er live. Hvis operativsystemet, et program (eller en bruger) skifter og sletter et par filer her og der, så slettes filen overalt i dit RAID-array. At have en separat kopi af dine data, en sikkerhedskopi, er den eneste måde, du nogensinde kan beskytte dig mod denne slags scenarie.

Konklusion

Hvis du er bekymret for dine data, skal din første bekymring være backup-løsning. De fleste desktopbrugere, undtagen måske strømbrugere, bør investere mere i en pålidelig sikkerhedskopi i stedet for at rode med RAID1, RAID5 eller RAIDZ. Hvis du vil opbygge din egen backup-server, skal du tænke på en anstændig sikkerhedskopipolitik og en pålidelig lagerbackend. Denne artikel er måske et godt sted at starte. Du kan bruge rsync eller zfs send til at tage periodekopi af dine data til denne backend.

Hvis du er i virksomheden og overvejer en RAID-løsning til at gemme alle dine live data. Overvej at bruge OpenZFS, det tilbyder en meget fleksibel løsning, alt fra n-disk spejling til RAIDZ1 med en paritetsblok til RAIDZ2 og RAIDZ3 med 2 og 3 paritetsblokke. Du skal overveje meget om din ansøgnings krav, inden du træffer en beslutning. Der er kompromiser mellem dine læse / skrive-forestillinger, modstandsdygtighed og effektivitet i opbevaring. Jeg vil dog anbefale, at du kun tænker på RAID, når du har besluttet en sikkerhedskopiløsning.

Vulkan til Linux-brugere
Med hver nye generation af grafikkort ser vi spiludviklere skubbe grænserne for grafisk troskab og komme et skridt tættere på fotorealisme. Men på tro...
OpenTTD vs Simutrans
Oprettelse af din egen transportsimulering kan være sjovt, afslappende og ekstremt lokkende. Derfor skal du sørge for at prøve så mange spil som mulig...
OpenTTD Tutorial
OpenTTD er et af de mest populære forretningssimuleringsspil derude. I dette spil skal du oprette en vidunderlig transportvirksomhed. Du starter dog i...