Backup vs Raid

Backup vs Raid
Sikkerhetskopiering er en avgjørende del av vårt digitale liv. Hver datamaskin fra gigantiske databaser til en enkelt personlig datamaskin eller mobilenhet trenger en sikkerhetskopi. Et sted der de mest relevante brukerdataene kan lagres i lang tid og også lagres på en slik måte at det kan gjenvinnes i behovstidspunktet. Vi kan trekke et skille mellom dataene om vårt kjøresystem for øyeblikket, la oss kalle det live data, og støttet opp data. Sistnevnte blir lagret bort fra det nåværende systemet som bruker live data.

Raid, bekymrer seg for live -data, det er en mekanisme som et kjøresystem kombinerer flere disker til en enkelt lagringsenhet. Dataene er deretter spredt over alle diskene på en slik måte at de kan overleve svikt i minst en (eller flere) av de fysiske diskene. Den enkleste typen RAID -matrise er RAID1, eller speiling. Det er her du kopierer (eller speiler) de samme dataene på to eller flere disker slik at hvis en av diskene mislykkes, kan dataene fremdeles overleve og fremdeles brukes aktivt. Det er andre raidkonfigurasjoner også, og vi vil diskutere de som vi går sammen.

Om raid

Raid, eller overflødig rekke rimelige disker, er en mekanisme for å lagre data på tvers av disker. Det er et bredt "utvalg" av RAID -oppsett som du kan gå med, men de to grunnleggende mekanismene som de alle er basert på er følgende:

1. Speiling:

Speiling innebærer at datablokkene dine er kopiert, speilet, over flere disker. Hvis du speiler dataene dine over tre disker, kan du overleve opptil to disks mislykkes til enhver tid, de mislykkede diskene kan da byttes ut med nye uten mye problemer. Tilsvarende, hvis du kopierer data på tvers av n+1 disker, du tåler opp til n disker mislykkes. Ulempen med dette er at du bare får lagringskapasiteten lik den minste disken i raid -arrayen din.

2. Paritet:

En annen tilnærming er å dele opp dataene dine i to deler, ved å bruke de to blokkene med brukerdata kan du opprette en tredje 'paritet' -blokk. De tre blokkene er i samme størrelse og er spredt over forskjellige enheter. Minimum tre enheter er nødvendig for at denne konfigurasjonen skal fungere. Hvis noen av diskene mislykkes, kan du gjenskape blokkene som er lagret på den disken ved å bruke de to andre blokkene. For eksempel, hvis den andre brukerblokken går tapt, kan den første blokken og paritetsblokken brukes til å beregne den andre brukerblokken. Hvis du er interessert i hvordan dette fungerer, sjekk ut denne fantastiske forklaringen.

Denne metoden kan forbedres ytterligere for å ha 2 eller til og med 3 paritetsblokker. Men mer enn 3 paritetsblokker blir ikke sett i bransjen som ofte. Hvis du har en paritetsblokk, kan du overleve en diskfeil. To paritetsblokk betyr at du tåler to disker som svikter og så videre.

Det er mer effektivt når det gjelder lagringsutnyttelse, enn speiling. Hvis du har en paritetsblokk, trenger du bare 50% mer fysisk lagring per faktiske brukerdata som du lagrer. Dette betyr å lagre 1 GB data du trenger 1.5 GB lagring (pluss at det er en liten overhead for metadataene). Dette er langt mer effektivt enn selv det mest effektive speilingsskjemaet der du trenger minst 2 GB lagring for å speile 1 GB data mellom to disker.

Ulempen er at tilfeldige skriveoperasjoner kommer til å bli bremset, takket være den ekstra biten av beregning og skriveoperasjon knyttet til paritetsblokken. Også påliteligheten er ikke så god som en n+1 speilede disker der du kan forberede deg på ethvert vilkårlig antall disker som svikter.

RAID -konfigurasjoner kan være så komplekse eller så enkle som du liker at de skal være, du kan kombinere pariteten og speilingsstrategiene og endre dem til bedriftenes smak. Det er dedikerte raidkontrollere som du kobler sammen dine fysiske disker til, og OS ser deretter en enkelt logisk disk som vist av kontrolleren. LSI er en slik leverandør av RAID -kontrollere. Du kan også utføre raid i programvaren OpenZFS er sannsynligvis det beste alternativet du har på den forbindelse.

En siste type raid, som får en hederlig omtale er raid 0. Teknisk sett er det ikke et raidordning, fordi det ikke er noen redundans involvert her. Ideen bak Raid 0 er å bare spre dataene dine over flere lagringsenheter uten noen Motstandskraft mot diskfeil. Fordelen er at du får ytelsesforbedringer ved å gjøre dette. Hvis du skriver 1 GB data til en enkelt disk, er prosessen treg. Disken kan bare gjøre et begrenset antall skriveoperasjoner per sekund, og operativsystemet ditt må vente på at den skal fullføre den operasjonen før nye data blir sendt veien. Hvis du sprer den samme 1 GB data på tvers av to slike disker, kan du skrive (og lese) fra dem begge samtidig og få ganske mye ytelsesforbedring.

Sikkerhetskopiering

Konseptet med sikkerhetskopiering kan diskuteres viktigere enn RAID. En sikkerhetskopi, i sammenheng med lagringsadministrasjon, er en kjent god kopi av data, fra et gitt tidspunkt, hvorfra du kan gjenopprette filer tilbake i hovedsystemet ditt når det er nødvendig. Når det.

Tarsnap og Backblaze er mine favorittadministrerte sikkerhetskopitjenester for både private og forretningsbrukssaker. Du kan også inkludere Google Drive, iCloud eller Dropbox i denne definisjonen av en Sikkerhetskopi Løsning, men de er mer rettet mot forbrukermarkedet enn bedriften. Imidlertid er det underliggende prinsippet fortsatt det samme. Når du logger deg på en ny iPhone eller iPad alle dataene, blir kontaktene, bildene, mediebiblioteket osv. Jeg må bekymre deg for det.

Backup -løsningen din kan være så enkel som å kopiere data til en ekstern harddisk eller for å bruke RSYNC (eller ZFS Send, hvis du bruker OpenZFS) for å periodisk generere en kopi av all relevant informasjon. Dette kan omfatte dokumenter -mappen din, databasen din, kildeselskapet eller til og med hele rotfilsystemet ditt som er splatt inn i en flat glidelås eller en tarball. De viktige kriteriene som en god sikkerhetskopiløsning skal oppfylle er følgende:

  1. Sikkerhetskopiering bør forekomme ofte - hvis du sikkerhetskopierer data hver måned, i stedet for hver uke, risikerer du å miste opptil en måneds data som er verdt når katastrofen rammer.
  2. Sikkerhetskopiene dine skal gå tilbake i tid - sikkerhetskopieringen er begrenset. Noen ganger må du kaste eldre sikkerhetskopier. Jo mer lagring du har, jo bedre kan sikkerhetskopiene dine være. Anta at du tar sikkerhetskopi av dataene dine ukentlig, men kast bort sikkerhetskopiering eldre enn 2 uker. Hvis en fil blir slettet ved et uhell, og dette går upåaktet i to uker, vil du ikke ha en måte å bringe den tilbake.
  3. Filene dine skal faktisk være gjenopprettbare - hvis du aldri har prøvd å gjenopprette dataene dine fra sikkerhetskopien, har du ikke en sikkerhetskopi. Du trenger ikke å lære å gjenopprette data, på det kritiske tidspunktet da du fikk et tap av data. Planlegg fremover og vet hvordan du gjenoppretter systemet fra den siste kjente gode sikkerhetskopien.
  4. Sikkerhetskopien din skal segregeres fra kjøresystemet - når katastrofen rammer, og alle filene dine på produksjonsserveren blir kryptert, slettet eller ødelagt, må du sørge for at det samme ikke skjer med sikkerhetskopien din. En god måte å sikre at dette er for å sørge for at sikkerhetskopieringsenheten ikke er "koblet" til produksjonsmiljøet ditt, i.E, koble ut USB -harddisken, men ikke monter NFS -filsystemet når du er ferdig med å støtte den. I det minste, ikke gi produksjonssystemet privilegiet å overskrive eller endre sikkerhetskopieringsdataene dine. Gjør det skrivebeskyttet.

Nå som vi vet litt om både raid og sikkerhetskopi, la oss fremheve noen forskjeller mellom dem.

Filer og blokker

RAID er alltid opptatt av datablokker, ikke hvordan filsystemet presenterer disse dataene til brukeren. Både programvare og maskinvareangrep omhandler data som informasjonsblokker, størrelsen på blokker kan variere fra 128 KIB til 1 MIB.

Sikkerhetskopiering derimot er mye mer fleksible. De utføres vanligvis på filsystemnivå, selv om det ikke er noen hard og rask regel for at dette skal være tilfelle. De er også mer granulære. Du kan gjenopprette en enkelt fil fra sikkerhetskopien din, hvis løsningen din er fleksibel nok. Raid -matriser er ikke sikkerhetskopier, de er bare en måte å spre data på flere disker. Hvis en fil blir slettet, frigjøres alle speilede blokker og paritetsblokker. Slutt på historien.

Bruk saker

Sikkerhetskopier er for alle. Tilnærmingen og omfanget kan variere fra saken til personlig bruk til bedrifter, men alle med et digitalt liv trenger sikkerhetskopi. Raid er mer en virksomhets-/bedriftsspesifikk funksjon. Du ser RAID -matriser i servere, lagringsenheter som NAS og SANS, skyhypervisorer osv. Stort sett alle steder som lagrer live kritiske data bruker en form for raid. Til og med serverne som kjører skyen som er vert for sikkerhetskopiering, bruker sannsynligvis RAID -matriser. Dette er ikke gjensidig utelukkende teknologier.

Dette betyr ikke at du ikke kan bruke RAID for din personlige brukssak, det har bare mer nytte i bedriftene. En del av grunnen bak dette er at i bedriften blir disker banket med IO -operasjoner 24/7. I produksjonsmiljø, som lagring av en database eller videostreamingtjeneste eller en skyhypervisor, vil lagringsenheten til serveren din under konstant grusom belastning, data blir stadig lest fra og skrevet til disse enhetene og ofte av flere applikasjoner samtidig. Under disse forholdene er det mye mer sannsynlig at drivkraften din mislykkes. Å ha en raidkonfigurasjon betyr hvis en stasjon mislykkes, lider du liten eller ingen driftsstans. De fleste servere kan fortsette å fungere selv etter en diskfeil, slik at du ikke mister ny informasjon og forespørsler som kommer inn hvert sekund.

En gjennomsnittlig stasjonær datamaskin kan knapt gjenskape den samme stressende tilstanden, selv om disken dør, hvis du bruker en sikkerhetskopiløsning som Backblaze, kan du hente de fleste av tapte data og miste noen timers arbeid er sannsynligvis det verste som kan skje. Selv dette blir en sjeldenhet takket være Cloud Hosted Solutions som Adobe Creative Cloud, Office 365, etc.

Raid er ikke en erstatning for sikkerhetskopi

Hvis det er en enkelt fjerning du vil ha fra denne artikkelen, bør det være dette. Raid er ikke en erstatning for sikkerhetskopi. Alltid støtte dataene dine opp! Det er mange mennesker der ute som tror at hvis du har raid, betyr det at dataene er trygge på flere disker, og det er ikke nødvendig å sikkerhetskopiere dem. Ingenting er lenger fra sannheten. Raid er ment å håndtere et enkelt spesifikt problem - diskene som mislykkes eller gir tilbake feilaktige data. Å ha raid vil ikke beskytte deg mot en million andre trusler som følgende:

  1. Brukerfeil og utilsiktet sletting
  2. Applikasjon eller OS -feil som forårsaker utbredt datakorrupsjon
  3. Ransomware eller annen skadelig programvare som krypterer, sletter eller ødelegger dataene dine
  4. Svikt i raidkontrollere selv

Dataene om raid -matrisen din er live. Hvis operativsystemet, en applikasjon (eller en bruker) går høydyr og sletter noen få filer her og der, blir filen slettet over hele RAID -arrayet. Å ha en separat kopi av dataene dine, en sikkerhetskopi, er den eneste måten du noen gang kan beskytte deg mot denne typen scenarier.

Konklusjon

Hvis du er bekymret for dataene dine, bør din første bekymring være sikkerhetskopiløsning. De fleste stasjonære brukere, bortsett fra kanskje strømbrukere, bør investere mer i en pålitelig sikkerhetskopi i stedet for å fikle med RAID1, RAID5 eller RAIDZ. Hvis du vil bygge din egen backup -server, må du tenke på en anstendig sikkerhetskopi og en pålitelig lagringsbackend. Denne artikkelen er kanskje et bra sted å starte. Du kan bruke Rsync eller ZFS Send for å ta periodekopi av dataene dine til denne backend.

Hvis du er i bedriften, og vurderer en RAID -løsning for å lagre alle live -dataene dine. Vurder å bruke OpenZFS, det tilbyr en veldig fleksibel løsning, alt fra n-diskspeiling til RAIDZ1 med en paritetsblokk til RAIDZ2 og RAIDZ3 med 2 og 3 paritetsblokker. Du må vurdere mye om kravene til søknaden din før du tar en beslutning. Det er avveininger mellom dine leseforestillinger, spenst og lagringseffektivitet. Imidlertid vil jeg anbefale at du bare bør tenke på raid etter at du har bestemt deg for en sikkerhetskopiløsning.