Anonim

Det begyndte på en lørdag aften med min kone, der spurgte, hvorfor vores DVR pludselig holdt op med at spille et show, hun så på. Jeg sagde til hende, at det sandsynligvis kun var en eller anden fejl, men jeg kiggede. Jeg går ind i familieværelset for at se, og fejlen sagde dybest set, at den underliggende disk ikke længere var tilgængelig. Ikke godt! Dette var starten på min tre dages horrorhistorie …

En lille baggrund

Min DVR er faktisk kun specialiseret software (SageTV til dem, der er nysgerrige), der kører på en pc. Softwaren er meget fleksibel og giver dig mulighed for at adskille alle de forskellige aspekter af det. Jeg har en separat maskine til centraliseret kontrol, planlægning og optagelse, separate maskiner til afspilning og stjernen i denne historie, en separat maskine til opbevaring. Til opbevaring bruger jeg en Linux-filserver, der bruger LVM (Logical Volume Manager) til at samle mange separate, ikke-identiske drev i et stort (~ 6TB i øjeblikket) logisk drev, som operativsystemet ser. Da sikkerhedskopiering af flere TB af data er upraktisk, og da disse data er "bare" tv-shows, har min backup-filosofi for dette altid været at bare ikke pleje. Indtil for nylig begivenheder var denne filosofi ikke blevet testet af en begivenhed i den virkelige verden.

Forsøg på at gendanne dataene

Da jeg ser fejlen på DVR, begynder jeg straks at se på lagringsserveren. Filsystemet er utroligt tragt og langsomt at reagere, så jeg spørger LVM om tilstanden til de fysiske drev, der ligger til grund for dets logiske volumen. Efter en lang forsinkelse kommer det op og siger, at et drev på 750 GB mangler. Åh åh! Jeg genstarter serveren og utroligt, drevet kommer tilbage. Jeg udsteder en pvmove-kommando for automatisk at migrere alle data fra det drev, men det mislykkes med mindre end 2% komplet.

Konfronteret med et drev, der er meget samarbejdsvillig med hensyn til at læse sine data, men som i det mindste dukker op i BIOS, vender jeg mig til mit foretrukne drevgendannelsesværktøj, Spinrite. Selvom Spinrite normalt starter fra flytbare medier, satte jeg for mange år siden netværksstart i mit hus til forskellige værktøjer, så jeg ikke behøvede at bekymre mig om at holde styr på noget medie. Normalt opretter jeg bare forbindelse til mit netværk, vælger boot fra netværk, og jeg har en række forskellige værktøjer til rådighed til at løse mange problemer. Problemet er maskinen, der gør alt dette magiske arbejde er den samme maskine, der i øjeblikket er nede. Ingen big deal jeg siger, jeg vil bare starte fra en Spinrite CD. Bortset fra for et par år siden opgav det optiske drev på min filserver spøgelset. På det tidspunkt, der skete, besluttede jeg, da jeg aldrig brugte optiske medier i den maskine, jeg behøvede ikke at udskifte den. Ingen bekymring, sagde jeg, jeg tager bare det optiske drev ud af min hovedcomputer. Jeg slukker for min hovedcomputer og tager det optiske drev ud. Så kigger jeg efter min Spinrite-start-CD. Kan ikke finde det! Vi flyttede ind i et nyt hus for et par måneder siden, så alt er i lidt uorden. Jeg regner med, at jeg bare brænder en ny kopi, men jeg kan ikke engang finde noget tomt optisk medie! På den næste plan, et startbart flashdrev! Efter et par minutter på Google for at opdatere min hukommelse har jeg et opstartsbart Spinrite-flashdrev. Jeg starter min Linux-boks fra det og starter Spinrite. Computeren fryser op og ser ud til at gå ned. For at eliminere variabler flytter jeg det dårlige drev fra at blive tilsluttet et PCI-e-udvidelseskort til at blive direkte tilsluttet bundkortet. Nu starter Spinrite fint, men det tager aldre og aldre at opregne de drev, der er forbundet til det. Jeg frakobler systematisk alle andre drev undtagen det dårlige, men det afslutter aldrig at tælle drev uanset hvor længe jeg venter. På den næste plan! Jeg tager drevet ud af min Linux-boks, forbinder det til min hovedcomputer og starter fra mit skinnende nye Spinrite-flashdrev. Spinrite lancerer og ser drevet med det samme, og jeg fortæller det at begynde at gendanne data, tilfreds med at jeg endelig gør nogle fremskridt. Jeg går tilbage for at kontrollere det efter måske 10 minutter, og der er en fejl på skærmen, og det ser ud til, at drevet igen er forsvundet. Frustreret prøver jeg et par gange mere og beder Spinrite om at starte i forskellige dele af drevet, men får det samme resultat hver gang. Det ser ud til, at dette ikke kommer til at hjælpe mig.

I et pas på irrationelt håb satte jeg drevet tilbage i min Linux-boks og tænder for det. Til min forbløffelse vises drevet, og LVM bringer alt aktivt. Yderligere prøver jeg min held, jeg udsender en anden pvmove-kommando for at prøve at flytte dataene fra drevet igen. Tidligt ser jeg fejlmeddelelser om ikke at kunne læse fra drevet, men forbløffende fortsætter pvmove med at gøre fremskridt, ved at komme nærmere og tættere på 100% afsluttet. En blanding af forvirring, lettelse og spænding vasker over mig. Skal jeg slippe væk fra dette uskadt? Desværre er den sidste ting LVM gør under dækslerne for at afslutte en pvmove rent at skrive en opdateret log til alle drev, der er under dens kontrol. Dette mislykkes naturligvis, når det prøver at skrive til det dårlige drev, og det aborterer derfor hele processen. Nederlag rykkede fra sejrenes kæber igen! Jeg dykker tilbage i Google og opdager, at det er muligt at kontrollere, hvor meget data kommandoen pvmove flytter i stedet for at flytte ALLE data i et skud. Jeg eksperimenterer med dette og har en succes med at flytte en lille del af mine data ad gangen. Jeg bliver grådig, og drevet forsvinder et par gange, men kommer altid tilbage efter en strømcyklus på computeren. Teoretiserende om, at det måske kun er visse dele af drevet, der er dårlige, begynder jeg at springe rundt i stedet for at arbejde på starten af ​​drevet. Efter et par iterationer af dette har jeg alle undtagen 40 GB ud af 750 GB sikkert flyttet fra drevet. I de resterende 40 GB lykkedes det ikke at flytte uanset hvad jeg prøvede. Det var nu søndag aften, og jeg var udmattet, så jeg besluttede at gå i seng og tackle dette problem mere næste dag.

Dagen efter, efter lidt søvn og den første halvdel af min dag på arbejdspladsen, beslutter jeg at bare bide kuglen, fordi jeg ikke var interesseret i de sidste 40 GB indspillede tv-shows, og satte i gang med at fjerne drevet fra min LVM-konfiguration . Jeg har gjort dette mange gange før, så det går ganske problemfrit. Næste på oprydningslisten er reparation af hullet i midten af ​​filsystemet. Jeg regner med kun 40 GB i stedet for 750 GB mangler det kan ikke være så slemt, ikke? Forkert! Efter reparationen havde jeg 900 GB ekstra ledig plads sammenlignet med før begyndelsen af ​​prøvelsen, så det stakkede ganske lidt. Nå, jeg siger det selv, det var bare tv alligevel. Min DVR er endelig funktionel igen efter sin tre dages hiatus, og jeg kan til sidst stoppe med at tænke over dette med hver ekstra hjernecyklus.

Erfaringer

Så hvad lærte jeg af alt dette? Jeg burde have gjort et bedre stykke arbejde med det, der virkelig betyder noget. Dette skete for et par uger siden, og i den tid har jeg ikke engang gået glip af noget af tv-indholdet, der forsvandt. Jeg beklager dog, at jeg ikke har brugt tv'et i tre dage og for at sætte mig i krisetilstand i disse tre dage, men ikke mindst min familie. Hvis jeg havde givet op med at gendanne mine data i begyndelsen, ville funktionen være gendannet på cirka en time, ikke tre dage. Jeg ved alt for godt, at vores data for det meste er dyrebare, men i denne situation var det ikke.

For det andet, hvis dine data virkelig er dyrebare, og 99% af tiden det virkelig er, skal du beskytte dem! Sikkerhedskopier dine data, der er ingen undskyldninger. For mine data, der er uerstattelige, ligesom tusinder af billeder af min søn, jeg har på min computer, sørger jeg for at sikkerhedskopiere dem på ikke mindre end tre steder, hvoraf den ene er en cloud-backupudbyder. Hvad angår DVR-opbevaring, synes jeg stadig ikke, det er praktisk at sikkerhedskopiere det til skyen, men med prisen på drev i disse dage har jeg ingen undskyldning for ikke at have det beskyttet af RAID, og ​​det er lige hvad jeg er vil gøre. Da jeg først oprettede min lagringsklynge for år siden, tror jeg, det tog mig 10 drev eller mere for at komme til en pulje med flere TB. Jeg har lige tjekket priserne, og du kan købe et 3 TB drev nu for godt under $ 100. Jeg har simpelthen ingen undskyldning for at forlade mine data ubeskyttet, og hvis et datatab som dette sker for mig igen, er det virkelig min egen skyld.

En fortælling om tristhed, frustration og datatab