In een poging om de capaciteit te verhogen van een bestandsserver waar honderden gebruikers van afhangen, wilde Neil Smith, informaticaverantwoordelijke in de gezondheidssector, een extern blok van 14 harde schijven aansluiten op de uitgaande poort van zijn RAID-controller (waarvan al een SCSI-kanaal intern werd gebruikt voor een matrix van schijven die meervoudige kanalen omvatten). Helaas ging bij het aansluiten van het externe blok de originele RAID-configuratie verloren, goed voor meer dan 400.000 bestanden of ongeveer 250 GB aan verloren gegevens. De informatica-afdeling probeerde de configuratie te herstellen, maar nadat het proces een hele nacht zonder succes had gelopen, ontdekte men dat daardoor de oorspronkelijke matrix werd overschreven door een nieuwe matrix die alle schijven van de server en de 14 nieuwe schijven groepeerde.
Ontrack Data Recovery kon op afstand verbinden met het systeem en meer dan 99% van de ongeveer 400.000 bestanden recupereren uit de opnieuw geconfigureerde en overschreven RAID-matrix, maar dit verhaal illustreert een centrale paradox in de gegevensopslag: naarmate opslagsystemen complexer en geavanceerder worden, komen defecten in hardware, software en operatoren vaker voor. Het is zelfs zo dat, alle geboekte vooruitgang in de opslagtechnologie ten spijt, amper een 20% (volgens Enterprise Strategy Group) van de back-upprocessen slaagt.
Elk jaar worden honderden nieuwe producten en technologieën voor gegevensopslag op de markt gebracht, waarmee alles makkelijker en sneller zou moeten gaan. Gezien de veelheid aan categorieën en opties om te overwegen, zaait de complexiteit van opslagtechnologie eerder verwarring, wat uiteindelijk zorgt voor tijdverlies én gegevensverlies, precies wat de geboekte vooruitgang had moeten vermijden.
Vandaar de eeuwige vraag van de meeste informaticadeskundigen die honderdduizenden dollars hebben geïnvesteerd in de laatste snufjes op het gebied van opslagtechnologie: “Hoe kan gegevensverlies nu nog voorvallen en wat kan ik doen?”.
In een perfecte wereld zou een onderneming haar opslaginfrastructuur van nul opbouwen met behulp van een van de nieuwe technologieën en zich standaard beperken tot een selecte groep leveranciers of opties. Alles zou onveranderd blijven, met ongelofelijk hoge en robuuste prestaties tot gevolg.
In de echte wereld is opslag echter een echte hersenbreker. Niets blijft onveranderd: nieuwe gegevens worden onophoudelijk bijgevoegd, terwijl nieuwe regels (zoals de Amerikaanse Sarbanes-Oxleywet of de beperkingen van de Franse Commission nationale de l’informatique et des libertés, ofwel CNIL) veranderingen opleggen aan de procedure voor gegevensbewaring. Ondernemingen vinden vaak geen rechtvaardiging om vanaf nul te herbeginnen, dus voegen ze meestal stukje bij beetje opslagcapaciteit toe, waarbij ze nieuwe elementen van verschillende leveranciers op verschillende momenten aanbrengen, vandaar dat opslagsystemen zo complex zijn.
Door deze complexiteit kunnen verschillende back-ups op rij mislukken en dat overvalt onvoorbereide bedrijven die niet klaar zijn om met de consequenties van gegevensverlies om te gaan. Een van de oorzaken van mislukte back-ups ligt bij ongeschikte dragers. Als een onderneming haar reservekopieën op tape jarenlang op een hoopje in een kast laat liggen, gaat de kwaliteit ervan achteruit en kunnen ze onleesbaar worden. Het gebeurt zelfs geregeld dat reservekopieën op tape niet correct worden bewaard. Een andere oorzaak van mislukte back-ups is dat ondernemingen op den duur niet meer weten met welke software ze werden gemaakt. De meeste software vereist nu net dat de exacte omgeving altijd beschikbaar is opdat een back-upsessie zou slagen. Ten slotte mislukken back-ups ook omdat het back-upproces wordt gewijzigd. Vaak wijzigen ondernemingen de omvang van hun gegevens, maar de back-upprocedure verandert niet mee, waardoor ze niet eens bewaren wat ze denken te bewaren. Zonder regelmatige controles kunnen back-ups wegens bovenstaande oorzaken dus mislukken.
Welke maatregelen een bedrijf ook neemt om zijn werkzaamheden te versnellen en zich te wapenen tegen problemen met nieuwe producten en technologieën, de dreiging van gegevensverlies blijft bestaan en de back-up- en opslagtechnieken kunnen lang niet altijd het nodige herstel bewerkstelligen. Als één uur onderbreking van de activiteit een verlies van vele miljoenen dollars kan betekenen, is het essentieel om data recovery in uw globaal herstelplan op te nemen. Het kan de enige manier zijn om snel en efficiënt uw activiteit te hervatten. Als gegevensverlies zich voordoet, is tijd de allerbelangrijkste factor. Beslissingen omtrent een zorgvuldig opgesteld actieplan moeten snel worden genomen, dus moeten systeembeheerders begrijpen wanneer ze de gegevens moeten herstellen, ophalen uit een back-up of recupereren.
Het volstaat om in eerste instantie hulpprogramma’s voor data recovery (zoals fsck of CHKDSK) te laten lopen in leesmodus, vermits het uitvoeren van het werkelijke herstel op een systeem met verscheidene fouten de gegevens kan overschrijven en het probleem nog erger kan maken. Programma’s voor data recovery proberen de verbroken verbindingen in het bestandssysteem te herstellen op basis van een heel specifieke kennis van hoe dat bestandssysteem er zou moeten uitzien. Afhankelijk van de resultaten van de diagnostiek in leesmodus kan de systeembeheerder een weloverwogen keuze maken tussen herstellen en recupereren. Als de diagnostiek wijst op vrij weinig fouten is het wellicht beter ze te corrigeren, want het herstelprogramma zal dan goede resultaten neerzetten.
Let wel, als uw harde schijf op een gegeven moment rare geluiden maakt, kiest u er beter meteen voor om de gegevens te recupereren.
De eerste vraag die een systeembeheerder zich moet stellen, is van wanneer de laatste back-up dateert en of de situatie door het herstel van die back-up wordt teruggezet naar een aanvaardbaar punt om de normale activiteit voort te zetten. Er is een wezenlijk verschil tussen de gegevens van de laatste back-up en de gegevens op het moment van het defect, dus is het belangrijk om van bij het begin het onderscheid te maken. Enkel recuperatie kan helpen als de cruciale gegevens nooit zijn opgenomen in een back-up. Een andere belangrijke vraag is hoe lang het ophalen van de back-up zal duren. Als dat te lang zou duren, moet de systeembeheerder mogelijk andere opties overwegen. De laatste factor om in overweging te nemen is de hoeveelheid gegevens die moet worden teruggeplaatst. Meerdere terabytes aan gegevens terugplaatsen vanaf magneetbanden neemt bijvoorbeeld veel tijd in beslag.
De beslissing om gegevens te recupereren hangt af van hoe cruciaal het gegevensverlies is en hoe lang de onderneming zich een onderbreking van de activiteit kan veroorloven. Als het bedrijf onvoldoende tijd heeft om het proces voor het terugplaatsen van een back-up te plannen, is het wellicht beter om voor recuperatie te kiezen. Recupereren is tevens het beste alternatief als de reservekopieën te oud blijken of als er kwaliteitsverlies is opgetreden. De kern van de zaak is: als andere opties geprobeerd en mislukt zijn, kunt u maar beter meteen een firma inschakelen die gespecialiseerd is in het recupereren van gegevens, zoals Ontrack. Sommige systeembeheerders proberen eerst meerdere keren gegevens te herstellen of een back-up terug te plaatsen voor ze de gegevens proberen te recupereren, en berokkenen zo nog meer schade aan de gegevens.
Door een reeks nauw met elkaar verbonden onderhoudsactiviteiten verloor Wolters Kluwer Corporate Legal Services (voordien CCH Legal Information Services) de toegang tot gegevens opgeslagen op de NAS-matrix van het bedrijf. Nadat men contact had opgenomen met de fabrikant, zag het bedrijf meteen in dat het gegevensverlies veel ernstiger was dan eerst werd aangenomen. Vanwege onder andere netwerkbeperkingen beschikte het bedrijf niet over reservekopieën van de gegevens. Na voorafgaande discussies stuurde de fabrikant het opslagsysteem naar Ontrack, en na amper twee dagen waren de gegevens van het bedrijf voor 100% gerecupereerd.
Ondanks de beste praktijken van dat bedrijf en het uwe, mag één zaak duidelijk zijn: hoeveel tijd en geld een onderneming ook moge spenderen aan het plannen, opzetten en onderhouden van haar opslaginfrastructuur, door de complexiteit van opslag blijft de dreiging van gegevensverlies reëel. Uiteindelijk is het enige antwoord op de vraag “Hoe kan gegevensverlies nu nog voorvallen en wat kan ik doen?” dat het recupereren van gegevens absoluut niet mag ontbreken in uw plan.