Home Data & Storage Big data zorgt voor renaissance van tape

Big data zorgt voor renaissance van tape

82

“De IT-sector heeft behoefte aan visionairs, cathedral thinkers die net als architecten in de Middeleeuwen in staat zijn een kathedraal te ontwerpen terwijl ze weten dat ze de voltooiing zelf nooit zullen meemaken”, zo stelde trendwatcher Herman Konings in zijn keynote speech tijdens Storage Expo.be in Brussel.
Google en Phoneblocks geven volgens Konings het goede voorbeeld via Project ARA. Met deze modulaire opgebouwde smartphone kunnen gebruikers zelf de functionaliteit van de smartphone samenstellen. Gaat er een onderdeel kapot, zoals de camera of het schermpje, dan kun je het, net zoals een Legoblokje, simpel vervangen. Zo kan een smartphone in theorie meerdere generaties mee.

In de storagewereld is het Lineair Tape-Open Program-initiatief een mooi voorbeeld van visionair denken. Hoewel tape al meerdere keren is doodverklaard, is dit opslagmedium in werkelijkheid springlevend. De eerste IBM 726 Tape Unit werd geïntroduceerd op 21 mei 1952. Het filmpje uit de oude doos is pure nostalgie. De technologie heeft sindsdien echter niet stilgestaan.

Zo meldde dr. Mark A. Lantz, manager Exploratory Tape, Storage Technologies bij IBM Research Zurich, vorig jaar nog een grote doorbraak. Samen met ingenieurs van Fujifilm slaagde zijn team er in om in een proefopstelling 85,9 Gbit aan data op één vierkante inch tape op te slaan. Dat is maar liefst 62 keer meer dan de huidige opslagcapaciteit van de LTO-6-standaard. Dankzij deze doorbraak wordt het uiteindelijk mogelijk op een enkele LTO-cartridge tot 154 terabytes aan ongecomprimeerde data op te slaan, het equivalent van de tekst van 154 miljoen boeken.

Bedrijfsgegevens opslaan op tape, klinkt dat niet hopeloos ouderwets? Misschien. Toch zijn er volgens het LTO Program genoeg redenen om juist nu voor tape-storage te kiezen. Tape is met een prijs van 0,8 dollarcent per gigabyte de goedkoopste manier om gegevens op te slaan. Het Zwitserse CERN, dat verantwoordelijk is voor de ondergrondse deeltjesversneller, (de Large Hadron Collider) koos voor tape om de inmiddels meer dan 100 petabyte aan big data op te slaan. Het gaat in totaal om 52.000 verschillende tapes, die dankzij tape robots en het Linear Tape File System (LTFS), de broncode voor tape, direct toegankelijk en te raadplegen zijn.

Tape is niet alleen goedkoop, maar tevens milieuvriendelijk doordat het stroomverbruik minimaal is. Nieuwe generaties tape-storage zijn bovendien ‘backward compatible’. Er is echter ook een nadeel. Zo duurt het langer om data van een tape af te halen. Maar daar is volgens Oracle een mouw aan te passen. Zo bezit YouTube miljoenen video’s. Door een automatische instelling worden filmpjes die gedurende een bepaalde tijd niet bekeken zijn, verplaatst van snelle naar langzamere schijven of tape. In de paar seconden dat u de onvermijdelijke advertentie bekijkt, heeft YouTube alle tijd om de gewenste film uit de tape-omgeving op te halen. Dat noemen we Informatie Lifecycle Management (ILM). Het bedrijf slaat hiermee twee vliegen in één klap: het bespaart enerzijds op opslagkosten en anderzijds verdient het aan de advertenties.
ILM is gebaseerd op dataclassificatie. Een algoritme signaleert het verschil tussen actieve, minder actieve en inactieve data, en verplaatst deze zogenoemde hot, warm en cold data respectievelijk naar het meest efficiënte opslagmedium.

Ondanks al deze efficiency kan er, net als bij disks, ook met tapes altijd iets mis gaan. Tapes kunnen corrupt of fysiek beschadigd raken, waardoor data recovery noodzakelijk is. Lees de Risico top 7 en laat u niet verrassen. Schakel bij calamiteiten direct een expert in. Datarecoveryspecialisten hebben vaker met het bijltje gehakt. 99% van de data is meestal nog te herstellen, zelfs na een brand. Zo raakten bij een bedrijf 346 van de in totaal 5.128 tapes door waterschade aangetast doordat de sprinklerinstallatie aansprong. Alle data werd uiteindelijk veiliggesteld. Ook oude tapes zijn meestal nog uit te lezen. Wat te denken van het herstel van 6.000 mailboxen afkomstig van 40 legacy LTO-3 tapes?

Hoewel LTO-6 nu de norm is, is tape-technologie nog lang niet uitgekristalliseerd. Zo onthulde het inmiddels tot Ultrium omgedoopte LTO Program onlangs een roadmap die de weg vrij maakt voor minimaal vier nieuwe generaties tape-opslag. LTO-10 staat gepland voor 2023. Maximaal 120 terabyte aan opslag op één tape is geen overbodige luxe, want cloud providers zijn naarstig op zoek naar goedkope opslagalternatieven. In 2020 zullen we immers zo’n 40 zettabyte aan big data genereren. Data die bovendien snel doorzoekbaar moet zijn. Gartner voorspelt namelijk dat de markt voor enterprise e-discovery software zal groeien van 1.8 tot 3.1 miljard dollar in 2018. E-discovery is hot door toenemende cybercriminaliteit, wereldwijde audits en verscherpte anti-corruptie- en mededingingswetgeving. Elektronisch bewijsmateriaal bestaat niet meer alleen uit e-mails, documenten en voicemails, maar ook social media en mobiele data fungeren als bewijs. Bewijs dat vaak ergens verstopt op een tape is opgeslagen.

Met een beetje fantasie zou je de Ultrium LTO Roadmap als een kathedraal in aanbouw kunnen zien. In ieder geval hadden de drie initiatiefnemers van het LTO Program bij de oprichting in 1997 een visionaire blik. Mede dankzij de cathedral thinkers van het toenmalige Certance (thans Quantum), HP en IBM is tape springlevend.

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in