Home Data & Storage Big Data – so what?

Big Data – so what?

58
dainamics

En ja hoor, we zijn er weer. Nu heet de hype big data. Hoe weten we dan, dat het een hype is? Simpel: iedereen heeft het er over, maar niemand weet eigenlijk waar het over gaat.

Want was is big data nou? Grote bestanden zoals een continue video stream van een hartoperatie die minimaal zeven jaar opgeslagen moet worden? Of gaat het juist om heel veel kleine bestanden zoals patiëntgegevens die tezamen veel opslagruimte nodig hebben? Denk hierbij aan een Oracle- of SQL-database met een enorm aantal records. Een ding mogen we echter wel constateren: wij krijgen een stortvloed aan data over ons heen dus in die zin hebben ze allemaal gelijk. Data is big.

Ik denk niet dat de uitdaging voor de IT-manager in de hardware ligt. Schijven blijken nog steeds exponentieel in opslagcapaciteit te groeien en nieuwe opslagtechnieken zijn volop in ontwikkeling. Waar de IT-manager zich echter wel zorgen om moet maken is hoe hij deze data allemaal moet gaan beheren.

Van primair belang voor de gebruikers en applicaties is de snelheid van datatransport, dus moet er rekening gehouden worden met het aantal spindles en de IO’s. Grotere schijven betekend minder IO’s dus is het misschien helemaal niet interessant om de allergrootste schijven te kopen. Ook is het helemaal niet interessant om deduplicatietechnieken op deze data toe te passen. Maar waar wel naar gekeken kan worden is tiering. Hierbij worden verschillende technologieën ingezet om data optimaal op te slaan en beschikbaar te stellen. Tiering kan weer met deduplicatietechnieken gebruikt worden om de totale dataopslag te verminderen.

Deduplicatie kan ook gebruikt worden om problemen met de backup-window te voorkomen. Omdat steeds meer bedrijven 7×24 operationeel zijn, heeft de IT-manager steeds minder mogelijkheden om backups te draaien. Wat de situatie nog nijpender maakt is dat, zoals al eerder aangegeven, de hoeveelheid data onevenredig groeit waardoor er meer data in minder tijd ge-backuped moet worden. Door eerst de data te dedupliceren en te archiveren komt men al vaak een heel eind in de richting van de gestelde patstelling.

Maar ja, nu heeft men een heel mooi SAN/NAS staan, al dan niet redundant uitgevoerd, deduplicatie en archivering toegepast … en dan komt de vraag “hoe kan ik garanderen dat de data wel door de juiste personen gebruikt c.q.  gevonden kan worden?” Zijn mijn AD-rechten wel op de juiste manier doorgevoerd? Moet ik de data afschermen indien gebruikers van buitenaf inloggen? Welke data mogen ze wel en niet inzien Dat houdt in dat er security policies opgezet moeten worden, want de data is tenslotte de basis voor het concurrentievermogen van de organisatie.

Ik heb altijd een principe over data gehad: data wordt pas informatie als je er wat mee doet. Dat geldt ook voor uw organisatie. Maar weten de juiste gebruikers de data wel te vinden? En wie heeft het meeste belang bij data die her en der opgeslagen staat? Leuke topic voor mijn volgende blog.

Edwin Brok, International Sales Development – Storage bij Bull

LAAT EEN REACTIE ACHTER

Please enter your comment!
Please enter your name here