Home Data & Storage Voorkom het verzuipen van de CFO in een Data Lake

Voorkom het verzuipen van de CFO in een Data Lake

736
dainamics

Het begrip ‘Data Lake’ is een relatief nieuw concept in de wereld van Big Data. Het was tot voor kort zelfs niet te vinden op Wikipedia.

Laten we eens beginnen met een definitie van wat een Data Lake is:

Een Data Lake is een opslaglocatie waarin een grote hoeveelheid ruwe data in zijn oorspronkelijke format is opgeslagen. Inclusief gestructureerde, semi gestructureerde en ongestructureerde data. De datastructuur en hoe deze dient te worden ontsloten is niet bekend totdat de data ergens is benodigd.

Complex en kostbaar

Het aanleggen van een Data Lake is niet eenvoudig en goedkoop. Integendeel, het is complex om te bouwen en behoorlijk kostbaar.

Bij de uitleg van wat een Data Lake is begrijpt de CFO het woord repository best goed. Voor hem is dat synoniem geworden voor spenderen van serieus veel geld aan data-opslag oplossingen. Vrijwel zeker is dat hij ook op de hoogte is dat het daar niet bij blijft en er ook nog aan hardware, software, en consultancy geld zal moeten worden uitgegeven alvorens er ook maar een business antwoord uit de Data Lake is gefilterd.

Data Lakes hebben gezorgd voor een hype als de nieuwe en trendy storage technologie in het Big Data tijdperk. Meer data opslaan is altijd beter nietwaar? Maar deze hype heeft er ook voor gezorgd dat er minder aandacht is voor de beperkingen. Dat schrijft Dan Wood in 2016 in een Forbes artikel waarin hij kijkt naar de effectiviteit van Data Lakes vanuit een technisch perspectief. Daarnaast is er ook het kosten perspectief – gezien vanuit de CFO, want uiteindelijk daar komt het geld vandaan om een Data Lake aan te leggen.

Interne bankier

De primaire rol van de CFO is die van een interne bankier. Verkopen van de onderneming aan beleggers, onderhandelen van complexe financieringen bij banken en managen van cashflows zodat het besteedde geld het beste rendeert. CFO’s voorzien de organisatie van werk kapitaal.

Aan de andere kant is de rol van de CFO om geld aan het werk te zetten daar waar dit het beste resultaat geeft voor de organisatie. CFO’s zijn graag bereid geld te steken in projecten die geld opleveren. CFO’s gruwen van het spenderen van middelen die niets opleveren. Heb je ooit een blije CFO gezien die de huurfactuur betaalt voor een halfleeg gebouw, leaseauto’s op de parkeerplaats ziet staan die niet gebruikt worden, of ziet dat dataopslag-systemen een bezettingsgraad hebben van minder dan 50%?

Data lake als toverlamp

Last but not least: CFO’s geloven in harde feiten en cijfers, niet in de pitch dat het Data Lake de toverlamp van Aladin is waarin al uw vragen terstond beantwoord zullen worden.

Het is lastig om aan te geven wat de initiële kosten zijn voor het aanleggen van een Data Lake. Een Hortonworks bulletinboard beschrijft een advies waarin werd aangegeven dat de opstart kosten voor een 25TB Data Lake minimaal $150K. Het is aannemelijk dat de initiële kosten van een Data Lake van enige omvang minimaal $500K bedragen en dat is dan nog zonder de jaarlijkse onderhoudskosten.

En wat is de return van die investering zal de CFO u vragen wanneer u de investeringsvraag moet verantwoorden. Zonder duidelijke ROI, is het vragen voor budget om een Data Lake aan te leggen hetzelfde als het vragen om een gebouw voor 10 jaar te huren met betaling van de hele huurtermijn vooraf, zonder dat er nog is begonnen met het aannemen van personeel.

Initiatief

We gaan data van alle mogelijke bronnen opslaan op een centrale Data Lake infrastructuur, zonder vooraf te weten welke vragen we gaan stellen en welk opbrengsten we daarvan verwachten. Het lijkt erop dat we de data in ieder geval op die centrale plaats willen hebben voor het geval dat we die vraag gaan stellen?

Even tussendoor: wie is er eigenlijk met het initiatief gekomen om überhaupt een Data Lake aan te leggen, uw IT-leveranciers of adviseurs misschien?

Zeker business users hebben simpele vragen. Data moeten komen uit diverse interne en externe bronnen. Ze kunnen bovendien een enorme complexiteit teweeg brengen. Maar om op voorhand heel veel geld uit te geven aan een Data Lake, wordt lastig? Veel succes met het overtuigen van de CFO!

Vincent van der Linden, Managing Director Benelux bij Manstor

LAAT EEN REACTIE ACHTER

Please enter your comment!
Please enter your name here