Home Data & Storage Werken met data? Gebruik je gezonde verstand!

Werken met data? Gebruik je gezonde verstand!

153

Het internet heeft een enorme omvang. Iedere twee jaar verdubbelt de hoeveelheid data die het internet omvat en op dit moment is er online volgens de laatste schatting maar liefst 13 miljoen petabyte (1015bytes) aan data te vinden. Deze databerg levert ons een enorme rijkdom. Naslagwerken als encyclopedieën, atlassen en woordenboeken hebben allemaal een online alternatief. Informatie is vindbaar, goed doorzoekbaar en bereikbaar met een simpele muisklik. Maar juist dat gemak kan ervoor zorgen dat we vergeten kritisch te kijken naar waar gegevens vandaan komen.

Kennisoverdracht

Tijdens mijn studie had ik in mijn boekenkast een indrukwekkend aantal strekkende meters gereserveerd voor studieboeken, naslagwerken, collegedictaten en papieren essays. De kennis die ik tot mij nam was voor een groot deel afkomstig van papier. Of op mij overgedragen tijdens een college. Hoewel je bij informatie van de docent nog altijd kunt twijfelen aan de herkomst, geven lesboeken vaak duidelijk aan waar informatie vandaan komt en welke bronnen er zijn gebruikt. Tegenwoordig wordt studeren steeds papierlozer. Boeken worden niet gekocht, omdat ze nauwelijks gebruikt worden en informatie wordt digitaal door docenten met studenten gedeeld. Hoe beoordeel je de betrouwbaarheid van de beschikbare informatie als je niet direct kunt achterhalen waar deze vandaan komt? Daar zijn natuurlijk heel veel verschillende manieren voor. Vergelijk gegevens van verschillende bronnen met elkaar en zoek naar verschillen, vraag het na bij een expert. Of doe een achtergrondcheck naar de website en/of de auteur. De belangrijkste eerste stap is echter: ‘gebruik je gezonde verstand’. En gebruik dat verstand dan om de volgende afwegingen te maken.

1 Zijn de data een absoluut feit of relatief?

Dat lijkt op het eerste gezicht simpel. Een absoluut feit is iets wat gebeurd is. Iets relatiefs is een overtuiging (bijvoorbeeld over waarom iets gebeurd is). Veel data zien er vaak uit als een absoluut feit, maar zijn eigenlijk relatief. Neem bijvoorbeeld winstgroei: die is relatief. Omzetcijfers en uitgaven staan vast – dit zijn feiten. Maar de winstgroei is gebaseerd op de winst van vorig jaar, en is daarmee relatief.

2 Zijn de data geldig of ongeldig?

‘Geldige’ data zijn de juiste data om een bepaalde waarde aan te toetsen. Neem bijvoorbeeld weer de winstgroei van een bedrijf. kun je aan de hand van dat groeipercentage van een bedrijf bepalen of de cashflow afdoende is om rekeningen te betalen? In dit geval is ‘winstgroei’ niet de foute keuze omdat het een relatieve waarde is, maar omdat het niet de juiste waarde is om cashflow op te baseren.

3 Vergelijken de data appels met appels?

Datasets zijn met elkaar te vergelijken als aan beide datasets dezelfde basis ten grondslag ligt. Als het winstcijfer van 2018 50% hoger ligt dan dat van 2008, is de winst dan met 50% gestegen? Niet per se. Die conclusie is namelijk niet alleen afhankelijk van het winstcijfer, maar ook van de basis waarop het winstcijfer is gebaseerd – welke invloed speelt bijvoorbeeld inflatie in deze berekening? Met deze eerste drie stappen wordt al zichtbaar hoe data die er op het eerste gezicht betrouwbaar (en bruikbaar!) uitzien, misschien toch minder geschikt is om bepaalde conclusies uit te trekken. Hoewel studenten steeds minder uit boeken werken en steeds meer informatie tot hun beschikking hebben waarvan de herkomst lastiger te achterhalen is, blijft statistiekonderwijs gelukkig een belangrijke rol spelen in veel opleidingen. Met de juiste mindset en de inzet van gezond verstand kan iedereen data tackelen! Sandor Nieuwenhuijs, presales director Benelux, Emerging Markets & Russia bij Qlik

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in