Big data is everywhere, maar small data ook

Datawoordenboek small data

‘Big data is everything’ is een veelgehoorde uitspraak in ons digitale tijdperk. Daar zit zeker wat in, maar veel mensen zijn zich niet bewust van het bestaan van small data. Het gaat niet alleen maar om groot, groter, grootst. Juist de allerkleinste datasets kunnen ertoe doen. Small data kan er namelijk voor zorgen dat je unieke inzichten krijgt in de behoeften van een individu. Hoe? Door te observeren. En dan niet via je laptop of telefoon, maar gewoon met het blote oog.

 

Menselijke observaties

LEGO liep enkele jaren geleden tegen diverse problemen aan. Kinderen waren steeds vaker achter een schermpje te vinden in plaats van (buiten) spelend. Dit was voelbaar voor LEGO, maar toch hebben ze het gered door gebruik te maken van small data. Onderzoekers van LEGO zochten gezinnen op en analyseerden de interesses en de levensstijl van kinderen. Zo kwamen de onderzoekers erachter dat kinderen altijd op zoek zijn naar nieuwe uitdagingen, en de kinderen deze blijkbaar niet vonden in het toenmalige LEGO-speelgoed. De speelgoedfabrikant speelde hierop in en bedacht een nieuwe strategie: geavanceerde bouwsels met meerdere typen legostenen. De uitdaging was terug, en dat had een positief effect op de verkoopcijfers van LEGO. Met alleen big data had LEGO dit niet voor elkaar gekregen.

 

Wat is small data?

Maar geldt het bovenstaande voorbeeld voor álle bedrijven, organisaties, instanties en gemeenten die gebruikmaken van data? Absoluut. Small data is data die klein genoeg is voor menselijk begrip. Dit type data is toegankelijk, informatief en je kunt er direct actie mee ondernemen. Eigenlijk is small data het eerste wat we voor ons zien als we denken aan het begrip ‘data’. De enige manier waarop wij big data kunnen begrijpen, is door het op te splitsen in kleine, en visueel gezien aantrekkelijke stukjes data, die weer stukjes van grote datasets representeren. Deze opdeling is noodzakelijk, mochten we data willen interpreteren. Maar small data bestaat niet alleen uit menselijke observaties die ervoor zorgen dat de data begrijpelijk wordt. Andere voorbeelden – in dit geval binnen een organisatie – zijn de verjaardagen van het personeel, NAW-gegevens, bestellijsten voor de supermarkt, et cetera.

 

Een race tegen de klok

De Deense auteur Martin Lindstrom is een expert als het gaat om small data. In zijn boek ‘Small Data’ laat hij zien dat veel innovaties voortkomen uit menselijke observaties; deze leiden vaak tot verfrissende hypotheses. Lindstrom benadrukt echter ook dat small data niet zonder big data kan, en vice versa. Ook al staan deze twee begrippen – linguïstisch gezien – lijnrecht tegenover elkaar. Ze vullen elkaar aan en houden zich allebei bezig met andere verhoudingen. Big data draait om correlatie, terwijl small data draait om oorzakelijke verbanden. Toch is het zo dat Lindstrom – en enkele andere onderzoekers – het niet zal verbazen als small data straks belangrijker wordt dan big data. Lindstrom licht dit toe aan de hand van een indrukwekkend voorbeeld: van de top 100 innovaties van ons tijdperk, is zo’n 60 tot 65 procent gebaseerd op small data. Want big data heeft zo zijn risico’s. Het is namelijk niet zo dat alleen data scientists bezig zijn met het verwerken van data; iedereen is ermee bezig. En met big data ga je véél sneller de mist in dan met small data, omdat het heel lastig is om te interpreteren. Big data kan voor hele mooie dingen zorgen, maar niet in álle businesses en zeker niet altijd in het dagelijks leven.

 

100 versus 100.000.000

Of we data het label ‘big’ of ‘small’ geven, hangt af van de onderstaande factoren:

-Het volume van de data;

-De variatie binnen de data;

-De snelheid waarmee de data kan worden verwerkt.

Big data bestaat dus uit diverse data-elementen, die met een niet bij te houden snelheid een organisatie binnendringen. Small data bestaat voor het grootste gedeelte uit homogene data-elementen, die in verteerbare delen een organisatie binnenkomen. De grens tussen deze twee is heel moeilijk vast te stellen en omvat een breed spectrum. Veel big data bestaat weer uit allerlei small data, en vice versa.

 

Voorbeelden uit de praktijk

Als je moet gaan kiezen tussen deze twee, moet je je afvragen wat het uiteindelijke doel is van de dataverwerking. Vanuit big data perspectief, kunnen de volgende vragen ontstaan binnen een organisatie:

  1. Welke trends zien we als we kijken naar klimaatverandering?
  2. Kunnen we factoren identificeren die bepaalde ziektes kunnen voorspellen?

 

Als je juist met small data aan de slag gaat, ontstaan juist concretere vragen:

  1. Wat gaat het weer worden vandaag?
  2. Loop ik het risico om ziekte X te krijgen?

 

Of je voor big data of voor small data gaat, is aan jou. Maar onthoud één ding: deze twee kunnen niet zonder elkaar, maar zijn tegelijkertijd ook elkaars concurrenten. Wie denk jij dat de ‘strijd’ zal winnen?

Posted on 24 oktober 2018

Share the Story

Back to Top