Datamining, wat is het en hoe werkt het?

datamining

Wat is datamining eigenlijk?

Organisaties verantwoorden tegenwoordig alles wat zij doen met data. Datamining tools schieten daarom als paddestoelen uit de grond. Deze tools helpen je met het (gericht) zoeken naar statische verbanden in grote datasets waardoor je een beter inzicht krijgt in je bedrijfsprestaties. Deze inzichten kunnen worden toegepast binnen de wetenschappelijke, journalistieke of commerciële wereld. Het gaat om alledaagse gebeurtenissen die geregistreerd worden. Denk hierbij aan het aankoopgedrag van consumenten, symptomen bij patiënten, data van Internet of Things, et cetera.

Een gerichte marketingstrategie

‘Kale’ data wordt dus omgezet in waardevolle informatie. Er wordt gegraven naar iets waardevols in een grote berg met gegevens, net zoals in een mijn. Vandaar de naam ‘datamining’. Het is mogelijk om modellen te creëren die uiteindelijk het gedrag van klanten kunnen voorspellen. Op deze manier krijgen bedrijven meer inzichten in hun klanten en kunnen ze een gerichtere marketingstrategie toepassen.

Idealiter kan datamining ervoor zorgen dat het gedrag van klanten heel gedetailleerd kan worden voorspeld. Toch moet je als organisatie eigenlijk aan enkele eisen voldoen.

De voorwaarden:

  • Weet waarnaar je zoekt binnen de data
  • Zorg voor optimaal databeheer
  • Er moet domeinkennis én statistische kennis aanwezig zijn
  • Stop genoeg tijd in de voorbereiding; je vraagstelling is het belangrijkste
  • Check je data goed op actualiteit, plausibiliteit, logica en correctheid

Toegepaste datamining bij Walmart

Een voorbeeld waarbij datamining heel waardevol is geweest is bij Walmart, een populaire Amerikaanse supermarktketen. Door middel van een associatietool van datamining ontdekten zij welke producten er vaak samen worden gekocht. Mannen die op vrijdagmiddag luiers kochten, kochten ook bier. Daar speelde Walmart op in: het schap naast de luiers werd gevuld met bier. Dat pakte – niet heel verrassend – enorm goed uit. Zonder de associatietool had je dit gedrag dus nooit kunnen voorspellen.

Nadeel datamining

Er zit echter ook één groot nadeel verbonden aan datamining. Je zoekt namelijk doelbewust naar verbanden tussen de data. Een gevolg hiervan kan zijn dat je bepaalde data negeert. De selectieve informatie is dus niet representatief voor de gehele klantendatabase. Daardoor kan er geen geldige hypothese opgesteld worden of conclusie getrokken worden op basis van de geselecteerde informatie.

Toch kunnen we met zekerheid zeggen dat datamining de toekomst is, letterlijk en figuurlijk. Bedrijven en organisaties zullen in de toekomst blijven investeren, aangezien het uiteindelijk hún toekomst voorspelt. Welke organisatie wil dat nou niet?

Want to know more?

We organiseren regelmatig Kennis Bytes. Tijdens deze externe kennisdelingen wordt een datagerelateerd onderwerp uitgebreid behandeld door één van onze data scientists. Elkaar inspireren, jezelf blijven ontwikkelen en altijd nét iets meer willen weten. Daar draait het om!

Wil je meer weten over onze Kennis Bytes en erachter komen wanneer de volgende sessie wordt georganiseerd? Kijk dan snel hier: https://www.tottadatalab.nl/2018/06/19/alles-weten-kennis-bytes/

Posted on 5 juli 2017

Share the Story

Back to Top