Dark Data: wat is het en hoe krijg je er grip op als organisatie?

Dark data weergegeven door verbonden datapunten

‘Gewoon, voor de zekerheid’

De term dark data klinkt heel mysterieus en vaag, en dit is het ook. Dark data bestaat uit de ‘vergeten’ bestanden en informatie die op allerlei plekken in een organisatie zijn opgeslagen. Grote hoeveelheden ongebruikte en onbeschermde data wordt, zonder enig nut, bewaard. Maar niemand weet meer waar de gegevens zijn en wat je er überhaupt aan hebt. Organisaties moeten hier snel iets aan veranderen, want dark data kent meer risico’s dan je in eerste instantie zou verwachten.

 

Wat is dark data?

Dark data is eenmalig gebruikte of aangemaakte informatie. Dit betreft data die wordt bewaard onder de noemer ‘voor het geval dat’. Zo kunnen bestanden die eerst actief wordt gebruikt, veranderen in dark data op het moment dat er niets meer mee gedaan wordt. De bestanden blijven bewaard, maar vervolgens wordt er zo lang niets meer mee gedaan dat men vergeet dat ze er zijn. Wat ook vaak voorkomt binnen organisaties, is dat bestanden onnodig meerdere keren worden opgeslagen. In dit geval wordt de gezochte informatie niet snel genoeg gevonden, en daarom maar opnieuw gedownload. Door dit soort gewoontes binnen bedrijven wordt de hoeveelheid dark data alleen maar groter. Verouderde, overbodige of onzichtbare informatie neemt explosief toe, en dit kost de organisatie ontzettend veel geld.

 

De drie soorten data

In principe hebben organisaties drie soorten data opgeslagen staan:

  1. Bedrijfskritische data. Dit zijn de gegevens die heel belangrijk zijn voor de organisatie. Ze zijn zelfs noodzakelijk om de boel draaiende te houden. Het is dus essentieel om deze gegevens goed te beschermen en beheren.
  2. ROT data (redundant, oud, triviaal). ROT data bestaat uit bestanden die meerdere keren zijn opgeslagen (redundant), geen waarde meer hebben voor de organisatie (oud) of totaal niet van belang zijn voor een organisatie (triviaal). Het is heel belangrijk om deze gegevens te herkennen en vervolgens op een veilige manier te verwijderen.
  3. Dark data. Dit zijn de gegevens waarvan de waarde nog niet is vastgesteld. Dit kunnen zowel bedrijfskritische als ROT data zijn. Het feit dat belangrijke gegevens onbenut blijven, is een van de redenen waarom dark data ongewenst is. Daarnaast neemt dark data veel opslagruimte in beslag en brengt het risico’s met zich mee.

 

De donkere kant van dark data

De risico’s die dark data met zich meebrengt, hangt af van de samenstelling van de data. Toch zijn er algemene risicofactoren die we niet kunnen vermijden.

  1. Relationele risico’s. Dark data kan informatie bevatten over de competitieve voordelen, de marktpositie, partnerschappen en andere businessgerelateerde issues. Als dit lekt, kan dit ten koste gaan van jouw businessrelaties en activiteiten.
  2. Juridische risico’s. Dark data kan tevens privacygevoelige informatie bevatten, zoals medische gegevens. Als deze gegevens lekken, kan dit juridische consequenties hebben voor jouw organisatie.
  3. Financiële risico’s. Als je als organisatie besluit om niet te investeren in data mining en data analyse, loop je veel kansen mis. Dit betekent automatisch dat je minder inkomen hebt.
  4. Reputatierisico’s. Hier kunnen we heel kort over zijn; een datalek kan bij elke organisatie grote (imago)schade veroorzaken.

 

De oorzaken

Maar hoe heeft het zover kunnen komen? Gewoon wat overbodige bestanden wissen: hoe moeilijk kan dit zijn? Toch heeft een samenloop van omstandigheden binnen organisaties gezorgd voor de ophoping van dark data en ROT data:

  1. Organisaties baseren hun strategieën en budgetten alleen op de beschikbare ruimte voor de data, en niet op de waarde van de data.
  2. Het aantal cloudtoepassingen voor opslag, bijvoorbeeld Dropbox, neemt enorm snel toe. Hierdoor zijn mensen eerder geneigd om alles maar op te slaan.
  3. Veel computers en laptops worden door medewerkers gebruikt voor privédoeleinden; dit neemt weer extra opslagruimte in beslag.

 

Hoe deal je met dark data?

Er zijn diverse manieren om als organisatie van dark data af te komen. Hoeveel dit je gaat kosten, hangt af van de hoeveelheid dark data. De ongebruikte en vergeten informatie kan namelijk net zo snel groeien als de gegevens die er wél toe doen. Hierdoor duurt het erg lang om de data gedetailleerd te analyseren, mede dankzij de hoeveelheid ruis in de te onderzoeken data. Je kunt je data laten analyseren door een zogenaamd Enterprise Content Management (ECM) systeem; dit betreft het informatiebeheer van een organisatie. Dit systeem verwerkt zowel gestructureerde als ongestructureerde data, maar daar komt wel een kostenplaatje bij kijken. Als de data is geanalyseerd, kun je twee dingen doen. Of je brengt bepaalde data weer tot leven, of je neemt er voorgoed afscheid van. Op deze manier wordt de uiteindelijke waarde van de beschikbare informatie veel groter dan je zou verwachten.

Posted on 13 december 2017

Share the Story

Back to Top