Metadata: wat zijn het, hoe werken ze en waarvoor gebruik je ze?

Visualisatie van hoe metadata in elkaar zit met logo van datawoensdag

Data over data…?

In een wereld vol met data is het niet gek dat er regelmatig begrippen voorbijkomen die voor verwarring zorgen. Eén van die begrippen is metadata. Toch is de basis die hieraan ten grondslag ligt vrij simpel. Metadata zijn namelijk data over data. Maar wat houdt ‘data over data’ precies in? Dit leggen we hier voor je uit!

Wat zijn metadata?

Dit zijn gegevens die data ‘omschrijven’. Bij een document kunnen dit bijvoorbeeld de auteur, de verschijningsdatum en het aantal pagina’s zijn. Metadata bestaan dus uit eindeloos veel stukjes informatie die de karakteristieken van bepaalde gegevens omschrijven. Je kunt het dus zien als ‘extra informatie’ over een bepaald bestand. Metadata kennen een technische kant en een businesskant. Technische data zijn – de naam zegt het al – de technische details van de metadata. Business data zijn de data die echt van belang zijn voor een organisatie en zorgen voor de nodige inzichten. Als je gebruikmaakt van dit type data, is het toepassen van Business Intelligence essentieel. De tools van Business Intelligence vereenvoudigen namelijk de technische metadata, waardoor businesstermen kunnen worden geassocieerd met de data. Op deze manier wordt het voor een organisatie makkelijker om de metadata te interpreteren.

Goed informatiebeheer

Metadata zijn er niet voor niets en ze worden dan ook vaak ingezet voor relevante doeleinden:

  1. Ten eerste kunnen metadata worden ingezet om een website zo hoog mogelijk in de ranking binnen zoekmachines te laten eindigen. Voorbeelden zijn de title-tag, de description-tag en het belangrijkste keyword van de webpagina. Deze zijn namelijk niet direct zichtbaar als je navigeert naar een webpagina. Hierdoor kun je de data eenvoudig ‘misbruiken’ als websitebouwer, zodat je hoger scoort binnen zoekmachines.
  2. Ten tweede vormen metadata een belangrijk aspect voor informatiebeheer. Dit komt niet alleen ten goede aan de vindbaarheid van informatie, maar ook aan de betrouwbaarheid, de beveiliging en het beheer van informatie. Vanwege het belang van goed informatiebeheer in onze datamaatschappij vol met privacyrisico’s, zijn er zelfs richtlijnen voor het gebruik ervan. Deze richtlijnen zijn samengevoegd tot De Richtlijn Metagegevens Overheidsinformatie, en deze richtlijnen gelden voor alle informatie die door de overheid wordt ontvangen of gecreëerd.

De inzetbaarheid van metadata

Worden metadata alleen ingezet in de bedrijfswereld? Zeker niet. We hebben drie alledaagse voorbeelden voor je op een rijtje gezet:

  1. De auteur, de uitgever en het aantal pagina’s van boeken
  2. De datum van opname, het tijdstip en de sluitertijd van foto’s
  3. De beller, de ontvanger en de duur van telefoongesprekken

 Maar waarom dan?

Waarom zou je extra gegevens opslaan als er al zo ontzettend veel data beschikbaar zijn? Je zou verwachten dat dit alleen maar voor meer verwarring zorgt. Dit is echter niet het geval. Sterker nog, metadata kunnen méér opleveren dan je denkt. Het expliciet opslaan ervan zorgt er namelijk voor dat gegevens makkelijker gevonden kan worden. Zo is de kans vele malen groter dat men via een zoekmachine direct bij het bestand uitkomt dat wordt gezocht. Als je je metadata niet opslaat, kom je hoogstwaarschijnlijk niet uit bij het bestand dat je zocht. Ieder document waarin bijvoorbeeld de naam van een auteur gevonden wordt, verschijnt namelijk als zoekresultaat. En dit kunnen veel meer zoekresultaten zijn dan de documenten die daadwerkelijk door de auteur geschreven zijn. Het gevolg is dat je door de bomen het bos niet meer ziet.

De keerzijde

Ieder voordeel heeft zijn nadeel en dat geldt ook voor metadata. Zo moet dit type data worden toegevoegd aan alle mogelijke bestanden. Soms kan dit automatisch, maar vaak is er nog menselijk denkvermogen voor nodig. Het filteren van de naam van een auteur uit een tekstdocument of het toewijzen van bepaalde trefwoorden kan een computer simpelweg nog niet. Dit betekent dat de mens nog behoorlijk veel tijd en geld moet investeren in het toevoegen van deze belangrijke gegevens. Maar als je ziet wat dit je kan opleveren, is dit zeker de moeite waard.

Want to know more?

We organiseren regelmatig Kennis Bytes. Tijdens deze externe kennisdelingen wordt een datagerelateerd onderwerp uitgebreid behandeld door één van onze data scientists. Elkaar inspireren, jezelf blijven ontwikkelen en altijd nét iets meer willen weten. Daar draait het om!

Wil je meer weten over onze Kennis Bytes en erachter komen wanneer de volgende sessie wordt georganiseerd? Kijk dan snel hier: https://www.tottadatalab.nl/2018/06/19/alles-weten-kennis-bytes/

Posted on 1 november 2017

Share the Story

Back to Top