Structuur in je data? Geen sprake van met NoSQL…

NoSQL

Wat is NoSQL?

NoSQL is een verzamelnaam voor heel veel verschillende databases waar niet echt een overeenkomst tussen is. Een belangrijke overeenkomst is dat al deze databasemanagementsystemen op aanmerkelijke wijze verschillen van de klassieke relationele databases (RDBMS). NoSQL databases kunnen extreem grote hoeveelheden data verwerken, ook wel big data genoemd. Bovendien hoeft deze data van tevoren geen (semi)structuur te hebben.

Wat betekent NoSQL?

Wat opvalt, is dat de term NoSQL vaak niet goed wordt begrepen. Door het ‘no-gedeelte’ binnen dit woord, suggereert de term dat het NO SQL betekent (vertaling: GEEN traditionele database waarin men de Structured Query Language (SQL) gebruikt). Het staat echter niet voor ‘NO SQL’, maar voor ‘Not Only SQL’. Hiermee wordt bedoeld dat er meer dan één opslagmechanisme kan worden gebruikt voor de nodige behoeftes. NoSQL zit tussen SQL en Hadoop in. Bij SQL moet je structuur aanbrengen, bij Hadoop juist niet en NoSQL zit er ergens tussenin. We leven nu eenmaal niet meer in een tijdperk met one-size-fits-all databases, en dat is ook helemaal niet problematisch. NoSQL en SQL databases zijn geen concurrenten, aangezien ze allebei voor compleet andere doeleinden worden gebruikt.

De voordelen van NoSQL ten opzichte van SQL

De traditionele database SQL kent z’n voordelen, maar de NoSQL databases ook zeker:

  1. Je hoeft de data van tevoren niet te modelleren en overzichtelijk te maken. NoSQL databases zijn ontzettend flexibel en kunnen alle soorten en maten data aan. Daarom stellen ze weinig eisen aan de organisatie en de structuur van de data.
  2. Deze databases kunnen goed omgaan met big data.
  3. Ze zijn goedkoper om te managen, omdat er simpelweg weinig te managen valt.
  4. NoSQL databases zijn horizontaal schaalbaar. Dit betekent dat de data kan opgesplitst worden op diverse servers, wat de responstijd verhoogt. Schalen is ontzettend belangrijk, omdat de hoeveelheid data steeds blijft groeien.
  5. Deze databases zijn eenvoudiger te gebruiken en heel simpel wat betreft design.
  6. NoSQL komt voor in de vorm van kolommen, documenten, key-values, grafieken en multimodellen. Je kunt er dus letterlijk alle data in stoppen.

De nadelen

Eén groot nadeel van de NoSQL databases is de onnauwkeurigheid. Als het gaat om miljoenen gebeurtenissen in korte tijd, kun je prima kiezen voor dit type database. Het missen van enkele gebeurtenissen is in dit geval geen probleem. Dit stelt je in staat om de data schaalbaar te maken, wat uiteindelijk tijd- en kostenbesparend kan werken. Bij relationele databases zijn deze grote gegevens juist niet handig, en zijn kleine gegevens de beste input. Bij relationele databases gaat kwaliteit namelijk boven de kwantiteit en bij NoSQL databases is dit precies andersom.

What about the future?

Het is niet zo gek dat relationele databases eerst de standaard waren. Bij dit model stond de opbouw en de organisatie van de database los van de manier van opslag.  Relationele databases bestaan al sinds de jaren 60 en zijn altijd overheersend geweest, totdat platformen zoals Facebook en Google werden gelanceerd. De hoeveelheid data was ineens enorm en relationele databases konden deze hoeveelheid data niet verwerken. De dominantie van relationele databases is dus aanzienlijk verminderd. Maar je weet het maar nooit in ons datatijdperk wat er later gaat gebeuren. Dit hangt ook compleet af van het soort data dat er de komende jaren bij gaat komen, en dit is heel onvoorspelbaar…

Want to know more?

We organiseren regelmatig Kennis Bytes. Tijdens deze externe kennisdelingen wordt een datagerelateerd onderwerp uitgebreid behandeld door één van onze data scientists. Elkaar inspireren, jezelf blijven ontwikkelen en altijd nét iets meer willen weten. Daar draait het om!

Wil je meer weten over onze Kennis Bytes en erachter komen wanneer de volgende sessie wordt georganiseerd? Kijk dan snel hier: https://www.tottadatalab.nl/2018/06/19/alles-weten-kennis-bytes/

Posted on 11 oktober 2017

Share the Story

Back to Top