Random forest

random forest

Wat is een random forest?

Een random forest is een Machine Learning algoritme dat veel wordt toegepast op classificatie- en regressievraagstukken. Het is, om precies te zijn, een ‘tree based supervised learning’ techniek.

 

Het algoritme is geschikt voor:

  • Voorspellingen doen of het schatten van kansen op gebeurtenissen
  • Het detecteren van verdachte gebeurtenissen of veranderingen in een dataset
  • Het toeschrijven van ontbrekende waarden in een dataset
  • Het zien van patronen of in de classificatie van verbanden of in kenmerken in een dataset
  • Het detecteren van de belangrijkste invloedsfactoren voor gebeurtenissen in een dataset

Wat is een decision tree?

In tegenstelling tot lineaire modellen, kan een random forest de niet-lineaire relaties in de data goed omschrijven. Er wordt hier namelijk gebruikgemaakt van een meervoud aan zwakke voorspellers; de decision trees. Deze worden vervolgens gebundeld om samen te resulteren in het random forest. Het combineren van honderden losse decision trees leidt uiteindelijk tot een ensemble die hogere precisie bevat en daarnaast stabiel voorspellingen kan uitvoeren.

 

Voordelen random forest

‘Random’ slaat hier op de willekeurige selectie van variabelen en observaties die in elke losse tree worden gekozen. Door deze selectie ontstaat variatie in de afzonderlijke trees. Een voordeel is de toepassing van big data. Deze techniek is in staat om goed om te gaan met¬†grote hoeveelheden observaties en variabelen. Daarnaast kunnen zowel numerieke als categorische variabelen worden gebruikt. Ook hoeft de data minder vaak te worden ‘schoongemaakt’ in vergelijking met andere technieken. Dit komt doordat ontbrekende waardes en outliers minder invloed hebben. De toepassing van random forest is zeer divers en kan onder andere worden teruggevonden in spamfilters, beeld- en videoclassificatie, medische diagnoses en click-stream analyses.

 

Wil je meer weten over een bepaald onderwerp? Stuur ons dan een bericht.

Posted on 4 mei 2017

Share the Story

Back to Top