Bayesian Inference

bayesian-inference

Het verschil tussen bayesian inference en frequentist inference

Binnen de statistiek zijn er grofweg twee stromingen. Ze worden vaak aangeduid als de Frequentist (ook wel klassieke) approach en de Bayesian approach. Het verschil tussen de twee stromingen begint bij de fundamentele kijk op statistiek. Frequentists geloven in een vast onderliggend proces dat de data genereert. Het is het doel van de onderzoeker om de vaste parameters in dit proces te schatten, gegeven de data waar onzekerheid in zit.
Bayesianen hebben een andere kijk op statistiek. Ze geloven dat het onderliggende proces dat de data genereert niet vast ligt, maar ook in een bepaalde mate onzeker is. De data kan gebruikt worden om meer te weten te komen over de verdeling van de niet vaste parameters in dit proces.

Nadelen bayesian inference

Een Bayesiaan wilt de verdeling van deze parameters te weten komen. Hierbij wordt gebruik gemaakt van de data en van kennis die op voorhand beschikbaar is, oftewel prior knowledge. Doordat deze prior knowledge vaak niet op data is gebaseerd en vrij door de onderzoeker gekozen kan worden, is er een bepaalde mate van subjectiviteit. Vanuit de Frequentist approach wordt dit gezien als een groot nadeel. De uitkomst van de analyse kan namelijk naar wens veranderd kan worden door de onderzoeker.

Voordelen bayesian inference

Bayesian inference heeft echter ook veel voordelen. Zo kan het juist ook fijn zijn dat je als onderzoeker expert-knowledge kan verwerken in je model. Daarnaast zijn de voorspellingen die met Bayesian Inference gemaakt worden vaak van hoge kwaliteit. Deels komt dit doordat de parameters niet als waar worden gezien maar als onzeker en doordat deze onzekerheid mee wordt genomen in de voorspelling. Grof gezegd wordt er namelijk een gewogen gemiddelde genomen wordt van een oneindig aantal voorspellingen met allerlei verschillende waardes voor de parameters. De gewichten in dit gemiddelde worden bepaald aan de hand van de waarschijnlijkheid van de waardes van de parameters. Voorspellingen met een hogere waarschijnlijkheid hebben hierdoor meer invloed op de uiteindelijke voorspelling.

Onmisbaar

In de praktijk zijn zowel Bayesian als Frequentist methoden onmisbaar in de toolbox van een data scientist. Hierbij moeten de voordelen en nadelen van de technieken bekend zijn zodat de juiste techniek voor elk probleem gekozen kan worden.

Want to know more?

Totta data lab organiseert regelmatig Kennis Bytes. Tijdens deze externe kennisdelingen wordt een datagerelateerd onderwerp uitgebreid behandeld door één van onze data scientists. Elkaar inspireren, jezelf blijven ontwikkelen en altijd nét iets meer willen weten. Daar draait het om!

Wil je meer weten over onze Kennis Bytes en erachter komen wanneer de volgende sessie wordt georganiseerd? Kijk dan snel hier: https://www.tottadatalab.nl/2018/06/19/alles-weten-kennis-bytes/

Posted on 8 mei 2017

Share the Story

Back to Top