Creëer gezichten die niet bestaan met het generative adversarial network

Veel verschillende gezichten die als input worden gebruikt voor het generative adversarial network

Eindeloos veel gezichten

Neurale netwerken kunnen ons leven simplificeren, een boost geven en uitdagen. Zo kunnen deze onze selfies beoordelen en openingszinnen sturen naar jouw matches op Tinder. En de experimenteerfase van neurale netwerken is nog láng niet voorbij. Onlangs is er een neuraal netwerk ontwikkeld – het zogenaamde GAN (generative adversarial network) – dat gezichten genereert. Als input zijn bestaande gezichten van echte mensen vereist. De output bestaat juist uit gezichten die nooit hebben bestaan, maar wel héél erg echt lijken. Eng en betoverend tegelijk.

 

Google DeepDream

Het begon allemaal met de lancering van Google DeepDream in 2015. Dit is een programma dat psychedelische output genereert van zo’n beetje alles. De input doet er niet toe; de output is altijd creatief en origineel. De eerste stap is de selectie van bepaalde objecten – de input – die vervolgens worden geanalyseerd door het desbetreffende neurale netwerk. Nadat de patronen hierin zijn achterhaald, worden er creatieve aspecten toegevoegd aan de input. De output is verbazingwekkend, maar heeft weinig overeenkomsten met de originele input. Er wordt werkelijkwaar van alles toegevoegd en vermengd met de input; van bolle ogen tot kromme contouren.

 

Het onderzoek van NVIDIA

Het Amerikaanse technologiebedrijf NVIDIA gaat een stapje verder dan Google DeepDream. Hierin wordt een nieuwe methode getoond om het generative adversarial network te gebruiken. Dit netwerk wordt ook door Google DeepDream gebruikt, maar dan net even anders. Het generative adversarial network zorgt voor een nieuwe progressieve trainingsmethode, waarmee unieke afbeeldingen kunnen worden gegenereerd. Er wordt in het onderzoek van NVIDIA gebruikgemaakt van de zogenaamde CelebA-HQ database. Deze database bevat oneindig veel foto’s van beroemdheden. En de resultaten? Die mogen er wezen. Bereid je voor op een mengelmoes van gezichten van Beyoncé, Johnny Depp en Gwyneth Paltrow.

 

De werking van het generative adversarial network

Het doel van dit onderzoek is het creëren van nieuwe samples op basis van heel veel input. Om dit te bereiken wordt het netwerk van zoveel mogelijk input voorzien. Op deze manier leert het netwerk van de onderliggende patronen in de input, waarop de output gebaseerd is. Eigenlijk bestaat het netwerk uit twee neurale netwerken die tegenover elkaar worden geplaatst als concurrenten: de generator en de discriminator. De generator moet zien te dealen met zowel ‘echte’ input als ruis. De output wordt uit deze twee types gegenereerd. Vervolgens geeft de generator de output door aan de discriminator. De taak van de discriminator is beoordelen of de output van de generator afkomstig is uit de originele dataset of uit de dataset met ruis. De discriminator bepaalt uiteindelijk of de output van de generator gebruikt gaat worden of niet.

 

Survival of the fittest

Je hebt dus te maken met twee neurale netwerken binnen één netwerk, die elkaars concurrenten zijn. De twee netwerken maken elkaar beter en beter, doordat ze elkaar wijzen op de fouten die ze maken. De discriminator daagt de generator uit om een zo goed mogelijke output te creëren, terwijl de generator de discriminator uitdaagt om de correcte output te selecteren. Het doel van de generator is om de discriminator zoveel mogelijk fouten te laten maken en vice versa. Ze willen beide de beste zijn, en het uiteindelijke resultaat hiervan is dat het GAN zich keer op keer verbetert.

Het idee is dus om de generator en de discriminator beide progressief te laten groeien. Je zult zien dat de output aan het begin van lage resolutie is, maar naarmate de tijd vordert zal de kwaliteit steeds beter worden. Dit is ook te zien in de onderstaande video.

De creatieve kant van het GAN

Hoe je het ook went of keert: het blijft griezelig. En zoals je ziet in bovenstaande video, kan de unieke combinatie van deze twee netwerken worden toegepast op alle soorten input. Daarnaast is de output nooit fout, aangezien alles mogelijk is. Dit suggereert dat de mate van creativiteit van dit neurale netwerk groter is dan je in eerste instantie zou verwachten. Neurale netwerken zijn dus niet zo voorspelbaar en statisch als we denken. Kunstmatige intelligentie zal zich dus – volgens dit onderzoek – niet beperken tot rationele, statistische en geprogrammeerde aspecten.

Posted on 16 november 2017

Share the Story

Back to Top