Nieuwe Nederlandse start-up SNTMNT.com voorspelt de koersen met behulp van social media

Leestijd: 4 minuten

Data is waardevol. Eric Schmidt, oud-CEO van Google, zei al eens dat data miner de topjob van de toekomst is. We genereren tegenwoordig gigantische hoeveelheden data. Dat daar interessante inzichten uit te halen zijn blijkt wel uit de uitspraak die Marissa Mayer, VP bij Google, deed dat creditcard maatschappijen met 98% zekerheid kunnen zeggen dat koppels na twee jaar gaan scheiden. Puur op het veranderende aankoop gedrag zijn er patronen zichtbaar die dat duidelijk maken.

Ook het onlangs opgerichte SNTMNT.com < sen·ti·ment > wil daar op inspelen door gebruik te maken van de data die wij generen met user generated content. Doordat velen momenteel hun meningen over bedrijven uitten op social media zijn er patronen te vinden die beurskoersen kunnen voorspellen.

Online sentiment als voorspeller

Finno-blogger Vincent van Leeuwen zag kansen toen zijn broer de masterscriptie opleverde over de correlatie van specifieke moodstates tussen online sentiment en de Nederlandse index AEX. Eerder dit jaar was er veel media aandacht voor professor Johan Bollen, die in zijn  onderzoek beweerde dat hij aan de hand van Twitter beurskoersen kon voorspellen. Maar daarbij moest Bollen ook het volgende toegeven:

“I’d like to emphasize that this paper does rigorously support the claim that Twitter can be used to help predict the direction of the Dow for their sample. Though directional prediction does not necessarily equate to profitable strategy, this is an exciting conclusion.”

De theorie is dat de dataset voorspellingen in zich herbergt en dat de voorspellende waarde zit in de snelheid van social media ten opzichte van oude media. Deze oude media heeft toch nog zodanige grote impact dat het de beurskoersen beïnvloedt. Dat deze significantie terug gaat lopen in de toekomst ziet van Leeuwen niet als probleem.

Een onderneming was geboren

Van Leeuwen, zelf al thuis in de wereld van social media en beleggen, ging samen met zijn compagnon Kees van Nunen te werk om zijn ideeën uit te werken. Een onderzoek dat zij in handen kregen toonde aan dat er genoeg vraag was naar de voorspellingen, zelfs van de mensen die claimden enkel volgens fundamentele analyse te beleggen.

Tijdens Start Up Weekend Amsterdam , waar hij sowieso al zelf bij betrokken was, vond hij de ideale gelegenheid om dit project een goede kick off te geven. Binnen no time is een idee uitgewerkt tot een goed concept. Dat concept volgt het proces zoals op onderstaande afbeelding te zien is.

Voorspellen met 80% zekerheid

Aan alle online gegenereerde buzz wordt een label gehangen, dat het sentiment van de conversatie weergeeft (zeer positief, positief, neutraal, negatief of zeer negatief). De methode is niet feilloos, maar geeft tot 80% zekerheid. Met die specifieke gelabelde data plus de historische beurskoersen is sntmnt.com ze aan de slag gegaan. Om hun gelijk te bewijzen hebben ze hun methode eerst op de Nederlandse beurs losgelaten. Op basis van 10.000 bronnen (met onder andere Twitter, Facebook en landelijke websites en blogs) en anderhalf jaar aan data zijn er algoritmes gebouwd om te positieve of negatieve signalen te genereren. Zoals Van Leeuwen zelf zegt:

“Momenteel zijn we aan het kijken hoe we onze black box kunnen doorontwikkelen. De algoritmes en NLP (Natural Language Processing) die we gebruiken bieden nog veel ruimte voor verbetering. Het machine learning model dat we nu gebruiken is eigenlijk een relatief eenvoudig regressiemodel. In de toekomst, met meer data, kunnen we complexere modellen gaan ontwikkelen. We hopen en verwachten dan een 65-70 procent betrouwbaarheidsinterval te halen.”

Nu hebben de voorspellingen tot 10% van de koersfluctuatie een betrouwbaarheid van 99% en kunnen ze tot zeven dagen in de toekomst voorspellen.

(klik op afbeelding voor vergroting)

Interesse van derden

Er lopen nu veel gesprekken met dataleveranciers van de online buzz. Ze hebben de voorkeur voor een leverancier die op de Twitter Firehose is aangesloten. Een eerste streven is om de data set uit te breiden met online buzz over andere beursen, zodat ook andere indicies (Nasdaq, S&P100, FTSE100, etc) meegenomen kunnen worden. Met meer data kunnen ze de algoritmes verder aanscherpen, het proces verbeteren en bekijken waar de interesses in de markt liggen.

Er zijn al veel gesprekken met banken en vermogensbeheerders, maar van Leeuwen geeft aan dat hij graag ook wel een retail kant, de particuliere belegger, aan SNTMNT.com wil koppelen en hen inzichten wil geven. Zo bekijkt hij de mogelijkheid om modelportefeuille op te richten op basis van de output en widgets te creëren van specifieke aandelen die in het nieuws zijn.

De verwachtingen zijn dat SNTMNT.com in bepaalde markten een beter voorspellende waarde heeft dan in andere. Fast Moving Consumer Goods hebben over het algemeen veel en veel meer buzz dan de vastgoed markt.

Naast het hedgefund gebaseerd op de theorie van Bollen lijken ook Finif.com en Opfine.com in dezelfde data mining van sociale conversaties te zijn gedoken. Ik geloof dat er veel informatie zit in de data die wij met z’n allen genereren en dat we enkel nog moeten ontdekken hoe we dat gefilterd krijgen. Persoonlijk loop ik al veel tegen dat probleem aan in de analyses die wij doen met Social Inc. Het is uitdagend om een zeer goede query te hebben die alle zaken rondom een bedrijf meeneemt.

Self Fulfilling prophecy?

De beste data crunchers en tools met de beste filters kunnen wezenlijke inzichten geven die zeker succesvol kunnen zijn. Als de black box een black box blijft zit hier zeker een heel waardevol business model in. Het gevaar zit er in dat iedereen dezelfde theorie gaat aanhangen, wat zo de markt zal veranderen en dus in de praktijk nutteloos wordt (self-fulfilling prophecy). Tot die tijd lijken zij hier vooralsnog een kleine glazen bol in handen te hebben.

0 antwoorden

Trackbacks & Pingbacks

  1. […] Na StockTwits zijn er vergelijkbare initiatieven ontstaan, waaronder het Nederlandse SNTMNT.com. […]

Plaats een Reactie

Meepraten?
Draag gerust bij!

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.