De rol van 'Alternative Data' (Satellietbeelden, creditcarddata)
Stel je voor: je kijkt naar een aandeel van een grote supermarktketen.
Je ziet een mooie grafiek, de cijfers zien er goed uit. Toch twijfel je. Iets klopt er niet. De traditionele data liegt niet, maar vertelt je niet het hele verhaal.
Waarom zouden wachten op het kwartaalverslag als je nu al kunt zien hoe vol de parkeerplaatsen zijn? Dat is precies waar 'Alternative Data' om de hoek komt kijken. Het is de ogen en oren van de markt, ver voor de rest van de wereld het nieuws leest.
Wat is Alternative Data eigenlijk?
Alternative data is simpelweg alle informatie die niet uit de traditionele financiële bronnen komt.
We hebben het dus niet over winstcijfers, balansspecificaties of omzetprognoses. Nee, we hebben het over data die je eigenlijk overal vandaan kunt halen, behalve uit het jaarverslag.
Het is de ruis die de echte wereld maakt, en die nu eindelijk te vangen is. De meest bekende voorbeelden zijn satellietbeelden en creditcarddata. Met satellietbeelden kun je bijvoorbeeld tellen hoeveel vrachtwagens er voor een distributiecentrum van Amazon staan. Of hoeveel schepen er in de haven van Rotterdam liggen.
Creditcarddata (uiteraard geanonimiseerd) laat zien of mensen massaal hun geld uitgeven bij specifieke winkels of juist niet.
Andere vormen zijn bijvoorbeeld het scannen van webcams bij winkels, het meten van mobiele data om drukte in winkelcentra te zien of het volgen van vliegtuigen via ADSB. Het doel is altijd hetzelfde: een informatievoorsprong creëren. Terwijl de meeste beleggers wachten op de kwartaalcijfers, heb jij als het ware al een sneak peek van de werkelijkheid gehad.
Je bent niet afhankelijk van wat een bedrijf je vertelt, maar van wat de werkelijkheid laat zien. Dit maakt het een krachtig wapen voor algoritmische traders.
Hoe werkt het in de praktijk? Van pixel tot trade
Het proces klinkt ingewikkeld, maar het principe is logisch. Eerst moet je de data zien te bemachtigen.
Je haalt het niet zelf uit de lucht, tenzij je een eigen satelliet hebt (wat voor de meeste mensen niet haalbaar is).
Je schakelt een data provider in. Denk aan bedrijven als Orbital Insight of Quandl. Zij leveren schone, bewerkte data die jij direct kunt gebruiken in je systemen.
Je betaalt hiervoor een abonnement, variërend van een paar honderd tot duizenden euros per maand, afhankelijk van de kwaliteit en frequentie. Vervolgens moet je deze data verwerken. Stel je voor: je krijgt een dagelijkse lading satellietfoto's van een olieraffinaderij. Dat zijn gigabytes aan beeldmateriaal.
Je kunt niet zelf uren naar die plaatjes zitten kijken. Je gebruikt een algoritme, vaak gebaseerd op machine learning, dat de beelden analyseert.
Het herkent de schaduwen van de olietanks en berekent de vulgraad. In Python zou je hiervoor bibliotheken als TensorFlow of OpenCV gebruiken.
Het algoritme zet die beelden om in een simpel getal: "de voorraad ruwe olie is met 3% gedaald". Dat getal is de trigger. Je hebt een directe, bruikbare datapoint.
Dit datapoint koppel je aan je handelsstrategie. Stel je hebt een regel: "Als de voorraad ruwe olie daalt, koop dan een futures contract".
Je hoeft niet eens meer handmatig in te grijpen. Je API van je broker (denk aan Interactive Brokers of LYNX) krijgt het signaal en voert de order direct uit. Het enige wat jij nog doet, is toekijken hoe je algoritme de markt afspeurt op basis van echte wereldinformatie.
De kracht zit hem niet in de data zelf, maar in de snelheid waarmee je deze kunt vertalen naar een handelsbeslissing.
Soorten Alternative Data en hun prijskaartje
Er is een enorme variatie in de soorten data en de bijbehorende kosten.
- Satellietbeelden: Dit is vaak de duurste categorie. Je betaalt voor de beelden zelf en voor de analyse die erop losgelaten is. Een abonnement op ruwe data van een specifieke satelliet (bijvoorbeeld van Planet Labs) kan al snel €1.000 - €5.000 per maand kosten. Analyses van derde partijen (bijvoorbeeld tellingen van parkeerplaatsen) kunnen los aangeboden worden voor €200 - €1.000 per dataset per maand.
- Creditcard- en betalingsdata: Dit is erg schaars en duur omdat het privacy-gevoelig is. Partijen als Second Measure of Sensor Tower verwerken dit en bieden abonnementen aan. De prijzen liggen vaak tussen de €2.000 en €10.000 per maand, afhankelijk van de diepgang van de data (bijv. specifieke retailers of sectoren).
- Web scraping en app-data: Dit is vaak toegankelijker. Je kunt dit soms zelf verzamelen of een dienst inschakelen die het voor je doet. Denk aan het dagelijks scrapen van productprijzen van een webshop. Een tool als ScraperAPI of Bright Data kost vaak €50 - €500 per maand, afhankelijk van het aantal requests.
- Geaggregeerde transactiedata: Dit zijn data van bedrijven als Bill.com of Reid Transacties. Ze laten zien hoe het gaat met B2B betalingen of specifieke sectoren. Deze data is vaak te krijgen via API's voor €500 - €2.500 per maand.
Het is slim om te weten wat je koopt voordat je je budget vastlegt. We kunnen de data grofweg indelen in een paar categorieën, met een indicatie van wat ze ongeveer kosten voor een serieuze retail trader of kleine partij. Het is een investering.
Je moet je afvragen of de winst die je met deze data kunt maken, opweegt tegen de kosten. Voor een daghandelaar die in aandelen van €50 handelt, is een dataset van €5.000 per maand waarschijnlijk te duur. Voor een fonds dat miljoenen belegt, is het een schijntje.
Risico's en valkuilen: Het is niet alleen maar rozengeur
Zoals bij elke vorm van data zijn er valkuilen. De grootste valkuil is 'data snooping'.
Dit betekent dat je zoveel data doorzoekt totdat je iets vindt dat toevallig in het verleden werkte, maar in de toekomst totaal nutteloos is. Je vindt een correlatie tussen de verkoop van ijsjes en de aandelenprijs van een technologiebedrijf.
Het werkte de afgelopen 3 jaar, maar het is toeval. Zodra je het gebruikt, verliest je model geld. Een ander groot risico is de kwaliteit van de data. Satellietbeelden kunnen bewolkt zijn.
Creditcarddata kan vertekend zijn door een specifieke promotie die toevallig liep. Je systeem moet hierop ingericht zijn.
Zorg voor goede 'data quality checks'. Als het aantal datapunten ineens verdubbelt of halveert, moet je systeem dat signaleren en tijdelijk stoppen met traden. Gebruik een 'fail-safe' mechanisme in je Python code, of corrigeer gaten in je tijdreeksen.
Verder is er het risico van 'slippage' en uitvoering. Je signaal is perfect, maar je broker kan de order niet snel genoeg uitvoeren of de prijs is al veranderd.
Zorg voor een betrouwbare broker met een snelle API. Test je volledige setup, inclusief de dataverwerking en orderuitvoering, grondig met backtesting.
Gebruik niet alleen historische prijsdata, maar let bij het kopen van historische data ook op de kwaliteit, en probeer alternative data te simuleren in je backtests om te zien hoe je systeem had gereageerd.
Praktische tips om te beginnen
Je hoeft niet meteen een miljoenenbudget te investeren. Je kunt prima starten met een beperkte focus en een lage kostenpost. De kunst is om creatief te zijn en te beginnen met data die voor iedereen beschikbaar is.
- Start met publieke data: Zoek naar open data bronnen. De Amerikaanse overheid (bijv. USDA) publiceert wekelijks agrarische data die je kunt gebruiken voor handel in graan- en veecontracten. Luchtvaartmaatschappijen publiceren maandelijkse cijfers over bezettingsgraden. Dit is allemaal gratis en een perfecte leerschool.
- Leer een specifieke API kennen: Kies een broker met een uitstekende API, zoals Interactive Brokers. Hun Python wrapper (ib_insync) is fantastisch. Oefen met het aansturen van een demo-account via een script. Zorg dat je het orderproces volledig automatisch kunt uitvoeren voordat je dure data koopt.
- Focus op één niche: Probeer niet alles te doen. Kies één sector, bijvoorbeeld de retailsector. Verzamel dan data over één specifiek ding, zoals web traffic (via een simpele tool als SimilarWeb) of app-store rankings. Bouw een simpel model dat hierop reageert. Wees de expert op één klein gebied.
- Denk na over 'data cost vs. alpha': Alpha is je winst ten opzichte van de markt. Vraag je bij elke dataset af: "Betaal ik €500 per maand voor data die mij structureel €1000 per maand meer oplevert?". Als het antwoord nee is, koop het niet. Het is een bedrijfsmodel, geen hobby. Zorg dat je risicomanagement op orde is en nooit meer riskeert dan een klein percentage van je totale vermogen per trade.
Je hoeft niet meteen de duurste satellietdata te kopen. Het verzamelen van kwalitatieve financiële data is een krachtige manier om je algoritmische strategie een boost te geven.
Het draait allemaal om het vinden van een informatieveil die nog niet door de massa is ontdekt. Wees nieuwsgierig, wees kritisch en begin klein. De markt ligt voor je open.
