Dat schaakcomputers beter kunnen spelen dan de beste schaakgrootmeesters ter wereld, is al jaren bekend. Het was in eerste instantie niet zozeer een kwestie van inzicht, maar een pure overmacht van rekenkracht.
Toen Deep Blue in 1997 Garry Kasparov in een match van zes partijen versloeg, kon die computer 100 miljoen tot 200 miljoen stellingen per seconde analyseren. Volgens de kenners leverde het saaie en weinig inspirerende potjes op, maar dat deed weinig af aan het feit dat de computer de mens de baas was.
Het verhaal kreeg een nieuwe wending toen het AI-bedrijf DeepMind in 2016 Alphazero introduceerde. Die werd, anders dan de voorgaande generaties schaakcomputers, niet gevoed met eindeloos oude partijen. Alphazero kreeg simpelweg de regels van het spel uitgelegd en vervolgens liet men de computer tegen zichzelf spelen.
Naar verluidt speelde hij in 9 uur tijd 44 miljoen potjes en had toen voldoende kennis van het spel om de sterkste schaakcomputer van dat moment – Stockfish 9 – met gemak te verslaan. Het mooiste was bovendien dat Alphazero veel interessanter schaakte dan de traditionele schaakcomputers.
Gaan we dat ook in financiële markten zien?
Is dit het voorland voor bijvoorbeeld de financiële markten? Stel dat je een machine in staat stelt om op basis van macro- en bedrijfsdata tegen zichzelf te handelen in obligaties, aandelen, swaps en valutamarkten. Aangezien de machine met zichzelf handelt, zal dit in eerste instantie geen invloed hebben op de prijzen, maar hij zal wel leren welke positie een beter resultaat oplevert.
Anders dan bij een schaakcomputer is hij afhankelijk van de echte, trage markt om te zien wat de uitkomst zal zijn, dus 44 miljoen potjes in 9 uur zit er helaas niet in. Maar laat het programma een paar jaar draaien en kijk wat het oplevert.
Stel dat de machine uiteindelijk wordt ‘losgelaten’ op de echte markt, wat gebeurt er dan? Hierbij stel je in het begin nog hele kleine limieten in, om eventuele grote uitschieters tegen te gaan, maar geleidelijk, naarmate de beleggingsresultaten superieur blijken kun je dat dan ook verruimen.
Dat het programma nu wel impact heeft op de prijs kan hebben, zal even wennen zijn, maar dat is slechts een kwestie van leren. De eerste flashcrash kost vast geld, bij de tweede weet het programma wat hij moet doen. Wellicht is niet alles winstgevend vanaf dag één, maar na verloop van tijd zal het programma de mens steeds meer de baas zijn.
Waar dit sprookje eindigt? Bij het gebrek aan een tegenspeler vermoed ik. Als het programma inderdaad superieur blijkt, wie wil er dan nog tegenin handelen? Om een spel te winnen heb je uiteraard wel een willig slachtoffer nodig. Dat Alphazero momenteel eigenlijk alleen nog met andere computers speelt, zegt denk ik wel genoeg.
(Origineel gepubliceerd in het FD van 02 november 2022)