Menu English

Facebook weet alles?

Nouja, voorspellen is zo makkelijk nog niet

13 april 2018

Facebook trekt zo’n 28.000 conclusies over zijn gebruikers, zei Arjen Lubach afgelopen zondag in zijn tv-show. Dat zijn 28.000 mogelijkheden om ernaast te zitten, legde lector big data Sunil Choenni gistermiddag met zoveel woorden uit, op een congres over het Internet of Things. Iedere voorspelling die we doen op basis van grote datasets is fundamenteel gebrekkig, legde hij uit. Wat te doen, bijvoorbeeld met criminelen en hun enkelband?

Een algoritme spuugt op basis van grote datasets (big data) alleen statistische waarheden uit, nooit logisch noodzakelijke. Dat is het meest fundamentele probleem van big data, legde Sunil Choenni gisteren uit. En dat heeft gevolgen. Mensen worden in de verkeerde hokjes gestopt of heersende vooroordelen worden dankzij big data alleen maar verder versterkt. Bijvoorbeeld in het geval van crimineel gedrag.

Het was eigenlijk wetenschapsfilosofie wat Choenni de zaal uit het blote hoofd voorschotelde – zonder de geijkte powerpoint, want die ging stuk.

Choenni liet zien waarom het nodig is om aan een strategie te werken die met de fundamentele gebrekkigheid van big data kan omgaan. Wat moeten we doen met al die statistische waarheden als je weet dat ze in zoveel procent van de gevallen zeker niet waar zijn? En misschien zelfs wel nooit?

Ook perfecte datasets kunnen niet voorspellen

Alle mensen zijn sterfelijk, Socrates is mens, dus Socrates is sterfelijk. Dat is logisch noodzakelijk. Echter, algoritmes doen iets anders. Ze tellen vaak simpelweg hoe vaak iets voorkomt en zeggen dan dat de kans dat het nog eens voorkomt zo-en-zoveel is. ‘Stel dat je een database hebt met perfecte data, dus niet vervuild, verouderd of met missende velden. Dan nog zijn de conclusies van een algoritme niet logisch noodzakelijk’, zei Choenni.

Maar op basis van grote datasets maken we wel degelijk allerlei modellen waarmee we de werkelijkheid beter willen begrijpen of voorspellen. Klimaatmodellen, maar ook modellen die criminaliteit voorspellen, zodat de politie efficiënter kan werken.

Criminele stropdassendragers

‘Stel dat mannen met een bril en stropdas 80 procent kans hebben om crimineel gedrag te vertonen’, gaf Choenni de zaal als voorbeeld. ‘Wat moeten we daar dan mee? Moet ik al die mannen dan gaan controleren? Maar dat zou leiden tot een selffulfilling prophecy. We zouden dan namelijk zeker alle overtredingen van mannen met brillen en stropdassen opmerken en die zouden in de database belanden, waardoor het algoritme zal zeggen dat mannen met stropdassen een nog hogere kans hebben op crimineel gedrag. En dan zeggen we: Zie je! Het is evidence based, we moeten mannen met brillen en stropdassen aanpakken! Terwijl we het er zelf ingestopt hebben.’

‘We hebben een strategie nodig om big data-voorspellingen in het echte leven te implementeren’, zei Choenni. ‘Eén die niet leidt tot selffulfilling prophecies, maar die tegelijkertijd ook niet leidt tot self-denying prophecies.’

Slimme enkelband

De boodschap van Choenni kwam goed binnen bij de grofweg veertig toehoorders in het auditorium van RDM Campus. Vooral omdat de aanwezigen nog geen uur eerder waren vergast op een big brother-achtig gedachtenexperiment over hoe ex-gedetineerden met slimme technologieën in toom gehouden kunnen worden. Een onderzoeker van het wetenschappelijk bureau van het ministerie van Justitie en Veiligheid gaf de zaal ter overweging het voorbeeld van een slimme enkelband, die in zweet het adrenalineniveau van de drager meet en zo aan de reclasseringsambtenaar kan doorgeven wanneer de reclassant weer in de fout dreigt te gaan. Handig, want dan kan de ambtenaar de reclassant even bellen voor een interventie.

Ook in een TBS-kliniek kan dit handig zijn. Uit onderzoek blijkt kennelijk dat verhoogde adrenaline in het zweet al lang te meten is, ver voordat er daadwerkelijk bijvoorbeeld agressief gedrag op volgt, zo legde de onderzoeker uit.

Meneer, u bent een vrouw.

Zou het niet fijn zijn als een algoritme agressief gedrag zou kunnen voorspellen? Bij die gedachte zijn een paar Facebookadvertenties meer of minder klein bier. En ook: stoppen met Facebook, zoals Arjan Lubach en zo’n dertigduizend anderen vanavond willen doen, leidt niet tot minder big data-profielen. Die komen er alleen maar meer, of dat nou van gebruikers is door commerciële partijen, of van burgers door de overheid. De vraag is daarom niet: moeten we ermee stoppen, maar: hoe gaan we ermee om?

Organisaties moeten er een strategie voor ontwikkelen, zegt Choenni, die nu precies deze strategieën aan het onderzoeken is. Het kan namelijk niet anders dan dat er fouten worden gemaakt, dat mensen ten onrechte in één of andere categorie worden ingedeeld waar ze niet in thuishoren. ‘Als je zeker weet dat dat gaat gebeuren, moet je ook een manier hebben om daarmee om te gaan’, zei Choenni, die zelf bij de gemeente eens als vrouw werd ingeschreven. Gevolg? Choenni, die vrij duidelijk geen vrouw is, vertelt: ‘De mevrouw achter de gemeentebalie keek in nog een paar systemen en constateerde: “Meneer, u bent echt een vrouw”.’

Dit gehele artikel stond eerder op:
https://profielen.hr.nl/2018/facebook-weet-alles-nouja-voorspellen-is-zo-makkelijk-nog-niet/