Ik ben al weken bezig met mijn koffer voor mijn vlucht naar Wenen binnenkort. Soldeerbout, plantenspuit, aluminiumfolie, twee zakjes wit poeder (gist en bak poeder), fles waterstof peroxide en een fles azijn, 9V batterij, vulpotloofvulling. Moet ik dit nu juist wel, of juist niet van te voren melden aan de luchtvaartmaatschappij?
Gisteren stond dit artikel in de NRC-Next over de opkomst van "de pre-chercheur": de ontwikkeling dat de politie misdaad met computermodellen probeert te herkennen en voorkomen. Als jij je gedraagt zoals criminelen zich vaak gedragen, wordt je aangehouden en ondervraagd. Het voorbeeld in de NRC gaat over een persoon die met een auto, die van een drugsbaas geweest is, op dezelfde dag Maastricht-Rotterdam en terug rijdt. Dat doen drugskoeriers vaak, dus verdacht, dus werd ze klemgereden op de snelweg. Bleek niets aan de hand.
Ik vind het eng. En tegelijkertijd snap ik het. Enerzijds moet de politie met beperkte middelen criminaliteit opsporen en voorkomen. Anderzijds had deze persoon niets illegaals gedaan en wel de schrik van haar leven. Grootste kritiek tegen het gebruik van profielen om misdaad te voorspellen is dat onschuldige mensen lastig gevallen worden. Ik zou dat een stap verder willen trekken: Bepaalde groepen worden door profilering onevenredig zwaar lastig gevallen. De reden: statistiek. We hebben niet de gegevens die criminaliteit exact voorspellen, dus doen we het met gegevens die in de buurt komen. Dat levert altijd correlaties, maar nooit een-op-een relaties op.
Toen ik nog bij het CBS werkte heb ik als eerste klus naar de statistiek rond bijstandsfraude gekeken. Daar speelden soortgelijke issues: gegeven de statistiek (de profielen), bij wie is de kans het grootst fraude aan te treffen? Bij wie gaat een rechercheur langs en hoe zet hij/zij zijn tijd het efficiëntst in? Ook toen had ik mijn twijfels en om die te onderbouwen had ik een simpel model gemaakt dat de valkuilen van profieldenken goed liet zien. Dat model heb ik opgediept en is hier onder te downloaden.
Mijn model beschrijft het criminele gedrag van een bevolking die opgesplitst is in twee groepen op basis van een bij de politie bekend kenmerk1. Door een correlatie met een bij de politie niet bekend kenmerk (opleiding? welvaart? jeugd?) ligt de criminaliteit in de ene groep iets hoger dan in de andere groep. De politie heeft beperkte middelen en moet beslissen hoe zij haar onderzoekscapaciteit over de groepen verdeeld. Initieel doet ze dat op basis van de fractie van de bevolking. Dan schakelt ze over op profiel-denken. Er zijn drie varianten
Tot slot voeg ik aan het model een (instelbare) elasticiteit toe: als binnen een groep de pakkans toeneemt, neemt de criminaliteit af.
Variant 3 levert de meest "eerlijke" situatie op2. Variant 3 is echter in de praktijk zeer moeilijk uitvoerbaar. Variant 2 komt vaker voor: de politie heeft namelijk wel beschikking over de geconstateerde misdaad, maar niet over het totaal aantal "zaken"3. Variant 2 klinkt politiek leuk, maar heeft een enorm nadeel: Een klein verschil in criminaliteit zorgt voor meer politie inzet. Dat leidt tot meer geconstateerde misdaad in die groep, wat tot meer politie inzet leidt: een zichzelf versterkende cirkel. Paradoxaal genoeg zorgt de elasticiteit ervoor dat de echte misdaad in de groep daalt. In de groep met initieel minder misdaad gaat de echte misdaad juist omhoog. Dit stabiliseert wanneer beide groepen (procentueel) evenveel misdaad plegen. Op dat moment is de opsporingsinzet echter al volkomen scheef gegroeid en zal de groep die met meer misdaad begon oververtegenwoordigd zijn in de misdaad statistieken. Een zeer groot deel van die groep wordt geconfronteerd met onterechte aanhoudingen. Er ontstaat dus een klasse-maatschappij. Enerzijds is de kans op gepakt worden voor hetzelfde misdrijf groter als je in het profiel past. Anderzijds wordt je als onschuldige veel vaker aangehouden, gestopt en ondervraagt als je in het profiel past. Leven voor die groep wordt een stuk minder aangenaam.
Uit Amerikaans onderzoek blijkt dat een groot deel van de politieagenten variant 2 onbewust toepast bij de uitvoering van hun werk. Een extreem gevolg daarvan zijn de rellen in Ferguson waarbij de politie volhoudt "effectief overheidsgeld in te zetten om criminaliteit te bestrijden" en de zwarte bevolking tegelijkertijd stelt dat "ze altijd ons moeten hebben". En ze hebben beide gelijk.
Er zitten dus nogal wat haken en ogen aan profielen gebruiken bij het opsporen en bestrijden van criminaliteit. Ik ben niet bang om mijn persoonlijke gegevens te delen met de halve wereld (zie ook: twitter). Ik vind het echter wel een probleem als de politie gegevens van mij gebruikt waardoor ze mij in een profiel kunnen plaatsten met mensen waar ik niets mee te maken wil hebben. De slotzin uit het NRCNext artikel vindt ik dan ook erg eng:
Alles wat de politie doet moet natuurlijk binnen de kaders van de wet vallen. Willen we onze veiligheid maximaal uitbuiten, dan zullen we een stuk privacy moeten opgeven. In het democratisch process moet worden bepaald hoeveel precies.
Gezien wat er allemaal mis kan gaan: doe mij maar wat minder veiligheid dan... Hopelijk kom ik dan, profiel-loos, gewoon door de douane.
Zie bijgevoegde grafiek en speel zelf met het model door het hier te downloaden. Een kleine disclaimer is op zijn plaats. Ik heb een goede achtergrond in statistiek en signaal-analyse, maar zeker niet in criminologie. Mogelijk dat ik criminologisch de plank mis sla, in dat geval hoor ik het graag. Zo neem ik aan dat er een negatieve elasticiteit is: bij een hogere pakkans gaat men minder crimineel gedrag vertonen. Als de criminaliteit niet van de pakkans afhangt, blijft mijn conclusie van scheefgroeiende politie inzet overeind.
PS de reden om met al die spullen door de douane te moeten staat hier.
1 meest voor de hand liggende: afkomst.
2 Voor mijn definitie van eerlijk: zo min mogelijk scheef beeld tussen de (onschuldige delen van de) bevolkingsgroepen.
3 Dat klinkt raar, maar iemand op straat aanspreken is in dit model al een "zaak". Dat kan namelijk leiden tot een constatering. Omdat dat niet wordt vastgelegd, kan variant 3 in de praktijk niet berekend worden en wordt vaak met variant 2 gewerkt.