Computer can’t say no!

‘Algoritme voorspelt wie fraude pleegt bij bijstandsuitkering’, kopte de NRC (18 april) en al snel volgden er Kamervragen. Een inmiddels even voorspelbare als begrijpelijke reactie zodra het erop lijkt dat de computer het nemen van besluiten over mensen van de mens overneemt. Met de nadruk op ‘lijkt’, want de feiten vertellen wat anders.

Om alle misverstanden maar meteen uit de weg te ruimen; de computer gaat niet over het al dan niet stopzetten van uitkeringen. Het algoritme signaleert risico’s op fraude, waarna de mens het overneemt door onderzoek te doen. WIL (Werk en Inkomen Lekstroom) is twee jaar geleden, als eerste middelgrote gemeentelijke uitvoeringsorganisatie, in zee gegaan met Totta data lab. Totta heeft een algoritme gemaakt voor het voorspellen van bijstandsfraude. Wim Janssen, projectleider bij WIL: ‘Wij waren al aan het nadenken over nieuwe manieren om bijstandsfraude tegen te gaan toen we hoorden van het idee van Totta. Dat was echt nieuw; data science en machine learning inzetten op ons vakgebied. We hebben het eerst intern goed doorgesproken, ook met het algemeen en dagelijks bestuur. Uiteraard kennen we de argwaan die bij veel mensen leeft ten aanzien van computerbesluiten. Maar uit de gesprekken met Totta bleek snel dat transparantie een belangrijke waarde is. En voor het voldoen aan de privacywetgeving sloten we met Totta een verwerkingsovereenkomst af.’

Patronen

Zoals gezegd zocht WIL naar nieuwe wegen in de bestrijding van bijstandsfraude. Janssen: ‘Je kunt wel de knoppen van wat je gebruikelijk doet strakker aandraaien, maar wij zochten naar een echte doorbraak. Dat heeft twee belangrijke redenen: rechtmatigheid van uitkeringen zijn belangrijk voor het draagvlak en we willen de mensen die recht hebben op een uitkering niet lastigvallen met onnodige controles. We hoorden steeds meer geluiden dat datagestuurd werken met gebruik van een algoritme een doorbraak kan zijn.’

Een algoritme is een formule die je stap voor stap naar een resultaat ‘rekent’. Het algoritme wordt gevoed met data, in dit geval met bekende fraudegevallen. ‘Met behulp van het algoritme kijken we of we bepaalde patronen herkennen,’ aldus Jesse Luk, co-founder en partner van Totta.  ‘En het algoritme wordt steeds slimmer, naarmate er meer data in komen. We gebruiken alleen data die volgens de wet verzameld mogen worden voor het vaststellen van het recht op een uitkering, bijvoorbeeld loongegevens. Daarom trekken we ook op met Stimulansz, het kennisbureau voor het sociaal domein. Zij helpen gemeenten bij nieuwe ontwikkelingen zoals dit en hebben veel verstand van privacywetgeving; daar vullen ze ons goed op aan.

Gerrit van Romunde, adviseur bij Stimulansz: ‘De AVG regelt dat belanghebbenden hun data kunnen inzien. Dat geldt hier ook. En vergeet niet: het controleren van rechtmatigheid van uitkeringen gebeurt natuurlijk al op basis van de data die verankerd zijn in de wet. Met de hand. Op basis van signalen, onderbuikgevoelens tips of themacontroles. Wat het algoritme doet is in feite een stap naar objectivering.’ Luk: ‘En ik onderstreep nogmaals, er worden geen geautomatiseerde besluiten genomen.’

Begin

Wim Janssen vertelt hoe het in z’n werk gaat. ‘De data in het algoritme vormen bij elkaar “de standaardfraudeur”, gebaseerd op historische en gedocumenteerde gegevens. Eén keer per kwartaal halen we alle uitkeringsgerechtigden daar langs. Dan krijg je een ranking op basis van een oplopende risicoscore. De top tien van degenen die het meest lijken op de standaardfraudeur halen we eruit. Niet om te sanctioneren, want het staat nog helemaal niet vast dat het om fraude gaat. De werkelijkheid is weerbarstiger dan kale data. Nee, dit is pas het begin van het werk. Op basis van deze signalen gaan de specialisten onderzoek doen. In feite is dat niet anders dan zoals ze voorheen tips en uitkomsten van themaonderzoeken (zoals huisvesting, autobezit, inschrijving KvK) gebruikten als basis voor verder onderzoek. Van de tien onderzochte gevallen, bleken er twee om fraude te gaan. In de loop van de tijd, vooral door het aanvullen van de data, zal het algoritme steeds slimmer worden. Dat gaan we uiteraard monitoren. Zoals we ook oog houden voor de maatschappelijke impact en de impact voor de eigen organisatie. Maar vooralsnog ben ik positief en zie ik in de toekomst mogelijkheden om het gebruik van algoritmes breder in te zetten. Bijvoorbeeld ter ondersteuning van schuldhulpverlening en re-integratietrajecten.’

Moderne manier

In de gemeente Nissewaard is de score van het eerste kwartaalonderzoek vijf op de tien. Het is nog te vroeg om een sluitende verklaring te geven voor het verschil in score ten opzichte van WIL. Totta data lab is constant bezig de algoritmes te onderzoeken en te verbeteren. Deze updates zorgen ervoor dat de verschillen verdwijnen en uiteindelijk iedereen de nauwkeurigste voorspelling ontvangt. Jason Schipper, beleidsadviseur Inkomen bij de gemeente Nissewaard: ‘Onze opdracht was om handhaving een nieuwe impuls te geven. We zijn onze dienstverlening aan het digitaliseren en daar past een moderne manier van onderzoeken bij. Met de technologie van nu. Kijk naar de verzekeraars: zij kijken naar risico’s en gaan ook niet elke verzekerde bevragen. Wij verstrekken nu ruim 2700 bijstandsuitkeringen. Jaren geleden controleerden we halfjaarlijks en ongericht via algemene hercontroles. Dat betekende een enorme aanslag op de capaciteit van handhavers en cliëntmanagers, met relatief weinig resultaat. Bovendien werden door de opzet van die onderzoeken werkelijk alle cliënten lastiggevallen. Ook diegenen die door omstandigheden logischerwijze niet eens zouden kunnen frauderen, zelfs wanneer ze dat zouden willen. Nu kijken we naar het gepseudonimiseerde bestand wanneer we dat terugkrijgen van Totta en onderzoeken periodiek de eerste tien op rechtmatigheid. De onderzoeken worden door specialisten verricht, om de kans dat we fraude over het hoofd zien zo klein mogelijk te maken. Daarnaast onderzoeken we natuurlijk nog altijd de fraudesignalen die ons bereiken en onderzoeken we op basis van fraudethema’s om te variëren en de pakkans zo hoog mogelijk te maken.’

‘Het eerste kwartaal leverde dus een score op van vijf daadwerkelijke fraudegevallen op tien onderzoeken. Binnenkort volgt het tweede kwartaal en ik ben benieuwd wat daar uitkomt, want inmiddels zijn de datasets weer uitgebreid en aangepast. Een bepaald signaal kan bijgeplust zijn (groter risico), maar ook kleiner zijn gemaakt. Tot slot wil ook ik benadrukken dat de computer geen besluiten neemt. En dat we uitsluitend data gebruiken die onder de Participatiewet vallen. Net als voorheen. Uiteraard hebben we dit besproken met de cliëntenraad, we kennen de argwaan rondom dit thema – begrijpelijk in dit tijdperk – en hechten eraan om dit in alle transparantie te doen. De bottomline is: het algoritme wordt wel steeds wijzer, maar het nemen van beslissingen blijft mensenwerk.’

door: Quita Hendrison