Arbetsrapport 2018-1

27 I fallet som vi beskriver ovan följdes kön upp i olika omfattning. Det beror på att kvinnor i genomsnitt har lägre löner vilket även de som lämnar in felaktiga underlag tenderar att ha. Genom att inkludera kön i analysen minskade omfattningen av denna skevhet i de modeller där inkomst använ- des som förklarande variabel. Det är dock inte säkert att skevheten elimi- nerades helt. 5.3 Även valet att inte kontrollera är ett val Företrädare för Försäkringskassan framför argumentet att riskbaserade urvalsprofiler inte är ett maskinellt beslut, eftersom det är en handläggare som gör uppföljningen. Detta är korrekt när det gäller dem som väljs ut för uppföljning. Men beslutet att inte bli utvald för kontroll är ett maskinellt beslut, utan handläggarinsyn. Det innebär att ärenden på oklara grunder lyfts bort från risken att kontrol- leras. Därmed finns fortfarande ett indirekt maskinellt beslut som kan vara mer eller mindre skevt. 5.4 Urval i proportion till risk Att begränsa urvalet till de med högst risk ökar träffsäkerheten, men det minskar i vilken utsträckning personer behandlas lika, även för en korrekt specificerad kausal modell. Det kan vara så att myndigheter behöver ge visst avkall på träffsäkerheten för att garantera att alla löper en viss risk att bli uppföljda. Ett sådant sätt är att kontrollera personer i proportion till sin bedömda risk, i stället för att ta de personer med högst risk. På så vis bevaras den stora fördel som finns med slumpmässiga urval, det vill säga att alla personer löper en risk att bli kontrollerade, men att kontrollerna i större utsträckning riktas dit där sannolikheten är högre jämfört med slumpmässiga urval. Det finns många olika metoder att stratifiera urvalet. Så länge som urvalet fortfarande är slumpmässigt draget inom varje stratum och tillräckligt stort för att uppnå statistisk signifikans går det att återskapa de fördelningar av felaktigheter som finns i hela populationen. 5.5 Träffsäkerhet måste vägas mot rättssäkerhet Genom att arbeta fram en kausal modell går det att konstruera modeller som är mer eller mindre fria från snedvriden uppföljning. Men träffsäker- heten kan bli lidande, vilket dock vägs upp av att rättssäkerheten samtidigt blir större. Men det finns en alternativ väg om det går att identifiera de variabler som bör ha betydelse för utfallet, exempelvis förekomst av läs- och skrivsvårigheter som antogs vara betydelsefull i simuleringen ovan men inte möjlig att mäta. Variabler som är korrelerade med variabeln som inte kan mätas men inte korrelerade med någon personegenskap som är känslig i ett likabehandlingsperspektiv kan användas som instrumentvariabler. Det skulle exempelvis kunna vara någon form av testresultat som indikerar språkkunskaper. Detta kräver emellertid en genomtänkt kausalitetsmodell, vilket också är en av huvudslutsatserna från analysen.

RkJQdWJsaXNoZXIy NjAyMDA=