Arbetsrapport 2018-1

25 personer i proportion till sin bedömda risk. 19 Detta är ett sätt att genomföra stratifierade urval. På så vis bevaras slumpmässigheten, det vill säga att alla personer har en risk att bli kontrollerade, men att kontrollerna i större utsträckning riktas dit där sannolikheten är högre jämfört med slump- mässiga urval. Som förväntat sjunker träffsäkerheten som en följd av det stratifierade urvalet (se tabell 4). I samtliga fall är emellertid fördelningen mindre skev än i fallet med modellerna som enbart arbetar med dem som har högst sannolikhet. Metoden kommer däremot inte helt tillrätta med den sned- vridning som kan uppstå genom en felaktigt specificerad modell, men riskerna är betydligt mindre. Även i en sådan procedur behöver man således tänka igenom kausaliteten, det vill säga att fånga in den faktiska orsaken till varför ett ärende blir felaktigt. Ur ett rättssäkerhetsperspektiv finns det en betydande fördel i att alla ärenden har en viss risk för att bli uppföljda. Försäkringskassan skulle också kunna laborera med urvalsproceduren och välja att följa upp dem med särskilt högt poängvärde och för övriga tillämpa metoden att kon- trollera i proportion till riskvärdet. Det är betydelsefullt att behålla en slumpmässighet i kontrollen både för att kontinuerligt kunna uppdatera ML-modellen och för att medborgare ska uppfatta kontrollen som reell. Tabell 4. Träffsäkerhet och test för lika förutsättningar respektive lika- behandling, urval i proportion till risk Lika förutsättningar Likabehandling Modell- namn Specifikation Träff- säkerhet Andel för Differens (procent) p- Värde Differens p- Värde a) Slumpmässig 30,5 0,71 25,7 0,283 0.0 . b) Z 48,9 0,69 7,2 0,631 0,2 0,841 c) X 43,8 0,78 6 0,718 6,8 0 d) A,B 30,4 0,69 -2,4 0,906 -0,5 0,689 e) A,B,X 47,1 0,73 -2 0,888 2,9 0,007 f) B,X 44,8 0,81 88,1 0 8,8 0 g) A,Z,B,X 47,1 0,69 11,1 0,513 0,0 . h) X,W1,W2 42,6 0,77 26,5 0,179 5,2 0 i) A,B,X,W1,W2 45,4 0,72 10,4 0,542 1,9 0,089 j) A,B,W1,W2 36,0 0,68 -4,3 0,794 0,1 0,92 k) B,X,W1,W2 43,9 0,79 30,1 0,111 7,7 0 l) W1,W2 38,3 0,70 28 0,175 0,7 0,549 19 Principen är följande: Bestäm den mängd ärenden som ska följas upp, t.ex. 1 000 ärenden. Sortera alla ärenden slumpmässigt. Välj sedan ut personer en efter en, från första ärendet på den slumpmässiga listan, givet att de uppfyller kravet att deras riskvärde är högre än ett slumpvärde mellan 0 och 1. Proceduren stoppas då 1 000 ärenden har valts ut. Det betyder att en person som står på tur och har riskvärde 0,9 kommer att väljas ut med 90 % sannolikhet. En person som står på tur med ett riskvärde på 0,1 kommer att väljas ut med 10 % sannolikhet.