Rapport 2018-5

Leder den riskbaserade urvalsmetoden till likabehandling? 111 De slumpmässiga och riskbaserade urvalen är två olika modeller för att hitta felaktigheter. Båda baseras på en gissning av vilka ärenden som är felaktiga. Den slumpmässiga urvalsmetoden använder inte någon bakgrundsinformation vilket den riskbaserade urvalsmetoden gör. Att slumpmodellen inte använder någon bakgrundsinformation innebär samtidigt att den avspeglar den faktiska fördelningen av fel i populationen. Den informationen är ovärderlig för den fortsatta analysen, vilken inte kunnat genomföras annars. Tabell 8 redovisar fördelningen för olika individegenskaper i de två urvalsmetoderna. Tabell 8. Fördelning av individegenskaper i slumpmässigt och riskbaserat urval Variabel Slump Riskbaserad Differens p-Värde Andel kvinnor 0,561 0,675 0,114 <0,001 Andel med utländsk bakgrund 0,237 0,432 0,195 <0,001 Genomsnittlig SGI 353 400 282 200 −71 300 <0,001 Genomsnittlig ålder 38,4 35,1 −3,24 <0,001 Andel med eftergymnasial utbildning 0,466 0,206 −0,26 <0,001 Källa : Försäkringskassan, ISF:s bearbetningar Det finns statistiskt säkerställda skillnader mellan det riskbaserade och slumpmässiga urvalen i fördelningen av individegenskaper. Detta är förväntat om risken att göra fel inte är jämnt fördelad mellan personer med olika personegenskaper. Följande exempel förtydligar: Anta att det bara är kvinnor som gör fel. Slumpurvalet gör ingen selektering på kön utan kommer att hitta den andel kvinnor som finns i populationen. Ett riskbaserat urval som försöker att rikta in sig mot felaktigheter skulle däremot ha en mycket stor andel kvinnor i sitt urval om urvalet är träffsäkert. Detta är orsaken till att fördelningen kan skilja sig mellan slumpurvalet och det riskbaserade urvalet, när vi inte grupperar efter faktiska felaktigheter. För att undvika att jäm- föra äpplen och päron är det lämpligare att begränsa jämförelsen till att studera fel direkt.