Arbetsrapport 2018-1

10 för alla y och varje värde som kan anta. Likabehandling : Riskbedömningen anses behandla personer lika om den demografiska profilen (exempelvis andel kvinnor) för de faktiska fel som upptäcks i ett riskbaserat urval har samma proportion som för de faktiska felen i det representativa urvalet ( ∣ ^ = 1, = 1) = ( ∣ ^ = 1, = 1) Dessa alternativ fokuserar på olika saker. Den första metoden är den enklaste att tillämpa men den kan ge godtyckliga effekter, eftersom ute- lämnande av diskriminerande variabler ibland kan orsaka diskriminering. 6 Detta uppstår om utfallet förklaras av en variabel som är beroende av den diskrimineringsgrundande variabeln. Teorin om kausal inferens visar på ett entydigt sätt att om vi har ett kausalt orsakssamband där , alltså en egenskap som inte är tillåten att sortera på , påverkar en annan förklarande variabel och sedan ger utfallet , så räcker det inte att lyfta bort den variabeln från analysen. Den sorterande effekten kommer att upp- stå ändå, eftersom ändras om förändras, vilket alltid kommer att vara fallet för olika värden på . 7 Om däremot inte påverkar utan har en direkt effekt på utfallet , så uppstår inte någon sorterande effekt av . Även om Försäkringskassan, utifrån strategiska överväganden, inte avslöjar vilka variabler som ingår i den statistiska modellen finns det skäl att lyfta fram att det finns risker både med att inkludera och exkludera vissa variab- ler i modellen. Utfallet är inte givet utan beror på kausaliteten i den under- liggande datagenererande processen. 8 Att lyfta bort variabler med den typ av argument som sker enligt metoden rättvisa genom ovetskap har risker. Det finns emellertid tester som kan användas. De följande fyra metoderna är olika sätt att definiera vad som kan betrak- tas som sorterande effekter och utifrån den valda definitionen testa om det finns skillnader. Samtliga skulle kunna tillämpas för att testa om rättvisa genom ovetskap är en godtagbar strategi. I metoden demografisk jämlikhet räknas andelarna av ett utfall för en egenskap som vi inte vill sortera på utan att ta hänsyn till några andra personegenskaper. Metoden är enkel att tillämpa och ger vanligtvis tolk- ningsbara resultat. Dwork m.fl . (2012) invänder mot metoden eftersom den i princip går att manipulera och att det kan finnas skillnader i exempel- vis intresse mellan olika grupper. De lyfter också fram risken att inte alla grupper är kvalificerade för ersättning även om de söker. Men i den kontext som Försäkringskassan verkar finns det inget värde i att justera urvalen så att modellen framstår som rättvis utan att vara det. Eftersom urvalsprofiler redan från början arbetar med personer som har ett gemensamt intresse att få ersättning så blir den skevhet som finns i uttagsmönstren inte sned- vridande vid användning av måttet. Däremot skulle den kunna bli det uti- från kvalifikation, om det är så att en viss del av det som diskvalificerar en person för ersättning upptäcks som felaktigheter vid uppföljningen. Med 6 Se exempelvis Kusner m.fl. (2017). 7 Pearl (2009), Elwert (2013), Morgan och Winship (2015), Pearl, Glymour, och Jewell (2016). 8 Se mer om den datagenererande processen i nästa avsnitt.