Lucka #2: Kärleken till svenska data

”Gotta love that Swedish administrative data!” Den kärleksförklaringen yttrades av Sarah Kliff i ett avsnitt tidigare i år av den utmärkta amerikanska podcasten the Weeds från Vox. Det finns många podcasts som fokuserar på amerikansk politik, men det som särskiljer the Weeds att är de dyker djupt ned i olika politiska förslag och diskuterar vad olika reformer skulle få för följder. I varje avsnitt presenterar de dessutom ett working paper som innehåller nya, spännande resultat från den samhällsvetenskapliga forskningen. Ofta tar de upp något working paper från the National Bureau of Economic Research (NBER), så även i det avsnitt då svenska administrativa data hyllades. Det papper som avhandlades studerade vilka effekter stress hos en gravid kvinna får på fostrets framtida liv.

Det är inte etiskt försvarbart att i forskningssyfte utsätta någon i en sådan situation för stress, men genom att nyttja omfattande svenska registerdata kunde författarna hitta kvinnor som under sin graviditet hade en nära anhörig som avled, vilket kan antas skapar stress. Dessa registerdata gör det även möjligt att följa barnets uppväxt och vuxna liv för att studera vilka hälsoeffekter sådan stress orsakar. Studien visar att stress under graviditeten har effekt på barnets framtida mentala hälsa. Bakom studien står den svenska nationalekonomen Petra Persson och hennes kollega Maya Rossin-Slater (artikeln har accepterats för publicering i den prestigefyllda tidskriften American Economic Review*, den kan läsas här och mer om Petra Persson och hennes forskning kan läsas här och här).

Detta exempel är en del av en en mer omfattande trend. Svenska samhällsvetare har blivit allt bättre på att använda sig av de närmast unika möjligheter som svensk registerdata ger upphov till. I de topprankade internationella statsvetenskapliga tidskrifterna har på senare år publicerat ett stort antal artiklar som är skrivna av svenska forskare (både statsvetare och nationalekonomer) och baseras på svenska data. Det är en stor förändring mot hur det såg för några årtionden sedan. Till viss del beror det på att det inom dagens statsvetenskap tillmäts större betydelse att publicera sig i internationella tidskrifter än vad som var fallet förr, men det beror säkerligen också på att svenska data ger goda möjligheter att svara på många av de forskningsfrågor som ställs inom samhällsvetenskapen. I takt med att tillgången till data förbättrats, statistiska metoder utvecklats och datorer blivit mer kraftfulla har dessa möjligheter dessutom förbättrats. I ett internationellt perspektiv ger den svenska kombinationen av individuella personnummer och ett väl utbyggt system för registerstatistik ger fantastiska förutsättningar för forskning.

big_data

Foto: Luckey_sun.

Finns det potential att nyttja data än bättre inom svensk forskning? Man kan tänka sig många olika åtgärder som skulle kunna ha en sådan effekt. Det kan göras mer inom svensk forskarutbildning för att bättre rusta forskare med de kunskaper som krävs för att använda data i allmänhet och registerdata i synnerhet. Forskningsmedel kan avsättas för att digitalisera data som i dag inte finns i elektronisk form. Myndigheter kan bli bättre på att tillgängliggöra deras data (och leva upp till PSI-direktivet). Vissa myndigheter gör ett utmärkt arbete med i det avseendet (och beslutande församlingar, som exempelvis Sveriges riksdag, se här), medan andra är betydligt sämre. SCB är naturligtvis en nyckelaktör i sammanhanget och Riksrevisionen genomför just nu en granskning av förutsättningarna att kunna använda SCB:s mikrodata för forsknings- och statistikändamål.

En ytterligare aspekt som fångade min uppmärksamhet för ett tag sedan gäller alla de urvalsundersökningar riktade till befolkningen som genomförs på uppdrag av kommuner, landsting och andra myndigheter. Jag fick reda på att en av länsstyrelserna hade genomfört en stor enkätundersökning där frågor om tillit hade ställts. I ett projekt jag arbetade med då var vi intresserade av sådana data, så jag kontaktade denna länsstyrelse med en begäran om att få ut materialet. Det visade sig dock att de inte kunde lämna ut dessa data, då de inte hade informerat respondenterna om att materialet kunde lämnas ut till forskning.

Det var säkert en korrekt bedömning. Men de borde ha kunnat genomfört studien på ett sätt som hade möjliggjort utlämnande av data. Då skattepengar finansierar dessa undersökningar och skattebetalare lägger tid på att besvara dem borde det insamlade materialet användas så långt möjligt, vilket inkluderar att tillgängliggöra det, om möjligt fritt till alla intresserade, men om det innehåller känsligare uppgifter åtminstone till forskare (statistiksekretessen skyddar materialet som finns inom universitet). Varför inte införa en nationell policy som tydliggöra att alla myndigheter som genomför enkätundersökningar riktade till allmänheten ska tillgängliggöra det insamlade datamaterialet för forskning? Förslagsvis kan materialet lagras hos Svensk Nationell Datatjänst (SND) i Göteborg. På så vis kanske även data från svenska urvalsundersökningar kan erhålla amerikanska kärleksförklaringar framöver.

* Det har riktats viss kritik mot artikeln inte uppmärksammade en del tidigare forskning baserad på samma datamaterial och att bidraget därmed inte var så originellt som det först framställdes som. Den debatten ligger utanför vad som tas upp i det här blogginlägget, men den intresserade kan läsa mer här.

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut / Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut / Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut / Ändra )

Google+ photo

Du kommenterar med ditt Google+-konto. Logga ut / Ändra )

Ansluter till %s