Vad menas med representativa urval?

Det är valår och uppmärksamheten kring opinionsundersökningar är stor. På senare år har nya inslag uppenbarat sig på opinionsmätarscenen. Det handlar bland annat om webbmätningar riktade till specifika paneler, vilka är konstruerade på mer eller mindre sinnrika sätt. Oavsett typ av undersökning finns det ofta med en försäkran om att urvalet är representativt. Ibland är det mer preciserat, som exempelvis att urvalet är representativt för svenska folket över 18 år eller att det är ett ”riksrepresentativt urval”. Det låter onekligen bra. Vem vill inte ha ett representativt urval? Och en del som tar plats i debatten hävdar det är en förutsättning för att trovärdiga slutsatser ska kunna dras. Men vad är egentligen ett representativt urval?

Ja, det är en bra fråga. I statistiken är ”representativt urval” inte något etablerat eller entydigt begrepp. Teorierna för urvalsundersökningar baseras i stället på något som benämns sannolikhetsurval. Med det menas att varje person i den population för vilken man vill dra slutsatser om, har en känd sannolikhet för att ingå i urvalet och att den sannolikheten är större än noll. Den sistnämnda delen innebär om man vill dra slutsatser om en grupp ska alla i den gruppen ha en chans att bli utvalda att ingå i undersökningen. Däremot behöver inte alla ha samma sannolikhet att bli valda. Det är ofta mer effektivt att välja personer med olika sannolikhet. Det innebär inte något problem, utan det hanteras enkelt med hjälp av vikter när man senare tar fram resultat för undersökningen.

Men om det är sannolikhetsurval, vad är då representativa urval? Den gamle statistiknestorn Jan Wretman sa vid ett seminarium för några år sedan att han trodde att det var ett begrepp som icke-statistiker använde när de gjort något som inte var statistiskt sett sunt. Men begreppet är inte någon nymodighet. År 1979-1980 ägnade statistikerna William Kruskal och Frederick Mosteller hela fyra artiklar i tidskriften International Statistical Review åt att reda ut vad avses med representativa urval (I, II, III och IV). I dessa artiklar går de igenom hur begreppet används i icke-vetenskaplig litteratur, vetenskaplig litteratur och framför allt i statistisk litteratur. Dessutom gör de en historisk tillbakablick över hur begreppet har använts genom olika tider.

I sin genomgång finner de att de sätt som begreppet används på kan i huvudsak delas in i sex olika kategorier.

  1. En generell försäkran om att data håller god kvalitet. Detta dock utan ge särskilt mycket stöd för att så skulle vara fallet.
  2. Frånvaro av snedvridande faktorer vid urvalsförfarandet. Även det är i sig, som Kruskal och Mosteller påpekar, minst sagt vagt.
  3. En miniatyr av populationen. Det vill säga att det urval som har dragits liknar den population för vilken man vill uttala sig för, åtminstone i de avseenden som är relevanta (det mest relevanta avseendet är dock med avseende på det man avser att mäta och det kan man normalt sett inte veta, för om man visste det vore det föga mening att genomföra undersökningen).
  4. Urvalet är typiskt för populationen. Även i denna kategori tenderar beskrivningarna att bli vaga, men de tycks avse att de utvalda ska, i något avseende, vara typiska för den population som man vill uttala sig för. Som Kruskal och Mosteller anför är det dock svårt att veta vad som avses med det – det är svårt för varje utvald person (eller motsvarande) att i sig vara typisk för populationen och om det är urvalet i sin helhet som ska vara typiskt så innebär det att urvalet är en miniatyr av populationen, vilket var punkt 3.
  5. Urvalets täckning. Till denna kategori hör olika argument om att så många skilda delar av populationen som möjligt ska ingå i ett urval. Det leder tankarna till icke-slumpmässiga urval, även om man naturligtvis kan tillgodose detta på andra sätt, exempelvis genom sannolikhetsurval som stratifieras.
  6. Slutligen hade Kruskal och Mosteller en kategori för olika vaga användningar av begreppet, mer vaga än hur de som ingick i övriga fem kategorier.

Utöver dessa kategorier finner Kruskal och Mosteller även att en del använder begreppet som en synonym till slumpmässigt urval. Med alla dessa varianter är det är  inte förvånande att de till slut lutade sig mot en av surveystatistikens fronfigurer, Leslie Kish, som förespråkade att begreppet inte borde användas alls.

Så vetenskapen ger oss ingen klarhet i vad som kan avses med representativa urval, eller snarare så ger den oss insikten att begreppet kan avse en lång rad olika former av urval, inklusive en hel del mindre lyckade varianter. Kan man då resonera sig fram till vad som kan avses? Begreppet ”riksrepresentativt urval” tycks avse att urvalet i något avseende liknar hur det ser ut i hela landet, även om det i många fall inte är preciserat att så är fallet. Och framför allt är det oklart om man menar att urvalet liknar hela landet före eller efter att det har justerats med vikter.

Om det är det senare som gäller säger det egentligen inte så mycket alls. Exempelvis kan jag då fråga tusen personer på Östermalm och sedan vikta det urvalet så att fördelningen efter ålder och kön är samma som i hela landet, och därefter kalla mitt urval för riksrepresentativt (med avseende på ålder och kön). Däremot är det inte något bra sätt att dra urval om man vill uttala sig om hela landet (SVT verkar dock gilla att intervjua personer på Östermalm för att fånga ”mannen på gatan”, men det är en annan fråga).

Då begreppet representativa urval saknar en tydlig och enhetlig innebörd ger det ingen trygghet om att en undersökning har genomförts på ett sätt som möjliggör slutsatser (Wretman menade att det var en indikation på det omvända). Det vore därför välkommet om alla opinionsinstitut och andra som genomför urvalsundersökningar kunde tydligt och utförligt redovisa hur de har valt ut de personer som ingår i det urval som undersökningen baseras på. Alternativt kunde de tidningar som publicerar opinionsmätningar kräva att en sådan redovisning fanns. Man kan tycka att det borde vara till hjälp för alla dessa personer som i tidningarna sedan ska kommentera undersökningarnas resultat. En sådan redovisning gör att man samtidigt kan passa på att sluta använda det vilseledande begreppet ”representativt urval”. Och varför inte börja redovisa bortfallen på samma gång?

One thought on “Vad menas med representativa urval?

  1. Ping: Hur populärt är SD? | Om makt och politik

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut / Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut / Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut / Ändra )

Google+ photo

Du kommenterar med ditt Google+-konto. Logga ut / Ändra )

Ansluter till %s