Datajournalistik och Centerpartiet

Datajournalistik eller databasjournalistik har fått allt större uppmärksamhet på senare tid, både som begrepp och som form av journalistik. Definitionen varierar något, men något förenklat avses journalistik som baseras på insamling och analys av data (se t.ex. SVT Pejls förklaring). Det ligger med andra ord väldigt nära den kvantitativa analys som bedrivs vid exempelvis universitet och myndigheter. Möjligen ligger en skillnad i att det enskilda fallet kan vara av större intresse inom journalistiken än inom annan analys, där generaliserbarhet ligger i fokus.

Det är en intressant utveckling. Det finns mängder med tillgängliga datamaterial som inte har analyserats ingående, och de blir allt fler. Säkerligen finns ett otal intressanta journalistiska uppslag att finna i dem. Och de kan nog i många fall användas för att ge ytterligare stöd åt en påbörjad undersökning. Med den enkla tillgången till datamaterial via internet och nya verktyg (även i gratisversioner) för att analysera och visualisera dessa material skapas nya möjligheter.

Samtidigt väcks ett antal frågor. Analys kräver ofta kunskap om både ämne och metod, och det är lätt att det blir fel. Det händer de flesta. Därför är det av vikt att hitta sätt rätta till eventuella felaktigheter. Inom akademin presenteras tidiga versioner av artiklar vid konferenser och andra seminarier och dissekeras på så vis. Dessutom granskas artiklar av anonyma kollegor innan de presenteras i vetenskapliga tidskrifter. Frågan är hur man löser detta vid en redaktion. Där kan man knappast förvänta sig att expertkunskaper kan finnas inom alla områden som bevakas. En besläktad fråga gäller vem som står för analysen – är det den enskilde reporten eller tidningen (eller motsvarande)?

Dessa frågor och några ytterligare aktualiserades i förra veckan genom ett reportage om Centerpartiet i DN (12/1). Tyvärr verkar inte artikeln finnas fritt tillgänglig på DN:s sajt, men en av de intervjuade, Staffan Danielsson, har lagt ut den på sin blogg. I artikeln ingår en analys som journalisterna har gjort själva och som presenteras på följande sätt:

Men Stockholms stad och län, där den liberala falangen är starkast, gick mot strömmen och C ökade i stället.
En körning av Valmyndighetens databas som DN gjort visar att förklaringen till uppgången var moderata stödröster, snarare än på en omsvängning bland centerväljarna: Av de 100 vallokaler där skillnaden för C mellan riksdagsvalet och kommunalvalet var störst, låg 98 i valdistrikt där M fick över 40 procent.

Det är inte glasklart formulerat och det är den enda beskrivning av analysen som ges i artikeln. Fast argumentationen tycks vara att förklaringen till att Centerpartiet i 2010 års riksdagsval ökade i Stockholms kommun och län var moderata stödröster och inte att partiets politik vunnit ökat stöd i dessa områden (vi får utgå från att DN i texten menar omsvängning bland väljarna och inte ”centerväljarna”). I en anslutande faktaruta preciseras slutsatsen tydligare, och av den framgår att moderata stödröster är ”förklaringen” (bestämd form) till C:s uppgång i Stockholm. Jonas Hinnfors, professor i statsvetenskap vid Göteborgs universitet, är citerad i artikeln och bekräftar slutsatsen och säger att den ”visar att det handlar om stödröstande moderater” (i en diskussion på Twitter är han lite mer tveksam och framför att mer analys behövs).

Men presenteras det i texten några tunga argument för den tolkning som förs fram? Det är ett märkligt upplägg på den analys som presenteras (varför bara kolla 100 distrikt, varför jämföra med just 40 procents stöd för M, osv?). Om vi ser till alla valdistrikt verkar det finnas ett samband mellan å ena sidan skillnaden i stöd för C i riksdagsvalet och kommunvalen 2010 (i procentenheter) och å andra sidan stödet för M, se diagrammet nedan (varje punkt är ett valdistrikt). Men det är inte så starkt (r=0.26) och det finns gott om valdistrikt där M är starka och C ändå gör ett sämre val till riksdagen än till kommunfullmäktige.

c_diff_m

Även om vi skulle köpa den delen av analysen så visar den ändå inte att stödröstning förekommer. Att dra slutsatser om individers beteenden utifrån aggregerade data är en vanlig fallgrop. Det finns ett flertal andra skäl till att någon väljer att rösta på C i riksdagsvalet och ett annat parti i kommunvalet. Man kan tycka att olika partier har bäst partiledare eller program på olika nivåer, etc. Det är inte en orimlig hypotes att det förekom stödröstning på C bland moderater, men analysen visar inte det och om så vore, är det verkligen den enda förklaringen? Låt oss anta, som görs i analysen, att endast röster på C i kommunvalen är de röster som inte är stödröster. Låt oss jämföra resultaten för C 2006 och 2010 i kommunvalen och efter kommun. I diagrammet nedan är varje punkt en kommun och längs axlarna är stödet i de två valen. Punkter som är till höger om den diagonala linjen utgör kommuner där C har gått fram och vice versa. De punkter som motsvarar kommuner i Stockholm har markerats med grön färg. Som framgår av diagrammet är förändringarna små för de flesta kommuner i Stockholms län, men det är ett par som sticker ut. Det är Lidingö (+9,9 procentenheter) och Vaxholm (+ 5,7). Intressant att notera är att i dessa båda kommuner är var 2010 stödet (och ökningen) för C större i valet till kommunfullmäktige än till riksdagen, vilket är svårt att få ihop med DN:s förklaring.

c_diff_0610

Min avsikt är inte här att racka ned på dessa journalister. Det är en i övriga avseenden intressant artikel och jag har läst mycket annat bra av dem tidigare. Det är möjligt att det finns mer resultat som de inte presenterar (alternativt att jag har missförstått det som presenteras). Ett visst ansvar faller även på dem som kommenterar statistiska resultat. Vidare är det bra om journalister blir bättre på analys och statistik (se exempelvis den till stora delar undermåliga rapporteringen av opinionsmätningar). Men det förefaller finnas mer att göra kring för att säkra kvaliteten. Det är olyckligt om illa underbyggda slutsatser får färga debatten.

För den som är intresserad av analys av data startar i morgon en gratis kurs via Coursera (möjligen lite krävande för nybörjare), se här.

En tanke på “Datajournalistik och Centerpartiet

  1. Pingback: Senaste länkarna, vecka 6 2013 // Anna Norberg

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com-logga

Du kommenterar med ditt WordPress.com-konto. Logga ut /  Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut /  Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut /  Ändra )

Ansluter till %s