Tallenes alenegang

Artikkelen er også publisert på Dagbladet-bloggen.

Tre av fire sa ja til olje utenfor Lofoten og Vesterålen

meldte NRK Nordland i en tweet 4. november, og brukte resten av sine tilmålte 140 tegn på å be leserne på Twitter stemme for å si sin mening om spørsmålet. Man måtte dermed klikke seg inn i selve artikkelen for å skjønne at dette ikke var snakk om verken tre av fire i befolkningen eller tre av fire som bor i de aktuelle områdene, men kun tre av fire deltagere på næringslivskonferansen Agenda Nord-Norge.

Etter at denne temmelig vesentlige presiseringen ble påpekt av undertegnede, var NRK fortjenstfullt kjapt med å slette sin villedende tweet. Og selve artikkelen gjør det veldig klart at denne oppslutningen er innenfor en utvalgt gruppe og ikke for befolkningen som helhet (inklusive påpekning av at nasjonale og regionale meningsmålinger viser helt andre resultater, samt diskusjon om hvorvidt konferansen engang var representativ for nordnorsk næringsliv).

Men overskriften på nettforsiden fortsatte å snakke om «tre av fire» uten å forklare hvem man hadde spurt. Ingressen gjorde det riktignok tydelig at denne fordelingen var i utakt med befolkningen, og at det derfor måtte være snakk om en eller annen undergruppe, men vi får ingen indikasjon eller hint om hvilken gruppe det dreier seg som. Jeg opplever personlig at det er uhyre begrenset informasjonsverdi (selv til overskrift å være) å bli fortalt at «Tre av fire blant en eller annen gruppe mener X«, og så måtte gå inn på artikkelen for å finne ut om dette gjelder for avgangselever på BI, eller medlemmer av Frps stortingsgruppe, eller ansatte i Statoil, eller peruvianske oljeanalytikere.

Så kan man selvsagt si at dette var bare én håpløst sløvt formulert tweet, og én overskrift som – i likhet med mange nettoverskrifter – ikke gjør en veldig god jobb med å formidle sakens kjerne. Tilsvarende kan man skylde på plassmangel i tittelen når Nettavisen, i kjølvannet av Köln-overgrepene, bruker tittelen «Asyldebatten i Tyskland: – 40 prosent begår lovbrudd innen ett år» – og du må klikke deg inn på artikkelen for å finne ut at dette tallet slettes ikke gjelder for alle asylsøkerne, men kun for bestemte landgrupper. 40% av algeriere, marokkanere og tunisiere (tilsynelatende alle slike innvandrere, ikke kun asylsøkere) som ankom Köln-området i 2014 hadde begått (hovedsakelig mindre) kriminalitet innen ett år – men for de viktigste asylsøker-landgruppene var tallene massivt lavere (0,6% for syrere og afghanere, 2-4% for irakere og iranere).

Se på dette spennende tallet!

Men det er også fristende å se dette som en del av en større trend, der tall behandles og omtales som om de har en selvstendig nyhetsverdi – selv når de presenteres i helt løsrevet form uten noen kontekstualisering eller beskrivelse av hva tallet egentlig måler.

Mange artikler som bruker tall i feil betydning er til en viss grad tilgivelige, fordi de korrekt gjengir det som faktisk er oppgitt i en eller annen kilde, men ikke har foretatt det nødvendige dypdykket i den bakenforliggende metodikken for å finne ut at man egentlig har målt noe ganske annet enn det som oppgis i konklusjonen.

Andre ganger tillegger man tall en helt feil betydning ved å skrive at «56% av befolkningen svarer at de ____«, selv om man bare trenger å lese spørsmålsformuleringen for å oppdage at det var noe helt annet folk faktisk ble spurt om.

Noen ganger begår man en ren lapsus ved at man simpelthen henter ut feil tall fra kilden – som når Dagsnytt attens programleder fortalte lytterne at Norge «selger varer og tjenester til militære formål for om lag 3,4 milliarder [pr. år] til Saudi-Arabia» og måtte korrigeres over bordet av opptil flere gjester som påpekte at han nok mente millioner og ikke milliarder. (At det ikke bare var en ren forsnakkelse, ble klart når programleder responderte med «her [i denne NTB-meldingen] står det faktisk milliarder» før han lot det fare og gikk videre i debatten.)

At man avstår fra å forsøke å oppklare en slik tallfeil midt i direktesending (særlig når tallet ikke var avgjørende for saken man diskuterte), er høyst forståelig. Men etter alt å dømme baserte man seg på denne NTB-meldingen, der det fremgår helt uttrykkelig og utvetydig allerede i ingressen at Norges militæreksport til Saudi-Arabia i 2014 var på 3,7 millioner kroner, mens 3,4 milliarder kroner er Norges totale militæreksport i 2014. Da fremstår det som i overkant svakt å ikke klare å finne det riktige tallet til bruk i sendingen.

Når grunnleggende premisser utelates

Men i slike tilfeller har man i hvert fall forsøkt å forklare leseren premisset for tallene, selv om man ender opp med feil premisser pga. misforståelser og forenklinger. Og så feil som dette blir, er det tross alt hakket mer tilgivelig enn når man (som i de to innledende tittel-eksemplene) utelater premisser som åpenbart er helt essensielle for å kunne gi tallene noen som helst fornuftig mening.

De fleste av oss ble innprentet allerede i mattetimene på barneskolen at når vi skal regne ut praktiske eksempler (hvor fort kjører bilen, hvor langt er tauet, hvor mye koster disse varene?), så er det essensielt å ikke bare bruke de riktige tallene, men også inkludere korrekte enheter. Å oppgi at «Petter trenger 150 vann til oppskriften» eller at «Bonden kan gjerde inn et område som er opptil 37,5 stort«, gir ingen som helst mening.

Men likevel presenteres avislesere nå med ujevne mellomrom for helt løsrevne tall, som mangler grunnleggende basisinformasjon av typen «Hvilken gruppe har man sett på?» eller «Hva slags tidsperiode er det snakk om?»

Noen ganger kan det oppfattes som en ren forglemmelse fra journalistens side – som når VG forteller oss at «[Tall fra UDI] viser at ved utgangen av oktober var 1507 personer forsvunnet fra norske asylmottak» – uten å fortelle oss at telleperioden startet i januar samme år. Her er det sikkert mange som vil naturlig anta at det er dette som menes (selv om opptil flere personer jeg har snakket med ikke har sett dette som den mest nærliggende tolkningen, men har antatt at det er snakk om et lengre tidsrom), men det er like fullt en spesifisering som åpenbart burde vært inkludert i artikkelen.

Andre ganger presenterer man opplysninger som er teknisk sett «korrekte», men der mangelen på presiseringer gjør det fullstendig umulig for noen leser å forstå ting riktig med mindre de kjenner fakta på forhånd: For eksempel når Aftenposten skriver om at «I Danmark får personer med innvilget asylsøknad 5945 kroner i måneden» mens «I Norge er beløpet 15.011 kroner» – uten å nevne (annet enn én linje, tilføyd i etterkant helt nederst i en lang artikkel) at de to beløpene ikke er oppgitt i samme valuta, men i henholdsvis norske og danske kroner.
(Hvorpå andre Aftenposten-journalister igjen refererte til disse beløpene som «lommepenger» til «asylsøkere«- til tross for at dette er introduksjonstønaden som utbetales for å dekke alt livsopphold for flyktninger som har fått innvilget asyl og blitt bosatt ute i kommunene.)
Man smykker seg med å fremsette presis faktainformasjon i form av eksakte tall (nøyaktig på kronen) – men er langt mindre opptatt av å forklare korrekt hva tallet faktisk viser.

Hvor lang er en «lang tidsperiode»?

I oktober fikk NRK mye oppmerksomhet for sitt «flyktningregnskap», der de regnet ut at «Flyktningene kan koste 750 milliarder kroner«, basert på prognoser over den totale asyltilstrømningen for perioden 2015-2017.

Dette tallet (eller det enda mer ‘eksakte’ 767 milliarder) har blitt jevnlig brukt i den videre debatten, senest av FpUs Atle Simonsen på Politisk kvarter tidligere denne uken. Simonsens bruk av tallet er også typisk, ved at han han sier at 100.000 asylsøkere vil «ha en kostnad for samfunnet på samfunnet på 767 milliarder» uten noen annen utdyping av hvilke konkrete kostnader det er snakk om. Heller ikke i NRKs hovedoppslag om utregningen gis det noen nærmere spesifisering hva som menes med den «totale regningen» og «langtidskostnadene«.

Hovedoppslaget inneholder derimot en godt synlig lenke til en egen artikkel der de i (relativt stor) detalj går gjennom regnestykket trinn for trinn. Dette er i utgangspunktet et forbilledlig tiltak fra NRK, og det ville vært svært ønskelig at flere medier gjorde det samme istedenfor å bare henvise svevende til «beregninger [vår avis] har utført». Men det som aldeles ikke er prisverdig, er når en slik detaljert redegjørelse gir kategorisk feilaktig informasjon om hvordan sluttresultatet er regnet ut.

NRK har tatt utgangspunktet i SSBs mye omtalte fremskrivninger av offentlige utgifter/inntekter ved innvandring (for ulike landgrupper). Denne fremskrivningen tar utgangspunkt i at 5.000 innvandrere ankommer Norge i 2015, og hvor mye ekstra skatteinntekter og offentlige utgifter dette genererer frem til år 2100. I dette regnestykket forsøker man altså å ha ta med alle effekter (innenfor de kategoriene av utgifter/inntekter som man ser på) som en slik innvandring utløser innenfor denne tidsperioden – ikke kun knyttet direkte til de 5.000 tenkte personene, men også til de andre- og tredjegenerasjons innvandrerne som er etterkommerne av denne opprinnelige gruppen. Og SSB-forskerne bak rapporten har gjentatte ganger understreket at de altså har gått bredere til verks enn å kun se på hvor mye hver enkelt førstegenerasjonsinnvandrer koster.

Når NRK benytter SSBs tall på 4,3 millioner kroner i nettoutgift pr. person, så er dette altså hvor mye hver enkelt flyktning, og hans eventuelle barn, og deres eventuelle barn, kommer til å koste det offentlige innenfor denne perioden på totalt 86 år. (I tillegg har man oppjustert kostnadene for syrere, ut fra premisset om at de har lavere sysselsetting enn den gjennomsnittlige ikke-vestlige innvandrer.) Men i sin redegjørelse skriver NRK tvert imot (min uth.) at

Beregninger basert på data fra Statistisk sentralbyrå viser at en ikke-vestlig innvandrer i løpet av sin levetid i gjennomsnitt får 4,3 millioner kroner mer i støtte fra staten, enn personen bidrar med i skatt.

– hvilket altså er en kategorisk feilaktig beskrivelse av hva SSB faktisk har beregnet.

Nøyaktig hva som er de faktiske livsløpskostnadene for én innvandrer – uten å ta hensyn til etterkommere – er et spørsmål SSB fortsatt jobber med å finne et fasitsvar på. Men en forenklet utregning (tabell 1 her) viser at en 25-årig ikke-vestlig innvandrer antas å koste (gjennomsnittlig) 1,3 millioner kroner frem til sin død.

SSBs presiserer at dette er bare et tilnærmet resultat, og at det er visse utgiftsposter som ikke er inkludert der og som gjør at de faktiske utgiftene trolig vil bli noe høyere. At man tar utgangspunkt i en person som ankommer som 25-åring, betyr også at utgiftene blir lavere enn de ville vært dersom man også inkluderte barnehage/skole/utdanningsutgifter for en mindreårig flyktning.

Vi kan altså ikke si nøyaktig hvor mye «en ikke-vestlig innvandrer koster staten i løpet av sin levetid» Men når denne tilnærmede beregningen (som inkluderer alle de viktigste inntekts- og kostnadskomponentene) gir en sluttsum på bare 30% av 86-års-kostnaden på 4,3 millioner pr. person+etterkommere, så er det et tindrende klart signal om at det regnestykket som NRK påstår at de har foretatt, ville gitt et svar som er betydelig lavere enn det resultatet de faktisk har regnet seg frem til.

Svaret er korrekt, men hva var spørsmålet?

NRKs sluttsum på 767 milliarder i kostnader for 100.000 asylsøkere er forsåvidt helt korrekt (hvis vi legger deres andre premisser til grunn), og er også er gyldig og relevant perspektiv på langtidskostnadene. Men det hjelper lite at tallet er «korrekt», hvis leserne blir fortalt at dette handler om en mye snevrere utgiftskategori enn hva som faktisk er inkludert i totalsummen.

Selv om NRK ikke hadde kommet med ren feilinformasjon om beregningsgrunnlaget, ville oppslaget fortsatt vært klart mangelfullt. De eneste «intuitive» rammene for en slikt regnestykke over «kostnader for flyktninger», måtte være enten å regne over en «etableringsfase» (ut fra premisset om at de etter X år antas å være etablert i samfunnet på linje med andre) eller over hele flyktningens levetid frem til de dør. Men når man ikke har brukt noen av disse metodene, men isteden bare valgt seg året 2100 som et helt arbitrært sluttpunkt for beregningen, så må man selvsagt også forklare dette for leseren, som ikke har noen sjanse til å skjønne dette av seg selv.

Som SSB selv har påpekt: Når man opererer med kontinuerlige årlige utgifter som ikke dør ut, så kan man i prinsippet oppnå akkurat så stor (eller så liten) sluttsum som man har lyst til, bare ved å forlenge eller forkorte beregningsperioden. Når betingelsene for regnestykket verken er intuitive for leseren, eller har noen logisk årsak (man kunne like gjerne valgt seg år 2095 som sluttpunkt, eller 2105, eller 2242) så blir det helt forfeilet å presentere dette som et fasitsvar om at ‘Dette vil flyktningene koste’.

Og leseren får et svært dårlig grunnlag for å sammenligne dette beløpet opp mot andre offentlige utgifter, når man bare snakker svevende om «langtidskostnader» istedenfor å spesifisere tidshorisonten på 86 år. Kostnadene er utvilsomt betydelige uansett hvordan man ser på det, men det er også mange andre utgiftsposter som eser opp til svimlende høye tall dersom man bare summerer over tilstrekkelig mange år.

Disse innvendingene mot NRKs regnestykke og presentasjon er ikke nye – allerede uken etter oppslaget var Morgenbladets Maria Reinertsen ute med en tilsvarende korreksjon. (Hun påpekte også at SSBs beregningsmetode ikke gir et fullstendig bilde av folks bidrag, ettersom den kun inkluderer innbetalte skatter og avgifter, ikke verdiskapning gjennom arbeidet man utfører.)

Men til tross for denne entydige påpekningen av at NRK har beskrevet premissene for regnestykket på en direkte uriktig måte, er nettartikkelen i skrivende stund (tre måneder senere) fortsatt ikke oppdatert eller rettet – der feilinformeres leseren fremdeles om at dette er kostnadene i løpet av én flyktnings «levetid«.

Selv med min aller beste vilje strever jeg med å tolke dette som annet enn uttrykk for en holdning der prioriteten er å presentere et dramatisk tall for leserne- mens det å gi dem en korrekt forståelse av tallet er av fullstendig underordnet betydning.

OMG! – Forskjellige regnestykker gir forskjellige svar!

Men fenomenet med å slenge ut tall uten nødvendig kontekst begrenser seg ikke bare til overarbeide journalister. I sin mye omtalte kronikk om flyktningkrisen i fjor vår (den gang stridstemaet fortsatt var om Norge skulle ta imot 10.000 ekstra kvoteflyktninger eller ikke), ironiserte professor Terje Tvedt over de mange sprikende anklagene over hvor mye dette ville koste:

Jonas Gahr Støre mente det vil koste rundt to milliarder kroner, departementet har anslått 10 milliarder, Finansavisen minst 44 milliarder. Noen mener det vil koste rundt 70 milliarder.

Leseren sitter igjen med et inntrykk av beregninger som spriker i alle mulige retninger, der politikere opererer med fiktivt lave tall og det er umulig å vite om noen egentlig har begrep om de faktiske kostnader.

Realiteten er imidlertid at alle disse tallene bygger på omtrentlig samme kostnadsanslag. Grunnen til de store forskjellene er – nok en gang – at de er beregnet ut fra ulike tidsperspektiver. Støres 2 milliarder er kostnaden for de to årene (2015 og 2016) hvor man planla å faktisk hente disse flyktningene; departementets 10 milliarder er beregnet over en 5-års periode, og Finansavisens 43 milliarder tar utgangspunkt i SSBs frem-til-2100-fremskrivninger. (Hadde Tvedt hatt lyst til å liste opp enda flere ulike tall, kunne han tatt med NRKs bruk av tallet 20 milliarder for en 10-årsperiode.)

Det er selvsagt legitimt å påpeke at de laveste tallene, som kun ser på et begrenset tidsrom, underkommuniserer de langsiktige totalkostnadene. Men da må man faktisk forklare hvorfor man ender opp med ulike tall i ulike sammenhenger – ikke bare slenge vilt ulike tall opp i luften for skape inntrykk av et totalt beregningskaos. Og ikke bare unnlater Tvedt å forklare at de sprikende summene skyldes at man bruker ulike tidsperspektiver – han impliserer det stikk motsatte, når han eksplisitt sammenligner 5-års-kostnadene for mottak av kvoteflyktninger med årsbudsjettene for hjelp i nærområdene:

All støtte til syv millioner flyktninger koster cirka 10 milliarder, eller like mye som departementets beskjedne anslag sier 10.000 flyktninger vil koste i Norge.

Som Marte Michelet påpekte allerede like i etterkant av kronikken: Man kan selvsagt ikke sammenligne to slike ulike størrelser på denne måten – i hvert fall ikke uten å informere leseren uttrykkelig om at det ‘like store’ beløpet for flyktningmottak i Norge skal dekke utgifter over en mye lengre tidsperiode. Men i en diskurs der tallene får lov til å råde grunnen alene, blir slike essensielle premisser i beste fall henvist til fotnoter – eller til «oppklarende» artikler i ettertid, som får bare en brøkdel så stor spredning som de opprinnelige påstandene.

Djevelen er i detaljene – og i premissene

Nylig gikk Elin Ørjasæter ut med skarp kritikk av SSB-sjef Christine Meyer, som hun (Ørjasæter) anklaget for å «svekke tilliten til [SSB]«, fordi hun (Meyer) har understreket at SSBs tall «ikke taler for seg selv«, og har fremhevet at det er mange (potensielle) positive effekter av innvandring som ikke er inkludert i SSBs beregninger av statsfinansielle nettokostnader pr. innvandrer.

Dersom en SSB-sjef opptrer som politisk aktør ved å gi et (urimelig) ensidig bilde av utviklingen, så er det absolutt gyldig grunn for kritikk – især hvis det forsøkes å gi en positiv vinkling som det ikke er dekning for i de faktiske tallene og prognosene. Men det er foruroligende når selve det å påpeke begrensinger i egne statistikker, blir beskrevet som en «sammenhengende nedvurdering av SSBs egen virksomhet» og «å snakke ned byråets egen forskning«. At profesjonelle statistikk-leverandører som SSB presiserer premissene for tallene de legger frem – inklusive hvilke aspekter som er utelatt fra beregningene – er noe vi trenger mer, ikke mindre. av i den offentlige debatten.

Det er fullstendig forfeilet dersom enhver slik påpekning og kontekstualisering av dataene (og av deres begrensninger), automatisk blir sett på enten som nidkjært pedanteri eller som ideologisk motivert føleri. Selvsagt vil det være mange slike presiseringer som ikke har vesentlig innvirkning på sluttresultatet – men uten å kjenne til de fundamentale premissene for beregningen, blir det umulig å anvende tallene på noen fornuftige måte.

Et tall i seg selv har ingen selvstendig informasjons- eller nyhetsverdi, med mindre det følger med et minimum av forståelse for hvordan det er beregnet og hva det representerer. Ofte vil selvsagt slike premisser være så allmenne og velkjente at man kan regne med at flertallet tar dem for gitt, f.eks. når partibarometre nøyer seg med å oppgi i mikroskopisk skrift at man bygger på et tilfeldig, vektet utvalg på ca. 1000 personer.

Men det fins også mange situasjoner der disse premissene er alt annet enn åpenbare – men likevel behandles som om det var detaljinformasjon for de spesielt interesserte, og ikke som helt essensielle forutsetninger for en fornuftig forståelse av tallet. Isteden blir tallene fremført, slått opp i media, gjentatt i diskusjoner, og etablerer seg som sannheter i den løpende samfunnsdebatten – uten at mer enn et ørlite mindretall skjønner hva tallet egentlig innebærer.

At politikere og andre samfunnsdebattanter benytter seg av innøvde talepunkter uten å detaljere premissene (og ofte uten engang å ha satt seg inn i dem selv), vil nok fortsette å være en uunngåelig del av debatten. Tildels er det også en nødvendig del – det er selvsagt ikke praktisk mulig i en direktesendt debatt å gå inn i lange metodiske utlegninger om hvert eneste tall som trekkes frem.

Men det er lov å håpe at mediene kan gjøre en bedre jobb – både internt i egne rekker og overfor politikere/debattanter – med å avkreve mer detaljer der hvor dette åpenbart er nødvendig for å tolke og forstå tallene. Tallfakta og statistikk er avgjørende for å kunne ha en opplyst og faktabasert debatt – men da må de også kombineres med en elementær kjennskap til hva de inneholder, og ikke flyte fritt rundt i debatten løsrevet fra enhver kontekst.

De fleste skjønner hvor innholdsløst og meningstomt det blir å si at «Rosenborg har scoret 145 mål» eller «Meteorologene spår 1600 millimeter nedbør i Bergen«, uten at det følger med en (implisitt eller eksplisitt) informasjon om hvor lang tidsperiode det er snakk om. Forhåpentligvis kan man stille tilsvarende grunnleggende krav også når politikere slår ‘tung’ statistikk i bordet, uten å bli blendet av «Her ligger det veldig avanserte beregninger bakom, så det blir sikkert altfor komplisert å gå inn i premissene»-tankegangen.

Advertisements

5 thoughts on “Tallenes alenegang

  1. «Mange artikler som bruker tall i feil betydning er til en viss grad tilgivelige, fordi de korrekt gjengir det som faktisk er oppgitt i en eller annen kilde, »

    Men dette illustrerer også hvorfor presisjon er viktig – upresise artikler lever videre, siteres og gjengis, og unøyaktighetene blir til fort til sannheter.

    Likt av 1 person

  2. Tilbaketråkk: Overvekt av feilaktig begrepsbruk | Langust og korsnebb

  3. Tilbaketråkk: Svartmaling om skjønnmaling - Manifest Tidsskrift

  4. Tilbaketråkk: Svartmaling om skjønnmaling | Langust og korsnebb

  5. Tilbaketråkk: Mangelfullt og misvisende om Arbeiderpartiets AAP-forslag | Langust og korsnebb

Kommentér gjerne, selv om du ikke har noe spesielt dypsindig å komme med. E-post adresse er ikke påkrevet.

Fyll inn i feltene under, eller klikk på et ikon for å logge inn:

WordPress.com-logo

Du kommenterer med bruk av din WordPress.com konto. Logg ut / Endre )

Twitter picture

Du kommenterer med bruk av din Twitter konto. Logg ut / Endre )

Facebookbilde

Du kommenterer med bruk av din Facebook konto. Logg ut / Endre )

Google+ photo

Du kommenterer med bruk av din Google+ konto. Logg ut / Endre )

Kobler til %s