mandag, august 17, 2009

Presisering

Jeg vil på forhånd unnskylde for et veldig belærende innlegg. Men dette engasjerer meg ganske mye. Og det handler om logikk.

Det er to begreper jeg mener det er ytterst viktig at folk lærer seg å kjenne. Disse to begrepene bør man lære seg hva betyr, deretter reflektere litt over dem, og dernest bruke i sin daglige omgang med medmennesker, og kanskje viktigst, media. Jeg mener ikke at man skal si dem hele tiden, men man bør tenke over hvilken implikasjon de har på hvordan saker og ting henger sammen.

Følg med nå. Disse to ordene er følgende:

Korrelasjon - Det at to eller fler hendelser skjer samtidig eller rett etter hverandre, gjerne flere ganger.
Årsakssammenheng - Det at en hendelse fører til en annen.

Ok. Nå kommer forklaringen. Først korrelasjon. Eksempel:

Hver gang jeg går ut av en forelesningssal, så går Henrik også ut. Den ene hendelsen (jeg går ut), skjer samtidig med den andre (Henrik går ut). Og de skjer samtidig mange ganger. Hver dag faktisk. Vi kan si at disse to hendelsene varierer sammen. Hvis den ene hendelsen skjer, så er det stor sansynlighet for at den andre skjer også. Dette er en korrelasjon, og vi sier at de to hendelsene (Henrik og jeg går ut) korrelerer.

De to hendelsene skjer samtidig, det er greit, men det er ikke dermed sagt at den ene fører til den andre. Grunnen til denne korrelasjonen er selvfølgelig at forelesningen er ferdig, eller det er pause, og Henrik og jeg reiser oss og går ut samtidig.

Altså hvis jeg reiser meg midt i en forelesning, så vil ikke Henrik automatisk følge etter meg ut, eller omvendt. Det at Henrik eller jeg går ut, fører ikke til at den andre gjør det. Det er dermed noe annet som er årsaken til at vi går ut, nemlig forelesningens slutt. Det er en korrelasjon uten direkte årsakssammenheng. Jeg hadde fortsatt gått ut av forelesningen, selv om Henrik ikke møtte til timen. Sånn sett er de to hendelsene uavhengige av hverandre, selv om de korrelerer sterkt.

Det som fører til at Henrik går ut av forelesningen er at forelesningen er slutt, ikke det at jeg går ut. Årsakssammenhengen er mellom Henrik og forelesningen, og meg og forelesningen, ikke mellom Henrik og meg. Det er dette som er forskjellen mellom korrelasjon og årsakssammenheng (eller kausalitet, om du vil).

Altså:

Det at ting korrelerer (endrer seg sammen), betyr ikke at det er en årsakssammenheng mellom dem. Det kan være noe utenforstående som er med å endre dem begge. Og dette er viktig å tenke på hvis man vil finne ut årsaken til at noe skjer, og eventuelt endre noe.

Hvis man vil at Henrik skal bli sittende i forelesningssalen, så hjelper det ikke å la meg sitte igjen. Siden det ikke er noen årsakssammenheng mellom oss, så vil ikke endringer hos èn føre til endringer i den andre. Man må finne kilden, og eventuelt se bort ifra distraherende korrelasjoner. Hvis man vil at Henrik skal bli sittende, så lar man forelesningen vare lengre.

Da jeg tok forskningsmetode på psykologi ble vi presentert for en påstand som vi fikk tygge litt på. Påstanden kunne vært hentet fra en hvilken som helst norsk avis. Den stemmer, rent statistisk. Det du skal tenke på er hvordan dette kan stemme, og i så fall, hva er årsaken?

Man har dramatisk større sjanse for å drukne hvis man spiser is.


Hvis jeg ikke er så gira på å drukne, kan jeg unngå det hvis jeg lar hver å spise is? (Svar i bunnen av innlegget)
Målet mitt med presiseringen av disse to ordene er at det blir trukket en del gale slutninger på grunnlag av at man tror at korrelasjon er det samme som årsakssammenheng. Enten ved at man prøver å løse et problem, og fjerner korrelerte hendelser, og ikke hendelsen som er årsaken, eller at man legger skylden for en hendelse på noe som ikke er årsaken*.

Et eksempel kan være den "elektrosyke" gutten i A-magasinet i høst (dette er ikke kritikk av elektrosyken, men den fungerer veldig godt som eksempel). Gutten tålte ikke strålingen som kom fra elektriske apparater. Han føler seg dårlig og fungerer ikke skikkelig steder det er mye elekstrisk stråling. De stedene det er høy tetthet av elektriske apparater, er det også en høy tetthet av mennesker. De stedene han ikke tålte i artikkelen var skoler, kjøpesentre osv.

Her kan man påstå at det er veldig høy korrelasjon mellom at gutten føler seg dårlig, og at han er steder hvor det er elektriske apparater. Men det er dermed ikke sagt at det er noen årsakssammenheng:
Det er like høy korrelasjon mellom at gutten føler seg dårlig, og at han er steder hvor det er veldig mye mennesker. Man kan spekulere i at det er elektrisiteten som gjør at han føler seg dårlig, fordi det er en korrelasjon. Men det er like rimelig å spekulere i at det er menneskene som gjør at han føler seg dårlig. Forskere har ikke funnet noe hold i påstanden om at "elektrosyke" finnes, men det er sterk støtte for at noen mennesker føler seg dårlig i store samlinger med mennesker. Menneskene kan dermed like gjerne være årsaken. Han kan dermed fortsatt føle seg dårlig om man fjerner elektrisiteten**.
Det som egentlig er moralen i innlegget her, er at man skal være litt mer bevisst på hva som faktisk er årsakene til ting. Hendelser som varierer sammen, trenger ikke nødvendigvis å ha en direkte årsakssammenheng, og ting er kanskje ikke så rett frem som man tror. Og ofte kan man se ting fra ganske andre sider hvis man bare bruker litt tid på å skille korrelasjon fra årsakssammenheng i diverse sammenhenger (politikk f.eks.).
Det viktigste er vell at gode årsakssammenhenger ofte er sjeldne i mange sammenhenger, og at man burde strebe etter å identifisere påståtte årsakssammenhenger som faktisk er korrelasjoner, og heller lete videre etter en potensiell årsak. Vanligvis finner man ikke noen bedre årsak, men man kan finne andre sterke korrelasjoner som kan vise at en sak har flere sider.
Det var egentlig det jeg ville si.
God natt!

Svar: Fine, solfyllte dager. På slike dager, så selges det, og spises mye is. Samtidig er det veldig mange som bader, og dermed også flere som drukner. De to hendelsene "spise is" og "drukne" er sterkt korrelert. Dette er fordi begge to dukker opp på dager hvor det er fint vær. På fine dager er det mange fler som drukner enn på dager hvor det er overskyet, og samtidig så selges det mer is på fine dager enn på overskyede dager. Drukning og isspising korrelerer, men årsakssammenhengene er mellom drukning og fine dager, og isspising og fine dager. Det er ingen årsakssammenheng mellom isspising og drukning***. En avis ville egentlig formulert setningen som "Isspising fører til drukning!". Noe som ikke stemmer med årsakssammenhengen. Man unngår ikke å drukne hvis man lar hver å kjøpe is.

*"Røyking fører til dårlige karakterer!". Røyking og dårlige karakterer er korrelerte hendelser, men det er ingen årsakssammenheng. Årsakssammenhengen er mellom røyking og det at vedkommende kanskje har fallt litt utenfor. Folk som faller litt utenfor vil nødvendigvis også få dårligere karakterer. Takk til Anders for eksempel.
**Artikkelen tok frem et eksempel der gutten følte seg bra på leir langt inn i skogen. Men hvem har det ikke bra på leir? Det at han følte seg bra i skogen kan være en tilfeldig korrelasjon med at leiren var i skogen, og at det var leiren som fikk han til å føle seg bedre.
***Det kan være at noen spiser helt sjukt mye is, og synker når de prøver badevannet, og i så fall vil det være en årsakssammenheng mellom is og drukning. Men det skjer nok så sjelden at det ikke er statistisk signifikant.

6 kommentarer:

Anders sa...

Vel talt, kloke hode! (Husker godt en Dagbla'-overskrift: "Røyking gir dårlige karakterer!". Håpløst.)

Tobias sa...

Takktakk :) Nå har jeg til og med rukket å lese gjennom, presisere noen setninger og rettskrive. Sjelden jeg orker det når jeg har skrevet lenge :P

Min fanesak er at det burde være obligatorisk med et kurs i forskningsmetode for journalister. De er stort sett så håpløst dårlige til å formidle det de leser og avgjøre hva som har relevans og hva som er kausalitet vs korrelasjon.

Forskningsmetode er konge.

Brekkja sa...

Flott og opplysende!

Runa sa...

Tanker som gikk gjennom Runas hode når hun leste:
- Haha
- Det er sant
- Hm, jeg kan opplyse om kausualitet. -Der kom det ja. Søren.
- Jeg kan regne ut sannsynligheten for at Henrik går ut av forelesningsalen gitt at du gjør det, og gitt at du ikke gjør det. Kult.
- Dette her MÅ han ha skrevet i de sene nattetimer.
- Orker ikke lese mer. Kommentere.

Flott! :)

Tobias sa...

Dette tenkte Tobias da han leste kommentaren til Runa:
- Haha!
- Det er faktisk det.
- Jeg lurte på om jeg skulle si kausalitet for årsakssammenheng hele veien. Men jeg tenkte at jeg bare skulle innføre et begrep av gangen (korrelasjon) og ikke forvirre lesere med overforbruk av akademisk terminologi ;)
- Der har du korrelasjon i et nøtteskall: Man kan regne på sansynligheten for at om man skulle oppfylle et kriterie (går på BI), så vil man også oppfylle et annet (ha sleik). Men det betyr ikke at det ene fører til det andre.
- Ja, denne var jeg ferdig med rimelig sent. 0230 eller noe, så vidt jeg husker.
- Du burde lese hele. Kommenter gjerne igjen.

Takk :)

Runa sa...

Hvis jeg husker det, skal jeg gi deg et ord til. Må bare finne det igjen..