Fria matteboken: matematik 2b/Korrelation, samband, funktioner och funktionsanpassning

Avsnitt

Annat

Samband[redigera]

Ett av de viktigaste sätten att använda matematik är att undersöka samband mellan olika saker, exempelvis marknadsföring och försäljning; pluggtid och hur bra det går i skolan; och LCHF-diet och viktminskning. Att undersöka sådana samband är så pass viktigt att många människor har det som en stor del av sitt jobb.

Här syns ett diagram som visar två saker som man kan misstänka hänger samman: andelen av befolkningen som lever på mindre än 2 dollar per dag, och förväntad livslängd i det landet.

Finns det ett samband? Ja, det ser ut som att ju större fattigdom, desto lägre medellivslängd. Det stämmer överens med vad vi hade gissat också – det känns rimligt att länder med stor fattigdom har svårare att ha välfungerande sjukvård. Men sambandet är inte perfekt. Om vi till exempel tittar på de länderna där 50–65% lever under fattigdomsgränsen verkar medellivslängden vara ungefär 55–65 år, men det finns ett avvikande land med 57% fattigdom och medellivslängden på hela 75 år. Det är Vietnam.

Ett annat avvikande land är Kazakstan, med 14% fattigdom och en medellivslängden på bara 65 år.

Korrelation och kausalitet[redigera]

När det finns ett samband mellan två saker brukar man inom matematiken säga att de är korrelerade eller att det finns en korrelation mellan dem. I vårt fall kan man alltså säga att det finns en korrelation mellan fattigdom i ett land och medellivslängden i landet. Korrelation brukar beskrivas som stark eller svag, och positiv eller negativ. Ibland pratar man också om säker och osäker korrelation. Vad betyder det?

En stark korrelation betyder att det finns ett mycket tydligt samband – punkterna är samlade tätt kring en linje (eller annan typ av kurva). Med en svag korrelation kan man se att det finns ett samband i ett diagram, men det finns många undantag och datan är spretig. I fallet med fattigdom och medellivslängd skulle de flesta säga att vi har en medelstark korrelation.
En positiv korrelation betyder att båda faktorerna ökar eller minskar samtidigt, medan en negativ korrelation betyder att om ena faktorn ökar så minskar den andra. I punktdiagram syns positiv korrelation som ett band med prickar som lutar uppåt (positivt), medan negativ korrelation ger en lutning nedåt (negativ). I vårt exempel har vi en negativ korrelation, eftersom medellivslängden minskar när fattigdomen ökar (och tvärt om). Ett exempel på positiv korrelation är förhållandet mellan (genomsnittlig) ålder på förstfödeskor och förväntad livslängd i ett land.
En säker korrelation betyder att det är osannolikt att sambandet uppstått av tillfälligheter, medan en osäker korrelation betyder att det lika gärna kan vara slumpen som gör att det ser ut som ett samband. Ett sätt att kolla om en korrelation är säker eller osäker är att se hur många mätpunkter man måste ändra på innan man tycker att sambandet ändras. I vårt exempel har vi en säker korrelation, eftersom vi har många punkter i diagrammet och trenden inte skulle ändras bara för att vi flyttar några av dem.

Att två saker är korrelerade behöver inte betyda att det ena orsakar det andra. Tvärtom – när man använder ordet korrelation betyder det att man inte uttalar sig om varför sambandet finns. (Det är ungefär som att säga ”sannolikhet” istället för ”risk” eller ”chans”, och därmed inte uttala sig om det är något bra eller dåligt.)

I vårt fall är det rimligt att tro att fattigdomen orsakar sänkt medellivslängd, men kan finnas andra förklaringar också. När man ser ett samband är det klokt att titta på fyra olika förklaringsmodeller innan man bestämmer sig för hur man vill förklara det.

Det ena orsakar det andra. Det betyder att fattigdomen är en orsak till låg medellivslängd.
Det andra orsakar det ena. Det skulle betyda att låg medellivslängd är en orsak till fattigdom.
Det finns en tredje bakomliggande faktor. Kanske är det hög arbetslöshet som orsakar både fattigdom och låg medellivslängd? Eller att många är hiv-smittade? Eller något annat?
Sambandet var en tillfällighet. I diagrammet finns ungefär 50 länder med. Tänk om det bara råkar vara så att fattigdom och medellivslängd är korrelerade år 2004, men att det inte finns något sånt samband andra år? I så fall kan man leta hur länge som helst efter orsaken till sambandet – för det finns egentligen ingen orsak.

De två första sambanden brukar kallas orsakssamband, eller kausala samband. De innebär att det finns en direkt orsaksverkan mellan de två sakerna som hänger samman – i vårt fall hög fattigdom och låg medellivslängd – och det ena är en orsak och det andra en verkan.

Ofta stämmer flera av dessa förklaringar samtidigt, och då finns det inte en enda förklaring till sambandet. (Man kan tänka sig fler sätt att förklara samband – exempelvis felberäkningar, eller att sättet man samlar in data på får den att verka korrelerad.)

I överkursavsnittet om statistisk signifikans kan du läsa mer om att det är lätt att missa det fjärde alternativet ovan – att sambandet bara uppstod på slump. I forskning brukar man räkna ut sannolikheten för att det samband man ser uppstår på slump. Om den sannolikheten är tillräckligt låg (ofta 5% eller lägre) brukar man säga att ett samband är ''statistiskt signifikant.

Samband, korrelation och kausalitet: uppgifter med mera[redigera]

Överkurs[redigera]

Statistisk signifikans och den lättlurade människan

Relaterade procedurer[redigera]

Övriga procedurer

Övningsuppgifter[redigera]

Uppgifter

Regressionsanalys och matematiska modeller[redigera]

Livslängd och fattigdom, och en manuellt ritad trendkurva (funktion).

Det verkar som att högre fattigdom i ett land innebär kortare livslängd. Men hur ser sambandet ut? För att beskriva det kan vi försöka dra en kurva i diagrammet ovan, som passar någorlunda bra med punkterna. Att göra det för hand ger en slarvig och inexakt kurva, men den kan ändå vara tillräckligt bra för många sammanhang. Om vi litar på kurvan ovan kan vi till exempel ta reda på vilken medellivslängd vi kan förvänta oss i ett land där 75% av befolkningen lever under fattigdomsgränsen, och vi kan ta reda på hur långt ifrån det "förväntade" värdet som exempelvis Vietnam eller Kazakstan ligger. Så länge vi känner till andelen fattiga i ett land, låter kurvan oss göra kvalificerade gissningar om förväntad livslängd i landet. Det omvända är också sant – om vi vet medellivslängden i ett land, kan vi göra en (någorlunda) bra gissning om hur stor fattigdomen är i landet.

Den kurva vi gjort är en modell för att beskriva förväntad livslängd i ett land. I vår modell låtsas vi att livslängden bara bestäms av fattigdomen, vilket uppenbarligen inte är sant – men det kan fortfarande vara användbart. Vår modell fungerar förmodligen bäst för fattigdom upp till ungefär 40%, eftersom den ligger rätt nära de faktiska värdena där. Vid högre fattigdom blir det spretigare, och dessutom har vi färre punkter att jämföra kurvan mot – vilket också gör vår modell mer osäker.

Funktioner[redigera]

I vår modell låtsas vi att det bara är fattigdomen som avgör medellivslängd i ett land. Det kallas inom matematiken för att vi har beskrivit förväntad livslängd som en funktion av fattigdomen. Att skapa en sådan funktion genom att dra en kurva för hand fungerar, men som vi kommer att se senare finns det flera fördelar med att låta en dator eller grafritande räknare dra kurvan istället.

Det mesta av den här kursen handlar om att förstå och kunna hantera funktioner, och vi kommer att titta speciellt noga på tre olika typer av samband som är särskilt vanliga. Men först ska vi bli klokare på vad funktioner är, och varför de kan vara användbara.

Notation för funktioner[redigera]

När man skriver funktioner inom matematiken gör man det enligt ett bestämt mönster, och du har förmodligen redan träffat på uttryck som $f(x)$ och $y(x)$ . De betyder att $f$ eller $y$ är funktioner av $x$ , det vill säga att om vi vet x, så kan vi räkna ut värdet på f eller y. Man brukar säga att x är den oberoende variabeln – den som vi kan bestämma värdet på själva; medan f eller y är den beroende variabeln – den som bestäms av x.

Om man inte vet vad funktionen beskriver är det vanligt att använda $f(x)$ eller $y(x)$ , men när funktionen beskriver en verklig situation kan man använda andra variabler. Vi skulle kunna skriva så här för vår modell, om vi ville:

Kurvan beskriver funktionen l(f)

l: förväntad livslängd i landet (i år)
f: andelen av befolkningen som lever under fattigdomsgränsen

(Men eftersom f(x) eller y(x) är de vanligaste namnen på funktioner kommer vi att hålla oss till f(x) här.)

Att skriva funktioner på det här sättet gör att man kan uttrycka samband på enkelt och kompakt sätt, men det kräver först att man blir van vid det. Här är några exempel på påståenden man kan skriva med funktionsnotation.

$f(0{,}50)=66$ betyder "när 50% av befolkningen lever under fattigdomsgränsen är den förväntade livslängden 66 år".
$f(0{,}70)=f(0{,}10)-15$ betyder "ett land med 70% fattigdom har 15 år kortare medellivslängd än ett land med 10% fattigdom".
$f(x_{1})=50$ betyder "när andelen fattiga är x₁ är den förväntade livslängden 50 år.
$x>0,40\Rightarrow f(x)<70$ betyder "om fattigdomen är högre än 40% är den förväntade livslängden är lägre än 70 år".

Funktionsanpassning[redigera]

En modell för att beskriva medellivslängd som en funktion av fattigdom, både som linje och som funktionsuttryck.

I exemplet ovan ritade vi först en kurva för hand, som var någorlunda anpassad till de punkter som beskriver medellivslängd och fattigdom. En handritad kurva kan fungera bra, men om man har möjlighet är det mycket bättre att låta en dator (eller grafritande räknare) göra kurvan. Det beror främst på två saker:

En dator kan hitta den linje (eller annan kurva) som passar allra bäst till punkterna i ett diagram. (Se överkursavsnittet om minsta kvadratanpassning om du vill veta hur!)
En dator kan ge dig ett funktionsuttryck – en formel som beskriver hur funktionen ser ut.

De här två sakerna gör att vi kan få säkrare och mer exakta modeller än vi hade fått för hand.

Att låta en dator hitta den kurva som passar bäst till ett antal punkter kallas att göra en funktionsanpassning, eller en regressionsanalys. Det vanligaste är att man ber om en kurva som är en rät linje, men det finns många andra typer kurvor som datorn kan räkna fram. (I den här kursen tar vi upp tre.)

Ekvationer och funktionsuttryck[redigera]

När vi ritade en kurva för hand var vi tvungna att läsa i diagrammet för att ta reda på förväntad livslängd vid olika mycket fattigdom. Det kan lätt bli inexakt – det räcker med att halka lite snett i diagrammet för att vi ska hamna några år fel. Om vi får ett funktionsuttryck från en dator kan vi använda det för att räkna fram värden, istället för att mäta i diagrammet.

I vårt fall säger datorn att funktionen beskrivs av $f(x)=-23{,}9x+75{,}0$ , om vi avrundar till tre gällande siffror. Om fattigdomen i ett land är 70% (=0,70) kan vi alltså räkna ut en förväntad livslängd genom att ge x värdet 0,7: $f(0{,}70)=-23{,}9\cdot 0,70+75{,}0=-16{,}59+75{,}0=58{,}41\approx 58{,}4$ . Det här är ett värde som är mycket mer noggrant än det vi hade fått genom att mäta i diagrammet.

Funktionsuttrycket är även användbart när vi vet funktionsvärdet, och vill ta reda på värdet på den oberoende variabeln. Till exempel kan vi ta reda på hur stor fattigdom vi kan förvänta oss i ett land där medellivslängden är 72 år.

Medellivslängden är 72 år
<==> f(x) = 72
<==> -23,9x + 75,0 = 72

Genom att skriva ner påståendet "medellivslängden är 72 år" med funktionsnotation har vi, tillsammans med funktionsuttrycket, skapat en ekvation där vi kan lösa ut x och ta reda på hur stor fattigdomen är. Smidigt!

Regressionsanalys och matematiska modeller: uppgifter med mera[redigera]

Relaterade procedurer[redigera]

Viktiga procedurer

Övriga procedurer

(inga)

Övningsuppgifter[redigera]

Uppgifter

Använda funktioner på grafritande räknare[redigera]

Det här stycket behöver förbättras. //Falk

En grafritande räknare är ett praktiskt verktyg om man vill jobba med funktioner. Med en grafritande räknare kan du bland annat:

Rita punktdiagram.
Låta räknaren hitta räta linjer (och andra typer av kurvor) som passar så bra som möjligt i ett punktdiagram.
Skriva in funktionsuttryck, och se vilka värden funktionen har för olika x-värden.
Få fram värdetabeller för funktioner.
Rita grafer över funktioner.
Ta reda på vilket x-värde som ger exempelvis f(x) = 15.

Det här avsnittet berättar mer om tankarna bakom hur de här sakerna fungerar – hur du i praktiken använder en grafritande räknare förklaras i respektive procedur. (Se länkar nedan.)

Funktioner, värdetabeller och grafer[redigera]

Sedan tidigare vet vi att räknaren kan hantera variabler, och om man exempelvis sätter $x=2{,}3$ kan räknaren ge värdet på uttryck som $x^{3}-{\sqrt {x}}+{\frac {1}{2-x}}$ , eller vilket uttryck som helst man kan skriva in. Så snart vi har ett funktionsuttryck kan vi alltså använda räknaren för att, på ett enkelt sätt, se funktionens värde för olika x-värden.

Men grafritande räknare är fiffigare än så. Det går att ange funktioner y(x) med hjälp av funktionsuttryck, och sedan använda funktionen om och om igen för att slippa skriva in samma uttryck hundra gånger.

Ett sätt man kan använda funktioner på, är att låta räknaren göra värdetabeller. I en värdetabell kan man se funktionens värde för många x-värden på en gång, vilket vara ett bra sätt att få en överblick av en funktion.

Men om vi vill se riktigt många funktionsvärden på en gång är tabeller inte bästa verktyget – det blir för jobbigt att titta på alla siffror, och det går inte att hålla dem i huvudet samtidigt. Istället låter vi räknaren rita upp en funktionsgraf. I inställningar för graffönstret kan man ange mellan vilka x-värden räknaren ska rita upp grafen, och för varje x-värde däremellan räknar räknaren ut funktionens värde och sätter ut en punkt på lämplig höjd i y-led. För att punkterna ska synas måste graffönstret vara inställt så att det visar tillräcklig höjd i y-led.

Grafer är enkla sätt att se när funktionsvärden är som högst/lägst, eller var funktionen ökar/minskar – men det är svårt att se exakta värden. Därför har grafritande räknare kommandon för att hitta saker som maximumpunkter, minimumpunkter och nollställen. De värden man får fram är, tekniskt sett, inte exakta – men de brukar vara tillräckligt nära för att kunna anges med många decimalers noggrannhet.

Lösa ekvationer med grafritande räkanre[redigera]

Grafer för två funktioner i samma koordinatsystem, med deras skärningspunkter markerade (A och B).

Fundera över ekvationen x³/6 - x = x²/2 - 1. Få personer vet hur man löser en sån ekvation med papper och penna (även om det faktiskt är möjligt). Men om vi ser vänsterledet som en funktion, och högerledet som en annan funktion, kan vi använda grafritande räknare för att ta reda på vilka värden vänster- och högerledet har för olika x-värden. Om de någon gång är samma, så har vi hittat ett x-värde som löser ekvationen – för då har vänsterledet och högerledet samma värde. (Se bilden i marginalen för ett exempel.)

Grafritande räknare har kommandon för att hitta saker som max-/min-punkter och nollställen, men det finns ytterligare ett kommando som är ordentligt användbart. Det är möjligheten att hitta skärningspunkter mellan två grafer.

Varför är det så bra? Jo, för om vi kan hitta skärningspunkter mellan två grafer, så kan vi lösa ekvationer som den ovan – och i princip alla ekvationer som vi över huvud taget kan skriva ner. Om du kan använda vänsterledet och högerledet som funktioner, så kan räknaren hitta när de är lika.

Rita punktdiagram och hitta passande kurvor[redigera]

(To be written. Se beskrivningar i procedurerna för hur man går till väga rent praktiskt.)

Använda funktioner på grafritande räknare: uppgifter med mera[redigera]

Överkurs[redigera]

Minsta kvadratmetoden

Relaterade procedurer[redigera]

Viktiga procedurer

(inga)

Övriga procedurer

Övningsuppgifter[redigera]

Uppgifter

Problemuppgifter för hela avsnittet[redigera]

Problemuppgifter på E-nivå[redigera]

Problemuppgifter på E-nivå bygger endast på begrepp och procedurer som klassats som viktiga. De är också problem som går att lösa i ett fåtal steg, eller där du får kännbar hjälp att hitta rätt väg för att komma fram till en lösning.

Problemuppgifter på C- och A-nivå[redigera]

Problemuppgifter på C- och A-nivå kan omfatta begrepp och procedurer som klassats som övriga, vilket betyder att du kan behöva läsa på saker själv. Att lösa problemen kräver i regel flera steg, och du får begränsad eller ingen hjälp att hitta vägen dit.

Problemuppgifter skapade av elever[redigera]

Du som elev kan lägga till egna problemuppgifter. Kopiera raden nedan, redigera det här stycket, och klistra in raden längst ner i listan. Byt ut namnet så att det passar med din uppgift.

* [[/Problemuppgifter/Uppgiftens namn|Uppgiftens namn]]

När du sparat sidan finns en länk till en sida där du kan lägga in din uppgift.

Uppgiftens namn
…