mikkoheino.fi

MAA8


Tilastot ja todennäköisyys (MAA8)

Laajuus

2 op


Yleiset tavoitteet (LOPS 2021)

Moduulin tavoitteena on, että opiskelija


Keskeiset sisällöt (LOPS 2021)


Aikataulu


Suoritus


Arviointi


Pisteet Arvosana Muuta
0 - 9 i \(\rightarrow\) K Pakko täydentää.
10 - 17 4 Oikeus täydentää.
18 - 25 5
26 - 33 6
34 - 41 7
42 - 49 8
50 - 57 9
58 - 60 10

Keskeyttäminen

Opettaja keskeyttää opiskelijan opintojakson, jos

Opettaja voi keskeyttää opiskelijan opintojakson, jos opiskelijalla on viisi poissaoloa. Tällaiset tilanteet opettaja käy läpi tapauskohtaisesti ja on ennen lopullista keskeytystä yhteydessä opiskelijaan.

Keskeyttämisestä opettaja merkitsee opintojaksosta opiskelijalle K-merkinnän Wilmaan ja poistaa opiskelijan sen jälkeen Wilman ryhmästä. Opettaja lähettää keskeyttämisestä viestin opiskelijalle, alaikäisen opiskelijan huoltajalle, ryhmänohjaajalle ja opolle.


Sivun alkuun.



1 TILASTO


1.1 Käsitteitä

Tilasto on valikoitu ja järjestetty kokoelma tietoa, joka perustuu havaintoaineistoon.

Havaintoaineisto on tilastollisella tutkimuksella kerättyä usein taulukkomuotoista tietoa jostain mielenkiinnon kohteesta.


Tilastollisessa tutkimuksessa mitataan muuttujan eli mielenkiinnon kohteen jonkin ominaisuuden (esim. silmien väri, pituus, paino, puoluekanta) saamia vaihtelevia arvoja eli havaintoarvoja.

Arvojen vaihtelusta muodostuu muuttujan jakauma. Jakauma ilmaisee muuttujan saamien eri arvojen yleisyyden.


Tilastotietoa voidaan havainnollistaa graafisesti erilaisina kuvaajina eli diagrammeina. Tavallisimpia kuvaajatyyppejä ovat:


Esim. 1

Piirrä Libre Office Calc -taulukkolaskentaohjelmalla pyydetyt kuvaajat annetusta aineistosta.

a) Pylväskuvaaja


b) Viivakuvaaja


c) Ympyräkuvaaja


d) Yhdistetty viiva- ja pylväskuvaaja



Kappaleen alkuun.



1.2 Tilastolliset tunnusluvut

Tilastoon sisältyvää tietoa voidaan tiivistää tilastollisten tunnuslukujen avulla.

Tilastollisia tunnuslukuja ovat muun muassa


Keskiluvut

Keskiluvut kuvaavat jakauman keskikohtaa. Keskilukuja ovat muun muassa


Moodi

Moodi eli tyyppiarvo on tilaston eniten esiintyvä havaintoarvo (suurin frekvenssi).


Huom.

Jos suurin frekvenssi esiintyy useilla havaintoarvoilla, ne kaikki ovat tyyppiarvoja.


Mediaani

Mediaani on tilaston suuruusjärjestyksessä keskimmäinen havaintoarvo.


Huom.

Jos havaintoarvoja on...


Keskiarvo

Keskiarvo on havaintoarvojen summa jaettuna havaintoarvojen lukumäärällä.

$$\bar{x}=\frac{x_{1}+x_{2}+\ldots+x_{n}}{n}=\frac{\sum_{i=1}^{n}x_{i}}{n},$$

missä \(x_{1}, x_{2},\ldots, x_{n}\) ovat havaintoarvoja ja \(n\) havaintoarvojen lukumäärä.


Huom.

Jos tilasto on esitetty frekvenssitaulukkona, keskiarvo voidaan laskea seuraavasti.

$$\bar{x}=\frac{f_{1}x_{1}+f_{2}x_{2}+\ldots+f_{k}x_{k}}{n}=\frac{\sum_{i=1}^{k}f_{i}x_{i}}{n}$$


Havaintoarvo Frekvenssi
\(x_{1}\) \(f_{1}\)
\(x_{2}\) \(f_{2}\)
\(\vdots\) \(\vdots\)
\(x_{k}\) \(f_{k}\)
Yht. \(n\)

Esim. 1

Määritä havaintoaineiston mediaani, moodi ja keskiarvo, jos mahdollista.

a) 8, 7, 9, 10, 9, 6, 9

b) 4, 5, 1, 3, 2, 1, 4, 2

c) kenraali, kersantti, majuri, luutnantti, kersantti

d) sininen, keltainen, sininen, punainen.


Hajontaluvut

Hajontaluvut kuvaavat, kuinka paljon havaintoarvot vaihtelevat keskiarvon ympärillä.

Hajontalukuja ovat muun muassa


Vaihteluväli ilmaistaan ilmoittamalla tilaston pienin ja suurin havaintoarvo.

Vaihteluvälin pituus on tilaston suurimman ja pienimmän havaintoarvon erotus.

Keskihajonta kuvaa, miten havaintoarvot ovat jakautuneet keskiarvon ympärille. Mitä lähempänä nollaa keskihajonnan arvo on, sitä lähemmäksi keskiarvoa havaintoarvot tilastossa sijoittuvat.

Perusjoukon keskihajonta, \(\sigma\), tarkoittaa koko perusjoukon keskihajontaa.

Otoskeskihajonnalla, \(s\), tarkoitetaan perusjoukosta valikoidun osajoukon eli otoksen keskihajontaa. Koska perusjoukon tutkiminen on työlästä, miltei aina on kyseessä otoskeskihajonta.


Otoskeskihajonta, \(s\)

Otoskeskihajonta, \(s\), on neliöjuuri havaintoarvojen ja keskiarvon erotusten neliöiden summan ja havaintoarvojen lukumäärän vähennettynä yhdellä osamäärästä.

$$s=\sqrt{\frac{(x_{1}-\bar{x})^{2}+(x_{2}-\bar{x})^{2}+\ldots+(x_{n}-\bar{x})^{2}}{n-1}},$$

missä \(x_{1}, x_{2},\ldots, x_{n}\) ovat havaintoarvoja, \(\bar{x}\) on keskiarvo ja \(n\) havaintoarvojen lukumäärä.


Huom.

Tässä opintojaksossa ei tarvitse erottaa keskihajontaa ja otoskeskihajontaa toisistaan.


Kappaleen alkuun.



1.3 Tunnusluvut laskinohjelmilla

GeoGebran komentoja


LibreOffice Calc -ohjelman komentoja


Huom.

LibreOffice Calc -ohjelmalla kannattaa käyttää ohjattua kaavojen luonti -toimintoa. Tällöin ei tarvitse muistaa komentoja ulkoa. Lisäksi komennon =MOODI.USEA() onnistunut käyttö saattaa vaatia ohjattua kaavojen luontia.


Esim. 1

Alla olevassa aineistossa on taulukoituna erään abin kaikista pitkän matematiikan opintojaksoista saamat arvosanat. Määritä Libre Office Calc -taulukkolaskentaohjelmalla arvosanojen

a) mediaani

b) moodi

c) vaihteluväli

d) vaihteluvälin pituus

e) keskiarvo

f) keskihajonta.



Kappaleen alkuun.



2 JAKAUMA


2.1 Diskreetti muuttuja

Tilastollinen muuttuja on diskreetti, jos se saa erillisiä arvoja, esimerkiksi kokonaislukuarvoja.

Diskreetin tilastollisen muuttujan jakaumaa kutsutaan diskreetiksi jakaumaksi.


Jakauma

Jakauma ilmaisee muuttujan saamien eri arvojen yleisyyden.

  • Absoluuttinen jakauma sisältää havaintoarvot ja niiden esiintymiskertojen lukumäärät eli frekvenssit, \(f\).

  • Suhteellinen jakauma sisältää havaintoarvot ja niiden esiintymiskertojen suhteelliset osuudet prosentteina eli suhteelliset frekvenssit, \(f\ \%\).

Esim. 1

Alla olevassa aineistossa on taulukoituna erään abin kaikista pitkän matematiikan opintojaksoista saamat arvosanat.

a) Määritä taulukkolaskentaohjelmalla arvosanoja jakautumista kuvaava absoluuttinen jakauma.

b) Piirrä taulukkolaskentaohjelmalla jakaumaa kuvaava pylväskuvaaja.

c) Määritä taulukkolaskentaohjelmalla arvosanojen suhteellinen jakauma. Ilmoita prosenttiosuudet kokonaisina prosentteina.

d) Määritä laskinohjelmalla arvosanojen absoluuttisen jakauman tunnusluvut: keskiarvo, keskihajonta, mediaani ja moodi.



Kappaleen alkuun.



2.2 Jatkuva muuttuja

Tilastollinen muuttuja on jatkuva, jos se voi saada minkä tahansa arvon tarkasteluvälillä. Esimerkiksi ihmisen pituus voi mittaustarkkuuden rajoissa saada minkä tahansa lukuarvon siltä lukuväliltä, jolla pituus voi vaihdella.

Jatkuvan tilastollisen muuttujan jakaumaa kutsutaan jatkuvaksi jakaumaksi.

Jatkuvia jakaumia on usein luontevinta käsitellä luokiteltuna.


Esim. 1

Eräällä MAB5-opintojaksolla selvitettiin ryhmän opiskelijoiden pituudet. Pituudet ovat taulukoituna alla olevassa aineistossa.

a) Luokittele pituudet neljään tasalevyiseen luokkaan taulukkolaskentaohjelmalla.

b) Määritä luokkien frekvenssit taulukkolaskentaohjelmalla.

c) Kokoa luokat ja frekvenssit luokitelluksi jatkuvaksi jakaumaksi.

d) Mikä on pituuksien moodiluokka?



Histogrammi

Histogrammi on pylväskuvaaja, jossa pylväät on ovat kiinni toisissaan. Jatkuvaa jakaumaa kuvataan yleensä histogrammilla.


Huom.

Histogrammi piirretään Libre Office Calc -taulukkolaskentaohjelmalla lisäämällä jatkuvalle jakaumalle pylväskaavio ohjattua kaavionluontitoimintoa käyttäen. Kun kaavio on luotu, klikataan vielä hiiren oikealla painikkeella kuvaajan pylvästä ja valitaan Muotoile arvosarja. Asetukset-välilehdeltä muutetaan Objektivälin (Spacing) arvoksi 0 %.


Esim. 2

Piirrä esimerkissä 1 määritettyä luokiteltua jatkuvaa jakaumaa kuvaava histogrammi.


Luokitellun jakauman tunnusluvut

Laskinohjelmalla (GeoGebra) voidaan määrittää arvio luokitellun aineiston tunnusluvuille, kuten keskiarvolle ja keskihajonnalle. Luokitellun aineiston tunnuslukujen selvittämiseksi on tiedettävä luokkien luokkakeskukset, jotka ovat luokkien todellisten ala- ja ylärajojen keskiarvoja.


Esim. 3

Määritä laskinohjelmalla (GeoGebra) esimerkissä 1 määritetystä luokitellusta jatkuvasta jakaumasta arvio opiskelijoiden pituuksien keskiarvolle ja keskihajonnalle.


Huom.

Luokan ala- ja ylärajan tarkkuus määrää todellisten ala- ja ylärajan tarkkuuden seuraavin poikkeuksin:


Kappaleen alkuun.



2.3 Kertymä

Kun frekvenssejä lasketaan yhteen saadaan summafrekvenssi, sf. Summafrekvenssi kuvaa, kuinka paljon havaintoja on kertynyt suuruusjärjestyksessä tiettyyn tilastomuuttujan arvoon mennessä.

Suhteellisille frekvensseille voidaan laska suhteellinen summafrekvenssi, sf %.

Luokitellun aineiston mediaaniluokka löydetään etsimällä se luokka, jonka kohdalla suhteellinen summafrekvenssi ylittää 50 prosentin rajan.

Havaintojen kertymää voidaan kuvata kertymäkuvaajalla.


Esim. 1

Taulukossa on erään MAB5-ryhmän opiskelijoiden pituuksien frekvenssit.

a) Määritä summafrekvenssit, suhteelliset frekvenssit ja suhteelliset summafrekvenssit.

b) Mikä on jakauman mediaaniluokka?

c) Piirrä opiskelijoiden pituuksien kertymäkuvaaja.

d) Kuinka pitkiä ovat alimpaan kvartiiliin kuuluvat opiskelijat eli mitä pituutta lyhyempiä on 25 % opiskelijoista?

Pituus (cm)fsff %sf %
150 - 1593
160 - 16915
170 - 17912
180 - 1895


Kappaleen alkuun.



3 RIIPPUVUUS


3.1 Korrelaatio

Korrelaatio tarkoittaa kahden tilastomuuttujan välistä riippuvuutta.


Esim.

Fysiikantunnilla määritettiin opiskelijan kävelynopeutta tutkimalla opiskelijan paikan riippuvuutta ajasta. Opiskelijat saivat seuraavat mittaustulokset.


Paikka (m)Aika (s)
00,00
21,32
42,69
63,01
84,25
105,44

Opiskelijat sijoittivat mittaustulokset pisteinä koordinaatistoon ja saivat tulokseksi seuraavanlaisen hajontakuvion.


Pisteet sijoittuvat likipitäen samaan nousevaan linjaan. Näyttäisi siis siltä, että ajan ja paikan välillä on lineaarinen (suoraviivainen) riippuvuus. Opiskelijat sovittivat pisteisiin regressiosuoran GeoGebran avulla.


Regressiosuora on lineaarista riippuvuutta kuvaava malli, jolla voidaan ennustaa opiskelijan paikka kunakin ajanhetkenä. Regressiosuoran yhtälö on suoran yhtälön muotoa $$y=ax+b.$$ Jos kulmakerroin \(a>0\), niin suora on nouseva ja puhutaan positiivisesta lineaarisesta riippuvuudesta. Jos kulmakerroin \(a<0\), niin suora on laskeva ja kyseessä on negatiivinen lineaarinen riippuvuus.


Lineaarisen riippuvuuden voimakkuutta voidaan matemaattisesti kuvata korrellaatiokertoimella \(r\). Korrelaatiokertoimen arvo on aina välillä \(-1\leq r\leq 1\). Mitä lähempänä nollaa korrelaatikertoimen arvo on, sitä heikompi on muuttujien välinen riippuvuus. Sanallinen tulkinta eri korrelaatiokertoimen arvoille löytyy esimerkiksi MAOL-taulukoista.

Esimerkin tilanteessa opiskelijan paikan ja ajanhetken välillä on voimakkaan korrelaation lisäksi selvä syy-seuraussuhde. Kaikissa tilanteissa näin ei kuitenkaan ole. Esimerkiksi kesällä aurinkoisina päivinä jäätelöä myydään paljon. Aurinko ei kuitenkaan paista, koska jäätelöä kuluu. Toisaalta pilvisenäkin päivänä kesällä saattaa jäätelöllä olla kysyntää. Kyseessä ei siis ole syy-seuraussuhde. Matemaattisesti syy-seuraussuhteen voimakkuutta voidaan kuvata luvulla selitysaste \(r^{2}\). Selitysaste saadaan lineaariselle mallille korrelaatiokertoimen toisena potenssina. Selitysaste ilmaisee prosentteina, kuinka suurelta osin muuttajan \(x\) arvojen vaihtelu selittää muuttujan \(y\) arvojen vaihtelua.


Lopuksi esimerkin opiskelijat selvittivät vielä uteliaisuuden vuoksi paikan ja ajan väliselle riippuvuudelle GeoGebran avulla korrelaatiokertoimen \(r\) ja selitysasteen \(r^{2}\), vaikka fysiikan tehtävässä niitä ei tarvittukaan.


Korrelaatiokerroin oli \(r\approx0{,}99\) ja selitysaste \(r^{2}\approx0{,}98\) eli ajanhetken ja opiskelijan sijainnin välillä on voimakas positiivinen lineaarinen riippuvuus ja aika selittäisi 98 % opiskelijan sijainnista.


Kappaleen alkuun.



3.2 Poikkeava havainto

Poikkeava havainto tarkoittaa havaintoa, joka eroaa muista tilastoaineiston havainnoista. Poikkeavat havainnot voivat vaikuttaa tilaston tulkintaan vääristäen sitä.

Esim. 1

Alla olevassa aineistossa on taulukoituna erään abin kaikista pitkän matematiikan opintojaksoista saamat arvosanat.

a) Mikä on arvosanojen keskiarvo ja keskihajonta.

b) Mikä olisi arvosanojen keskiarvo ja keskihajonta, jos ainoaa arvosanaa 5 ei huomioitaisi.



Kappaleen alkuun.



3.3 Ennuste

Tilastojen perusteella voidaan laatia ennusteita. Ennustuksen luotettavuus riippuu oikean ennustemallin valinnasta ja käytettävissä olevan tiedon (havaintojen) määrästä ja laadusta.

Esim. 1

Alla olevassa aineistossa on Suomen teillä liikennöivien sähköautojen lukumäärät vuosina 2021 - 2024 tarkasteluhetkenä syyskuun loppu. (Lähde: teknologiateollisuus.fi, haettu: 16.12.2024.)

Laadi ennuste sähköautojen lukumäärälle vuoden 2027 syyskuun lopussa. Arvioi ennusteen luotettavuutta.




Kappaleen alkuun.



4 TODENNÄKÖISYYS


4.1 Klassinen todennäköisyys

Käsitteitä:


Esim. 1

Nopanheitto on esimerkki satunnaisilmiöstä. Eräs lopputulos eli alkeistapaus on saatu nopan silmäluku. Ilmiöön liittyvät kaikki alkeistapaukset ovat nopan silmäluvut 1, 2, 3, 4, 5 ja 6.



Klassinen todennäköisyys

Klassinen todennäköisyys mallintaa satunnaisilmiöitä, joissa kaikki alkeistapaukset ovat keskenään yhtä mahdollisia eli symmetrisiä.

Tapahtuman \(A\) klassinen todennäköisyys on

$$P(A)=\frac{n(A)}{n(E)},$$

missä \(n(A)\) on tapahtumalle \(A\) suotuisien alkeistapausten lukumäärä ja \(n(E)\) kaikkien alkeistapausten lukumäärä.


Esim. 2

Millä todennäköisyydellä nopanheitossa tulee silmäluvuksi

a) 5

b) vähintään 5?


Huom.

Todennäköisyyden arvo voidaan ilmoittaa murtolukuna, desimaalilukuna tai prosenttilukuna. Klassisille todennäköisyyksille arvot ilmoitetaan useimmiten murtolukuina.


Esim. 3

Korttipakassa on 52 korttia. Millä todennäköisyydellä satunnaisesti nostettu kortti on

a) hertta

b) ässä tai kuningas?


Huom.

Tapahtuman \(A\) todennäköisyyden arvo on aina \(0\leq P(A)\leq 1\) tai prosentteina \(0\ \%\leq P(A)\leq 100\ \%\).

Tapahtuma, jonka todennäköisyys on \(0 = 0\ \%\), on mahdoton tapahtuma.

Tapahtuma, jonka todennäköisyys on \(1 = 100\ \%\), on varma tapahtuma.


Vastatapahtuma

Jokaisella tapahtumalla on vastatapahtuma eli komplementtitapahtuma.

Tapahtuman ''tapahtuu \(A\)'' vastatapahtuma on ''ei tapahdu \(A\)''.

Tapahtuman \(A\) vastatapahtumaa merkitään \(\bar{A}\) (luetaan ''ei-A'').


Esim. 4

Päättele vastatapahtuma.

a) Kolikonheitossa tulee klaava.

b) Yksittäisen nopan heitossa tulee kuutonen.

c) Heitettäessä kolmea noppaa tulee kolme kuutosta.


Tapahtuma ja sen vastatapahtuma ovat erilliset ja sisältävät yhdessä kaikki perusjoukon alkeistapaukset. Siten voidaan todeta seuraavaa.


Vastatapahtuman todennäköisyys

Tapahtuman ja vastatapahtuman todennäköisyyksien summa on yksi eli varma tapahtuma: $$P(A) + P(\bar{A})=1.$$ Näin ollen tapahtuman todennäköisyys voidaan ilmoittaa vastatapahtuman avulla: $$P(A)=1-P(\bar{A}).$$


Toisinaan jonkin tapahtuman todennäköisyys onkin helpompi laskea vastatapahtumaa hyödyntäen.


Esim. 5

Lauri heittää kahdesta vapaaheittosta molemmat koriin 82 % todennäköisyydellä. Millä todennäköisyydellä ainakin toinen heitoista ei mene koriin?


Kappaleen alkuun.



4.2 Tilastollinen todennäköisyys

Tilastollisen todennäköisyyden malli liittyy tilanteisiin, joissa ei voida tarkastella keskenään yhtä todennäköisiä alkeistapauksia, vaan tapahtuman todennäköisyys perustetaan tilastoihin tai kokeellisesti kerättyyn tietoon.

Tapahtuman \(A\) tilastollinen todennäköisyys

$$P(A)=\frac{n(A)}{n(E)},$$

missä \(n(A)\) on tapahtumalle \(A\) suotuisien havaintojen lukumäärä ja \(n(E)\) kaikkien havaintojen lukumäärä.


Esim. 1

Millä todennäköisyydellä satunnaisesti valittu pääkaupunkiseudun asukas on vantaalainen?

VIDEO


Esim. 2

Millä todennäköisyydellä satunnaisesti valitun oppilaan arvosana oli vähintään 8?

VIDEO


Kappaleen alkuun.



4.3 Geometrinen todennäköisyys

Kaikkien alkeistapausten lukumäärä voi olla myös ääretön. Tällöin klassisen todennäköisyyden mallia ei voida käyttää. Todennäköisyydelle voidaan kuitenkin määrittää arvo geometristen mittojen (pituus, pinta-ala, tilavuus, kulman suuruus) suhdelukuna.


Tapahtuman \(A\) geometrinen todennäköisyys

$$P(A)=\frac{m(A)}{m(E)},$$

missä \(m(A)\) on tapahtumalle \(A\) suotuisan joukon mitta ja \(m(E)\) perusjoukon mitta.


Esim. 1

Linja-auto lähtee torin laidalta 15 minuutin välein. Linja-auto avaa ovet matkustajille kolme minuuttia ennen lähtöä. Millä todennäköisyydellä matkustaja

a) saa kävellä suoraan bussiin

b) joutuu odottamaan pysäkillä vähintään kaksi minuuttia ennen ovien avautumista?


Esim. 2

Akvaarion pohjan mitat ovat 40 cm x 60 cm. Millä todennäköisyydellä sattumanvaraisesti ripoteltu muru kalanrehua laskeutuu akvaarion pohjalle alle 5 cm päähän akvaarion seinästä?


Kappaleen alkuun.



5 VAIHTOEHTOJEN LUKUMÄÄRÄ


5.1 Tuloperiaate

Tuloperiaate

Jos tapahtuma sisältää vaiheita, joissa jokaisessa suoritetaan valintoja useasta eri vaihtoehdosta, saadaan tapahtuman kaikkien mahdollisten alkeistapausten lukumäärä kertomalla eri vaiheissa olevien vaihtoehtojen lukumäärät keskenään.


Esim. 1

Milkalla on kaksi takkia, kolmet housut ja kaksi paria kenkiä. Kuinka monta eri asukokonaisuutta Milka vaatteista saa?


Kappaleen alkuun.



5.2 Kertoma

Kertoma

Luvun \(n\) kertoma merkitään \(n!\) ja lasketaan $$n!=n\cdot(n-1)\cdot\ \ldots\ \cdot2\cdot1.$$ Lisäksi on määritelty, että \(0!=1!=1\).


Esim. 1

a) Merkitse tulona ja laske \(4!\).

b) Merkitse lyhyemmin kertoman avulla tulo \(7\cdot6\cdot5\cdot4\cdot3\cdot2\cdot1\).

c) Laske laskimella \(8!\) ja \(120!\).


Kappaleen alkuun.



5.3 Jonojen lukumäärä

Kertoma on laskutoimitus, jolla voidaan laskea, kuinka moneen eri järjestykseen jonon jäsenet voidaan järjestää.


Permutaatio (eli jonojen lukumäärä)

Jos joukossa on \(n\) jäsentä, ne voidaan järjestää jonoon $$n!=n\cdot(n-1)\cdot\ \ldots\ \cdot2\cdot1$$ eri tavalla.


Esim. 1

Ryhmässä on viisi opiskelijaa, joista kaksi opiskelee lääketiedettä ja kolme farmasiaa.

a) Kuinka monella eri tavalla opiskelijat voivat järjestäytyä jonoon?

b) Millä todennäköisyydellä opiskelijat järjestäytyvät sattumalta pituusjärjestykseen lyhimmästä pisimpään?

c) Kuinka monella eri tavalla opiskelijat voivat järjestäytyä jonoon siten, että saman aineen opiskelijat ovat vierekkäin?


Kappaleen alkuun.



5.4 Osajonojen lukumäärä

Osajonojen lukumäärä tarkoittaa, kuinka monta \(k\)-jäsenen järjestystä voitaisiin muodostaa \(n\)-jäsenen joukosta.

Variaatio (eli \(k\)-permutaatio eli osajonojen lukumäärä)

Jos joukossa on \(n\) jäsentä, ne voidaan järjestää \(k\) jäsenen jonoihin $$(n)_{k}=n\cdot(n-1)\cdot\ \ldots\ \cdot\left(n-(k-1)\right)=\frac{n!}{(n-k)!}$$ eri tavalla.


Huom.

Laskutoimitus \((n)_{k}\) näppäillään esimerkiksi SpeedCrunch-laskimeen npr(n;k).


Esim. 1

Kuinka monta neljän kappaleen soittolistaa voidaan muodostaa kymmenestä kappaleesta?


Kappaleen alkuun.



5.5 Osajoukkojen lukumäärä

Osajoukkojen lukumäärä tarkoittaa, kuinka monta \(k\)-jäsenen ryhmää voitaisiin muodostaa \(n\)-jäsenen joukosta.

Kombinaatio (eli osajoukkojen lukumäärä)

Jos joukossa on \(n\) jäsentä, niistä voidaan muodostaa \(k\) jäsenen osajoukkoja $$\binom{n}{k}=\frac{n!}{k!(n-k)!}$$ kappaletta.


Huom.

Merkintä \(\binom{n}{k}\) luetaan ''\(n\) yli \(k\):n'' ja se näppäillään esimerkiksi SpeedCrunch-laskimeen ncr(n;k).


Huom.

Jonossa ja osajonossa jäsenten järjestyksellä on väliä, joukossa ja osajoukossa ei.


Esim. 1

Kuinka monta neljän opiskelijan ryhmää voidaan voidaan muodostaa kymmenen opiskelijan joukosta?


Esim. 2

Mikä on loton kaikki oikein -tuloksen todennäköisyys? Suomalaisessa lotossa veikataan seitsemää kokonaislukua kokonaisluvuista yhdestä neljäänkymmeneen.


Kappaleen alkuun.



6 LASKUSÄÄNTÖJÄ


6.1 Kertolaskusääntö

(molemmat tapahtuvat eli ja-sääntö)

Todennäköisyys riippumattomien tapahtumien tapahtumiselle yhdessä saadaan kertomalla tapahtumien todennäköisyydet keskenään.

Tapahtumat ovat riippumattomia, jos ne eivät vaikuta toisiinsa.


Riippumattomien tapahtumien kertolaskusääntö

Olkoot tapahtumat \(A\) ja \(B\) riippumattomia. Todennäköisyys, että molemmat tapahtuvat, on $$P(A\ \text{ja}\ B)=P(A)\cdot P(B).$$


Esim. 1

Millä todennäköisyydellä kahden nopan heitossa saadaan kaksi kutosta?


Esim. 2

Sääennusteen mukaan ensimmäisenä päivänä sateen todennäköisyys on 40 % ja toisena päivänä 80 %. Millä todennäköisyydellä molempina päivinä sataa?


Esim. 3

Kielten kuuntelussa oli monivalintatehtävä, jonka viidessä tehtäväkohdassa kussakin oli neljä vastausvaihtoehtoa. Millä todennäköisyydellä sattumanvaraisesti vastaten saa kaikki kohdat

a) oikein

b) väärin?


Esim. 4 (Nosto takaisinpanolla)

Korttipakasta nostetaan kaksi korttia siten, että välissä kortti palautetaan pakkaan. Millä todennäköisyydellä molemmat kortit ovat kuninkaita?


Yleisesti todennäköisyys useiden tapahtumien tapahtumiselle yhtä aikaa myös silloin, kun tapahtumat eivät ole riippumattomia lasketaan seuraavasti:


Yleinen kertolaskusääntö

Olkoot tapahtumat \(A\) ja \(B\). Todennäköisyys, että molemmat tapahtuvat, on $$P(A\ \text{ja}\ B)=P(A)\cdot P(B\mid A),$$

missä \(P(B\mid A)\) on tapahtuman \(B\) todennäköisyys ehdolla \(A\).


Esim. 5 (Nosto ilman takaisinpanoa)

Korttipakasta nostetaan kaksi korttia palauttamatta kortteja pakkaan. Millä todennäköisyydellä molemmat kortit ovat kuninkaita?


Kappaleen alkuun.



6.2 Yhteenlaskusääntö

(jompikumpi tapahtuu eli tai-sääntö)

Todennäköisyys erillisistä tapahtumista vähintään yhden tapahtumiselle saadaan laskemalla tapahtumien todennäköisyydet yhteen.

Tapahtumat ovat erillisiä eli toisensa poissulkevia, jos niillä ei ole yhteisiä alkeistapauksia. Kaksi tapahtumaa ovat erillisiä, jos toisen tapahtuessa toinen ei voi tapahtua.


Erillisten tapahtumien yhteenlaskusääntö

Olkoon tapahtumat \(A\) ja \(B\) erilliset. Todennäköisyys, että ainakin toinen tapahtuu, on $$P(A\ \text{tai}\ B)=P(A)+P(B).$$


Esim. 1

Korttipakasta nostetaan kortti. Ovatko tapahtumat erillisiä?

a) ''tulee pata'' tai ''tulee ässä''

b) ''tulee pata'' tai ''tulee hertta''?


Esim. 2

Laske todennäköisyys esimerkin 1 erillisille tapahtumille.


Esim. 3

Sääennusteen mukaan ensimmäisenä päivänä sateen todennäköisyys on 40 % ja toisena päivänä 80 %. Millä todennäköisyydellä vain jompana kumpana päivänä sataa?


Yleisesti todennäköisyys useista tapahtumista vähintään yhden tapahtumiselle myös silloin, kun tapahtumat eivät ole erilliset lasketaan seuraavasti:


Yleinen yhteenlaskusääntö

Olkoon tapahtumat \(A\) ja \(B\). Todennäköisyys, että ainakin toinen tapahtuu, on $$P(A\ \text{tai}\ B)=P(A)+P(B)-P(A\ \text{ja}\ B).$$


Esim. 4

Laske todennäköisyys esimerkin 1 tapahtumille, jotka eivät ole erilliset.


Kappaleen alkuun.



6.3 Toistokoe

Toistokoe tarkoittaa, että


Esim. 1

Millä todennäköisyydellä nopanheitossa neljästä heitosta tasan kolme on kuutosia.



Toistokokeen todennäköisyys

Olkoon tapahtuman \(A\) todennäköisyys \(p\). Tällöin

\(P(''A\ \text{tapahtuu}\ n\ \text{toistossa tasan}\ k\ \text{kertaa}'')\)

\(\displaystyle{=\binom{n}{k}p^{k}(1-p)^{n-k}}.\)


Esim. 2

Koripalloilija heittää vapaaheitolla korin \(80\ \%\) todennäköisyydellä. Oletetaan, että seuraavan heiton onnistumisen todennäköisyys on riippumaton edellisestä heitosta. Millä todennäköisyydellä koripalloilija heittää korin kahdeksalla peräkkäisellä vapaaheitolla

a) tasan kaksi kertaa

b) korkeintaan kaksi kertaa

c) vähintään kolme kertaa?


Kappaleen alkuun.



7 TODENNÄKÖISYYSJAKAUMA


7.1 Diskreetti todennäköisyysjakauma

Esim. 1

Heitetään kolikkoa neljä kertaa. Määritetään todennäköisyydet, että kruunia tulee tasan 0, 1, 2, 3 tai 4.


Diskreetti todennäköisyysjakauma

Vasemmanpuoleisessa taulukossa sarakkeessa Mahdolliset heittosarjat on lueteltu satunnaisilmiön Heitetään kolikkoa neljä kertaa kaikki alkeistapaukset. Satunnaismuuttuja on Kruunien lukumäärä, ja sen alla on satunnaismuuttujan saamat arvot. Sarakkeet Kruunien lukumäärä ja Todennäköisyys muodostavat todennäköisyysjakauman. Oikealla todennäköisyysjakauma esitettynä pylväskuvaajana.


Satunnaismuuttuja on funktio, joka liittää satunnaisilmiön jokaiseen alkeistapaukseen täsmälleen yhden reaaliluvun, jota kutsutaan satunnaismuuttujan arvoksi.

Jos satunnaismuuttujan arvot ovat erillisiä (esim. kokonaislukuja), kyseessä on diskreetti satunnaismuuttuja.

Satunnaismuuttujan todennäköisyysjakauma saadaan laskemalla satunnaismuuttujan jokaisen arvon todennäköisyys. Todennäköisyysjakauma voidaan diskreetin tilastollisen jakauman tavoin esittää taulukkona tai pylväskuvaajana.


Merkintä

Satunnaismuuttujaa merkitään \(X\) (iso kirjain) tai \(\underline{x}\) (alleviivattu pieni kirjain).

Satunnaismuuttuja arvojan merkitään \(x_{1}, x_{2}, x_{3}, \ldots\)

Satunnaismuuttujan arvojen todennäköisyyksiä merkitään \(p_{1}, p_{2}, p_{3}, \ldots\)


Satunnaismuuttujan todennäköisyysjakaumaa voidaan kuvata tunnusluvuilla kuten tilastollista jakaumaakin. Todennäköisyysjakauman tunnuslukuja ovat satunnaismuuttujan odotusarvo ja satunnaismuuttujan keskihajonta.

Satunnaismuuttujan odotusarvo ilmaisee, mitä lukua satunnaismuuttujan saamien arvojen keskiarvo lähestyy toistettaessa satunnaisilmiötä lukuisia kertoja.


Merkintä

Satunnaismuuttujan \(X\) odotusarvoa merkitään \(E(X)\), \(\mu\) tai \(EV\) (Expected Value).


Satunnaismuuttujan odotusarvo

Olkoon satunnaismuuttujan \(X\) arvot \(x_{1},x_{2}, \ldots ,x_{n}\) ja niiden todennäköisyydet \(p_{1},p_{2}, \ldots ,p_{n}\).

Tällöin satunnaismuuttujan odotusarvo on $$E(X)=\mu=\sum_{i=1}^{n}p_{i}x_{i}=p_{1}x_{1}+p_{2}x_{2}+\ldots +p_{n}x_{n}.$$


Satunnaismuuttujan keskihajonta kuvaa satunnaismuuttujan arvojen vaihtelun suuruutta odotusarvon ympärillä.


Merkintä

Satunnaismuuttujan \(X\) keskihajontaa merkitään \(S(X)\), \(\sigma\) tai \(SD\) (Standard Deviation).


Satunnaismuuttujan keskihajonta

Olkoon satunnaismuuttujan \(X\) arvot \(x_{1},x_{2}, \ldots ,x_{n}\) ja niiden todennäköisyydet \(p_{1},p_{2}, \ldots ,p_{n}\) sekä satunnaismuuttuja odotusarvo \(\mu\).

Tällöin satunnaismuuttujan keskihajonta on $$ \begin{align} S(X)=\sigma&=\sqrt{\sum_{i=1}^{n}p_{i}\left(x_{i}-\mu\right)^{2}}\\&=\sqrt{p_{1}\left(x_{1}-\mu\right)^{2}+p_{2}\left(x_{2}-\mu\right)^{2}+ \ldots +p_{n}\left(x_{n}-\mu\right)^{2}}. \end{align} $$


Esim. 2

Määritä esimerkin 1 taulukon avulla satunnaismuuttujan kruunien lukumäärän odotusarvo ja keskihajonta.

Vastaus: Odotusarvo on \(2\) ja keskihajonta \(1\).


Sivun alkuun.



7.2 Binomijakauma

Binomijakauma on diskreetti todennäköisyysjakauma, jonka satunnaismuuttujan arvoiksi voidaan valita tapahtuman \(A\) toteutumiskertojen määrä \(k\) \(n\)-toistossa ja satunnaismuuttujan arvojen todennäköisyydet (eli pistetodennäköisyydet) voidaan laskea toistokokeen todennäköisyyksinä.


Merkintä

$$X\ \sim\ \text{Bin}(n,p)$$ tarkoittaa, että satunnaismuuttuja \(X\) noudattaa binomijakaumaa parametrein \(n\) (toistojen määrä) ja \(p\) (tapahtuman \(A\) todennäköisyys).


Binomijakauman pistetodennäköisyyden laskeminen

Olkoon satunnaismuuttuja$$X\ \sim\ \text{Bin}(n,p).$$ Tällöin satunnaismuuttujan \(X\) arvojen todennäköisyydet eli pistetodennäköisyydet lasketaan kaavalla $$P(X=k)=\binom{n}{k}p^{k}(p-1)^{n-k},$$ jossa tapahtuman \(A\) toteutumiskertojen määrä on \(k=0,1,2,\ \ldots\ ,n\).


Binomijakauman odotusarvo ja keskihajonta

Olkoon satunnaismuuttuja$$X\ \sim\ \text{Bin}(n,p).$$ Tällöin satunnaismuuttujan odotusarvo on $$E(X)=\mu=np$$ ja keskihajonta $$D(X)=\sigma=\sqrt{np(1-p)}.$$


Huom.

GeoGebran todennäköisyyslaskurilla voidaan määrittää binomijakauma ja todennäköisyyksiä \(P(k_{i_1}\leq X\leq k_{i_2})\). Valitse vaihtoehto Binomijakauma ja syötä arvot parametreille \(n\) ja \(p\).


Sivun alkuun.