Tilastolliset ja todennäköisyysjakaumat (MAB9)
Laajuus
2 op
Yleiset tavoitteet (LOPS 2021)
Moduulin tavoitteena on, että opiskelija
- tutustuu normaalijakaumaan matemaattisena mallina
- tutustuu binomijakaumaan matemaattisena mallina
- vahvistaa ja monipuolistaa tilastojen käsittely- ja tutkimustaitojaan ohjelmistojen avulla
- tietää, kuinka lasketaan tilastollisiin jakaumiin liittyviä tunnuslukuja ja todennäköisyyksiä, ja osaa määrittää ne ohjelmistojen avulla
- ymmärtää luottamusvälin ja virhemarginaalin käsitteen ja osaa määrittää ne ohjelmistojen avulla.
Keskeiset sisällöt (LOPS 2021)
- normaalijakauma ja jakauman normittamisen käsitteet (odotusarvo ja keskihajonta)
- toistokoe
- binomijakauma
- luottamusvälin ja virhemarginaalin käsite
Aikataulu
Suoritus
- osallistuminen
- oppikirjan tehtävien tekeminen
- kaksi harjoitustehtävää
- loppukoe
Arviointi
- säännöllinen, aktiivinen ja vastuullinen osallistuminen +1 p
- enintään neljä poissaoloa
- tehtävien asianmukainen ja jatkuva tekeminen +3 p
- vähintään yksi asianmukaisesti tehty oppikirjan tehtävä käytössä ollutta oppituntia kohden
- tarkistetaan kahden viikon jaksoissa
- harjoitustehtävät 2 x 12 p = 24 p
- loppukoe 6 x 12 p = 72 p
- yhteensä max. 100 p
- 30 % arviointi
Arvosanataulukko
Pisteet | Arvosana | Muuta |
---|---|---|
0 - 14 | i \(\to\) K | Pakko täydentää. |
15 - 29 | 4 | Oikeus täydentää. |
30 - 42 | 5 | |
43 - 55 | 6 | |
56 - 68 | 7 | |
69 - 81 | 8 | |
82 - 94 | 9 | |
95 - 100 | 10 |
Keskeyttäminen
Opettaja keskeyttää opiskelijan opintojakson, jos
- opiskelija niin pyytää
- opiskelija ei ole läsnä opintojakson kahdella ensimmäisellä opetuskerralla ja opiskelija ei ole yhteydessä opettajaan eikä opettaja saa yhteyttä opiskelijaan.
Opettaja voi keskeyttää opiskelijan opintojakson, jos opiskelijalla on neljä poissaoloa. Tällaiset tilanteet opettaja käy läpi tapauskohtaisesti ja on ennen lopullista keskeytystä yhteydessä opiskelijaan.
Keskeyttämisestä opettaja merkitsee opintojaksosta opiskelijalle K-merkinnän Wilmaan ja poistaa opiskelijan sen jälkeen Wilman ryhmästä. Opettaja lähettää keskeyttämisestä viestin opiskelijalle, alaikäisen opiskelijan huoltajalle, ryhmänohjaajalle ja opolle.
1 KERTAUSTA TILASTOISTA
1.1 Tilastollinen tutkimus
Tilasto on valikoitu ja järjestetty kokoelma tietoa, joka perustuu tilastollisella tutkimuksella kerättyyn havaintoaineistoon.

Tilastollisessa tutkimuksessa mitataan muuttujan saamia vaihtelevia havaintoarvoja.
Jakauma
Jakauma ilmaisee muuttujan saamien eri havaintoarvojen yleisyyden.
- Absoluuttinen jakauma sisältää havaintoarvot ja niiden esiintymiskertojen lukumäärät eli frekvenssit, \(f\).
- Suhteellinen jakauma sisältää havaintoarvot ja niiden esiintymiskertojen suhteelliset osuudet prosentteina eli suhteelliset frekvenssit, \(f\ \%\).
1.2 Diskreetti tilastojakauma
Tilastollinen muuttuja on diskreetti, jos se saa erillisiä arvoja, esimerkiksi kokonaislukuarvoja.
Diskreetin tilastollisen muuttujan jakaumaa kutsutaan diskreetiksi jakaumaksi.
Esim. 1
Alla olevassa aineistossa on taulukoituna erään abin kaikista pitkän matematiikan opintojaksoista saamat arvosanat.
a) Määritä taulukkolaskentaohjelmalla arvosanoja jakautumista kuvaava absoluuttinen jakauma. Piirrä absoluuttista jakaumaa kuvaava pylväskuvaaja.
b) Määritä taulukkolaskentaohjelmalla arvosanojen suhteellinen jakauma. Ilmoita prosenttiosuudet kokonaisina prosentteina. Piirrä suhteellista jakaumaa kuvaava pylväskuvaaja.
Opintojakso | Arvosana |
---|---|
MAY1 | 7 |
MAA2 | 8 |
MAA3 | 8 |
MAA4 | 8 |
MAA5 | 7 |
MAA6 | 7 |
MAA7 | 7 |
MAA8 | 5 |
MAA9 | 9 |
MAA10 | 6 |
MAA11 | 4 |
MAA12 | 5 |
MAA13 | 7 |
1.3 Tilastolliset tunnusluvut
Tilastoon sisältyvää tietoa voidaan tiivistää tilastollisten tunnuslukujen avulla.
Keskiluvut
Keskiluvut kuvaavat jakauman keskikohtaa.
Keskilukuja ovat muun muassa:
Moodi
Moodi eli tyyppiarvo on tilaston eniten esiintyvä havaintoarvo (suurin frekvenssi). Jos suurin frekvenssi esiintyy useilla havaintoarvoilla, ne kaikki ovat tyyppiarvoja.
Mediaani
Mediaani on tilaston suuruusjärjestyksessä keskimmäinen havaintoarvo silloin, kun havaintoarvoja on pariton määrä. Jos havaintoarvoja on parillinen määrä, mediaani on kahden keskimmäisen keskiarvo.
Keskiarvo
Keskiarvo on havaintoarvojen summa jaettuna havaintoarvojen lukumäärällä.
$$\bar{x}=\frac{x_{1}+x_{2}+\ldots+x_{n}}{n}=\frac{\sum_{i=1}^{n}x_{i}}{n},$$
missä \(x_{1}, x_{2},\ldots, x_{n}\) ovat havaintoarvoja ja \(n\) havaintoarvojen lukumäärä.
Hajontaluvut
Hajontaluvut kuvaavat, kuinka paljon havaintoarvot vaihtelevat keskiarvon ympärillä.
Hajontalukuja ovat muun muassa:
Vaihteluväli
Vaihteluväli ilmaistaan ilmoittamalla tilaston pienin ja suurin havaintoarvo.
Vaihteluvälin pituus
Vaihteluvälin pituus on tilaston suurimman ja pienimmän havaintoarvon erotus.
Keskihajonta
Keskihajonta kuvaa, miten havaintoarvot ovat jakautuneet keskiarvon ympärille. Mitä lähempänä nollaa keskihajonnan arvo on, sitä lähemmäksi keskiarvoa havaintoarvot tilastossa sijoittuvat.
Esim. 1
Määritä havaintoaineiston 8, 7, 9, 10, 9, 6, 9 mediaani, moodi, keskiarvo, vaihteluväli ja vaihteluvälin pituus.
Tunnusluvut laskinohjelmilla
GeoGebran komentoja
- havaintoarvojen lukumäärä
=Pituus()
- moodi eli tyyppiarvo
=Tyyppiarvo()
- mediaani
=Mediaani()
- keskiarvo
=Keskiarvo()
- keskihajonta
=Keskihajonta()
- otoskeskihajonta
=Otoskeskihajonta()
- pienin arvo
=Min()
- suurin arvo
=Max()
LibreOffice Calc -ohjelman komentoja
- havaintoarvojen lukumäärä
=LASKE.A()
- moodi eli tyyppiarvo
=MOODI.USEA()
- mediaani
=MEDIAANI()
- keskiarvo
=KESKIARVO()
- keskihajonta
=KESKIHAJONTA.P()
- otoskeskihajonta
=KESKIHAJONTA.S()
- pienin arvo
=MIN()
- suurin arvo
=MAKS()
Esim. 2
Alla olevassa aineistossa on erään matematiikan opintojakson päättöarvosanojen jakauma.
Arvosana | f |
---|---|
10 | 2 |
9 | 4 |
8 | 6 |
7 | 8 |
6 | 7 |
5 | 3 |
4 | 1 |
Määritä GeoGebra-laskinohjelmistolla arvosanojen
a) mediaani
b) keskiarvo
c) (otos)keskihajonta.
Esim. 3
Alla olevassa aineistossa on taulukoituna opiskelijoiden eräällä matematiikan opintojaksolla saamat arvosanat.
Arvosana |
---|
7 |
8 |
8 |
8 |
7 |
7 |
7 |
5 |
9 |
6 |
4 |
5 |
7 |
7 |
8 |
8 |
8 |
7 |
7 |
7 |
6 |
9 |
8 |
9 |
6 |
7 |
Määritä Libre Office Calc -taulukkolaskentaohjelmalla arvosanojen
a) lukumäärä
b) mediaani
c) moodi
d) vaihteluväli
e) vaihteluvälin pituus
f) keskiarvo
g) keskihajonta.
1.4 Jatkuva tilastojakauma
Tilastollinen muuttuja on jatkuva, jos se voi saada minkä tahansa arvon tarkasteluvälillä. Esimerkiksi ihmisen pituus voi mittaustarkkuuden rajoissa saada minkä tahansa lukuarvon siltä lukuväliltä, jolla pituus voi vaihdella.
Jatkuvan tilastollisen muuttujan jakaumaa kutsutaan jatkuvaksi jakaumaksi.
Jatkuvia jakaumia on usein luontevinta käsitellä luokiteltuna.
Esim. 1
Eräällä MAB5-opintojaksolla selvitettiin ryhmän opiskelijoiden pituudet. Pituudet ovat taulukoituna alla olevassa aineistossa.
Opiskelijoiden pituudet (cm).
165 | 157 | 161 | 173 | 167 | 151 | 167 |
164 | 185 | 163 | 167 | 172 | 163 | 166 |
174 | 173 | 187 | 174 | 163 | 177 | 175 |
174 | 173 | 182 | 169 | 184 | 153 | 183 |
164 | 173 | 163 | 162 | 164 | 177 | 175 |
a) Luokittele pituudet neljään tasalevyiseen luokkaan taulukkolaskentaohjelmalla.
b) Määritä luokkien frekvenssit taulukkolaskentaohjelmalla.
c) Kokoa luokat ja frekvenssit luokitelluksi jatkuvaksi jakaumaksi.
d) Mikä on pituuksien moodiluokka?
- Kopioi aineisto taulukkoon.
- Selvitä aineiston pienin ja suurin arvo.
- Kirjoita taulukkoon luokat ja todelliset ylärajat.
- Määritä luokkien frekvenssit Taajuus-funktiolla.
Tilastolliset tunnusluvut luokitellulle aineistolla
Luokitellusta aineistoista keskiarvon ja keskihajonnan kaltaisten tunnuslukujen selvittämiseksi on tiedettävä luokkien luokkakeskukset, jotka ovat luokkien todellisten ala- ja ylärajojen keskiarvoja. Todelliset ala- ja ylärajat määritetään edellisen ja seuraavan luokan ylä- ja alarajan puoliväliin (poikkeuksena ikä).
Esim. 2
Määritä arvio esimerkin 1 pituuksien keskiarvolle ja keskihajonnalle luokitellusta aineistosta laskinohjelmalla (GeoGebra). Mikä on pituuksien moodiluokka?
- Määritä taulukkolaskentaohjelmassa luokkien todelliset ala- ja ylärajat ja luokkakeskukset niiden keskiarvona.
- Kopioi luokkakeskukset ja frekvenssit GeoGebraan.
- Valitse Yhden muuttujan analyysi ja Näytä tilastot.
Histogrammi
Histogrammi on pylväskuvaaja, jossa pylväät on ovat kiinni toisissaan. Jatkuvaa jakaumaa kuvataan yleensä histogrammilla.
Esim. 3
a) Määritä esimerkin 1 luokitteluille pituuksille suhteelliset frekvenssit taulukkolaskentaohjelmalla.
b) Piirrä taulukkolaskentaohjelmalla suhteellista jakaumaa kuvaava histogrammi.
Huom.
Histogrammi piirretään Libre Office Calc -taulukkolaskentaohjelmalla lisäämällä jatkuvalle jakaumalle pylväskaavio ohjattua kaavionluontitoimintoa käyttäen. Kun kaavio on luotu, klikataan vielä hiiren oikealla painikkeella kuvaajan pylvästä ja valitaan Muotoile arvosarja. Asetukset-välilehdeltä muutetaan Objektivälin (Spacing) arvoksi 0 %.
Kertymä
Kun frekvenssejä lasketaan yhteen saadaan summafrekvenssi, sf. Summafrekvenssi kuvaa, kuinka paljon havaintoja on kertynyt suuruusjärjestyksessä tiettyyn tilastomuuttujan arvoon mennessä.
Suhteellisille frekvensseille voidaan laska suhteellinen summafrekvenssi, sf %. Suhteellinen summafrekvenssi kuvaa, kuinka suuri osuus havainnoista on kertynyt tiettyyn tilastomuuttujan arvoon mennessä.
Luokitellun aineiston mediaaniluokka löydetään etsimällä se luokka, jonka kohdalla suhteellinen summafrekvenssi ylittää 50 prosentin rajan.
Havaintojen kertymää voidaan kuvata kertymäkuvaajalla.
Esim. 4
a) Määritä esimerkin 3 suhteelliselle jakaumalle suhteelliset summafrekvenssit.
b) Mikä on jakauman mediaaniluokka?
c) Piirrä opiskelijoiden pituuksien kertymäkuvaaja.
d) Kuinka pitkiä ovat alimpaan kvartiiliin kuuluvat opiskelijat eli mitä pituutta lyhyempiä on 25 % opiskelijoista?
- Kertymäkuvaaja määritetään luokkien todellisista ylärajoista ja suhteellisista summafrekvensseistä. Suhteellisen summafrekvenssin ensimmäisen arvon tulee olla 0 %.
- Lisää kaavio. Valitse kaaviotyypiksi XY (hajonta) ja Pisteet ja viivat.
- Valitse Näytä ruudukot -kohdasta X-akseli ja Y-akseli.
- Muotoile y-akselin asteikka välille 0 - 100 (%).