mikkoheino.fi

MAB9


Tilastolliset ja todennäköisyysjakaumat (MAB9)

Laajuus

2 op


Yleiset tavoitteet (LOPS 2021)

Moduulin tavoitteena on, että opiskelija


Keskeiset sisällöt (LOPS 2021)


Aikataulu


Suoritus


Arviointi


Arvosanataulukko

Pisteet Arvosana Muuta
0 - 14 i \(\to\) K Pakko täydentää.
15 - 29 4 Oikeus täydentää.
30 - 42 5
43 - 55 6
56 - 68 7
69 - 81 8
82 - 94 9
95 - 100 10

Keskeyttäminen

Opettaja keskeyttää opiskelijan opintojakson, jos

Opettaja voi keskeyttää opiskelijan opintojakson, jos opiskelijalla on neljä poissaoloa. Tällaiset tilanteet opettaja käy läpi tapauskohtaisesti ja on ennen lopullista keskeytystä yhteydessä opiskelijaan.

Keskeyttämisestä opettaja merkitsee opintojaksosta opiskelijalle K-merkinnän Wilmaan ja poistaa opiskelijan sen jälkeen Wilman ryhmästä. Opettaja lähettää keskeyttämisestä viestin opiskelijalle, alaikäisen opiskelijan huoltajalle, ryhmänohjaajalle ja opolle.


Sivun alkuun.



1 KERTAUSTA TILASTOISTA


1.1 Tilastollinen tutkimus

Tilasto on valikoitu ja järjestetty kokoelma tietoa, joka perustuu tilastollisella tutkimuksella kerättyyn havaintoaineistoon.


Tilastollisessa tutkimuksessa mitataan muuttujan saamia vaihtelevia havaintoarvoja.


Jakauma

Jakauma ilmaisee muuttujan saamien eri havaintoarvojen yleisyyden.

  • Absoluuttinen jakauma sisältää havaintoarvot ja niiden esiintymiskertojen lukumäärät eli frekvenssit, \(f\).

  • Suhteellinen jakauma sisältää havaintoarvot ja niiden esiintymiskertojen suhteelliset osuudet prosentteina eli suhteelliset frekvenssit, \(f\ \%\).

Kappaleen alkuun.



1.2 Diskreetti tilastojakauma

Tilastollinen muuttuja on diskreetti, jos se saa erillisiä arvoja, esimerkiksi kokonaislukuarvoja.

Diskreetin tilastollisen muuttujan jakaumaa kutsutaan diskreetiksi jakaumaksi.


Esim. 1

Alla olevassa aineistossa on taulukoituna erään abin kaikista pitkän matematiikan opintojaksoista saamat arvosanat.

a) Määritä taulukkolaskentaohjelmalla arvosanoja jakautumista kuvaava absoluuttinen jakauma. Piirrä absoluuttista jakaumaa kuvaava pylväskuvaaja.

b) Määritä taulukkolaskentaohjelmalla arvosanojen suhteellinen jakauma. Ilmoita prosenttiosuudet kokonaisina prosentteina. Piirrä suhteellista jakaumaa kuvaava pylväskuvaaja.



Kappaleen alkuun.



1.3 Tilastolliset tunnusluvut

Tilastoon sisältyvää tietoa voidaan tiivistää tilastollisten tunnuslukujen avulla.


Keskiluvut

Keskiluvut kuvaavat jakauman keskikohtaa.

Keskilukuja ovat muun muassa:


Moodi

Moodi eli tyyppiarvo on tilaston eniten esiintyvä havaintoarvo (suurin frekvenssi). Jos suurin frekvenssi esiintyy useilla havaintoarvoilla, ne kaikki ovat tyyppiarvoja.


Mediaani

Mediaani on tilaston suuruusjärjestyksessä keskimmäinen havaintoarvo silloin, kun havaintoarvoja on pariton määrä. Jos havaintoarvoja on parillinen määrä, mediaani on kahden keskimmäisen keskiarvo.


Keskiarvo

Keskiarvo on havaintoarvojen summa jaettuna havaintoarvojen lukumäärällä.

$$\bar{x}=\frac{x_{1}+x_{2}+\ldots+x_{n}}{n}=\frac{\sum_{i=1}^{n}x_{i}}{n},$$

missä \(x_{1}, x_{2},\ldots, x_{n}\) ovat havaintoarvoja ja \(n\) havaintoarvojen lukumäärä.


Hajontaluvut

Hajontaluvut kuvaavat, kuinka paljon havaintoarvot vaihtelevat keskiarvon ympärillä.

Hajontalukuja ovat muun muassa:


Vaihteluväli

Vaihteluväli ilmaistaan ilmoittamalla tilaston pienin ja suurin havaintoarvo.


Vaihteluvälin pituus

Vaihteluvälin pituus on tilaston suurimman ja pienimmän havaintoarvon erotus.


Keskihajonta

Keskihajonta kuvaa, miten havaintoarvot ovat jakautuneet keskiarvon ympärille. Mitä lähempänä nollaa keskihajonnan arvo on, sitä lähemmäksi keskiarvoa havaintoarvot tilastossa sijoittuvat.


Esim. 1

Määritä havaintoaineiston 8, 7, 9, 10, 9, 6, 9 mediaani, moodi, keskiarvo, vaihteluväli ja vaihteluvälin pituus.


Tunnusluvut laskinohjelmilla

GeoGebran komentoja

  • havaintoarvojen lukumäärä =Pituus()
  • moodi eli tyyppiarvo =Tyyppiarvo()
  • mediaani =Mediaani()
  • keskiarvo =Keskiarvo()
  • keskihajonta =Keskihajonta()
  • otoskeskihajonta =Otoskeskihajonta()
  • pienin arvo =Min()
  • suurin arvo =Max()

LibreOffice Calc -ohjelman komentoja

  • havaintoarvojen lukumäärä =LASKE.A()
  • moodi eli tyyppiarvo =MOODI.USEA()
  • mediaani =MEDIAANI()
  • keskiarvo =KESKIARVO()
  • keskihajonta =KESKIHAJONTA.P()
  • otoskeskihajonta =KESKIHAJONTA.S()
  • pienin arvo =MIN()
  • suurin arvo =MAKS()

Esim. 2

Alla olevassa aineistossa on erään matematiikan opintojakson päättöarvosanojen jakauma.

Määritä GeoGebra-laskinohjelmistolla arvosanojen

a) mediaani

b) keskiarvo

c) (otos)keskihajonta.


Esim. 3

Alla olevassa aineistossa on taulukoituna opiskelijoiden eräällä matematiikan opintojaksolla saamat arvosanat.

Määritä Libre Office Calc -taulukkolaskentaohjelmalla arvosanojen

a) lukumäärä

b) mediaani

c) moodi

d) vaihteluväli

e) vaihteluvälin pituus

f) keskiarvo

g) keskihajonta.


Kappaleen alkuun.



1.4 Jatkuva tilastojakauma

Tilastollinen muuttuja on jatkuva, jos se voi saada minkä tahansa arvon tarkasteluvälillä. Esimerkiksi ihmisen pituus voi mittaustarkkuuden rajoissa saada minkä tahansa lukuarvon siltä lukuväliltä, jolla pituus voi vaihdella.

Jatkuvan tilastollisen muuttujan jakaumaa kutsutaan jatkuvaksi jakaumaksi.

Jatkuvia jakaumia on usein luontevinta käsitellä luokiteltuna.


Esim. 1

Eräällä MAB5-opintojaksolla selvitettiin ryhmän opiskelijoiden pituudet. Pituudet ovat taulukoituna alla olevassa aineistossa.

a) Luokittele pituudet neljään tasalevyiseen luokkaan taulukkolaskentaohjelmalla.

b) Määritä luokkien frekvenssit taulukkolaskentaohjelmalla.

c) Kokoa luokat ja frekvenssit luokitelluksi jatkuvaksi jakaumaksi.

d) Mikä on pituuksien moodiluokka?


Tilastolliset tunnusluvut luokitellulle aineistolla

Luokitellusta aineistoista keskiarvon ja keskihajonnan kaltaisten tunnuslukujen selvittämiseksi on tiedettävä luokkien luokkakeskukset, jotka ovat luokkien todellisten ala- ja ylärajojen keskiarvoja. Todelliset ala- ja ylärajat määritetään edellisen ja seuraavan luokan ylä- ja alarajan puoliväliin (poikkeuksena ikä).


Esim. 2

Määritä arvio esimerkin 1 pituuksien keskiarvolle ja keskihajonnalle luokitellusta aineistosta laskinohjelmalla (GeoGebra). Mikä on pituuksien moodiluokka?


Histogrammi

Histogrammi on pylväskuvaaja, jossa pylväät on ovat kiinni toisissaan. Jatkuvaa jakaumaa kuvataan yleensä histogrammilla.


Esim. 3

a) Määritä esimerkin 1 luokitteluille pituuksille suhteelliset frekvenssit taulukkolaskentaohjelmalla.

b) Piirrä taulukkolaskentaohjelmalla suhteellista jakaumaa kuvaava histogrammi.


Kertymä

Kun frekvenssejä lasketaan yhteen saadaan summafrekvenssi, sf. Summafrekvenssi kuvaa, kuinka paljon havaintoja on kertynyt suuruusjärjestyksessä tiettyyn tilastomuuttujan arvoon mennessä.

Suhteellisille frekvensseille voidaan laska suhteellinen summafrekvenssi, sf %. Suhteellinen summafrekvenssi kuvaa, kuinka suuri osuus havainnoista on kertynyt tiettyyn tilastomuuttujan arvoon mennessä.

Luokitellun aineiston mediaaniluokka löydetään etsimällä se luokka, jonka kohdalla suhteellinen summafrekvenssi ylittää 50 prosentin rajan.

Havaintojen kertymää voidaan kuvata kertymäkuvaajalla.


Esim. 4

a) Määritä esimerkin 3 suhteelliselle jakaumalle suhteelliset summafrekvenssit.

b) Mikä on jakauman mediaaniluokka?

c) Piirrä opiskelijoiden pituuksien kertymäkuvaaja.

d) Kuinka pitkiä ovat alimpaan kvartiiliin kuuluvat opiskelijat eli mitä pituutta lyhyempiä on 25 % opiskelijoista?


Kappaleen alkuun.



2 BINOMIJAKAUMA


2.1 Todennäköisyyden laskusääntöjä