mikkoheino.fi

MAB9


Tilastolliset ja todennäköisyysjakaumat (MAB9)

Laajuus

2 op


Yleiset tavoitteet (LOPS 2021)

Moduulin tavoitteena on, että opiskelija


Keskeiset sisällöt (LOPS 2021)


Aikataulu


Suoritus


Arviointi


Arvosanataulukko

Pisteet Arvosana Muuta
0 - 14 i \(\to\) K Pakko täydentää.
15 - 29 4 Oikeus täydentää.
30 - 42 5
43 - 55 6
56 - 68 7
69 - 81 8
82 - 94 9
95 - 100 10

Keskeyttäminen

Opettaja keskeyttää opiskelijan opintojakson, jos

Opettaja voi keskeyttää opiskelijan opintojakson, jos opiskelijalla on neljä poissaoloa. Tällaiset tilanteet opettaja käy läpi tapauskohtaisesti ja on ennen lopullista keskeytystä yhteydessä opiskelijaan.

Keskeyttämisestä opettaja merkitsee opintojaksosta opiskelijalle K-merkinnän Wilmaan ja poistaa opiskelijan sen jälkeen Wilman ryhmästä. Opettaja lähettää keskeyttämisestä viestin opiskelijalle, alaikäisen opiskelijan huoltajalle, ryhmänohjaajalle ja opolle.


Sivun alkuun.



1 KERTAUSTA TILASTOISTA


1.1 Tilastollinen tutkimus

Tilasto on valikoitu ja järjestetty kokoelma tietoa, joka perustuu tilastollisella tutkimuksella kerättyyn havaintoaineistoon.


Tilastollisessa tutkimuksessa mitataan muuttujan saamia vaihtelevia havaintoarvoja.


Jakauma

Jakauma ilmaisee muuttujan saamien eri havaintoarvojen yleisyyden.

  • Absoluuttinen jakauma sisältää havaintoarvot ja niiden esiintymiskertojen lukumäärät eli frekvenssit, \(f\).

  • Suhteellinen jakauma sisältää havaintoarvot ja niiden esiintymiskertojen suhteelliset osuudet prosentteina eli suhteelliset frekvenssit, \(f\ \%\).

Kappaleen alkuun.



1.2 Diskreetti tilastojakauma

Tilastollinen muuttuja on diskreetti, jos se saa erillisiä arvoja, esimerkiksi kokonaislukuarvoja.

Diskreetin tilastollisen muuttujan jakaumaa kutsutaan diskreetiksi jakaumaksi.


Esim. 1

Alla olevassa aineistossa on taulukoituna erään abin kaikista pitkän matematiikan opintojaksoista saamat arvosanat.

a) Määritä taulukkolaskentaohjelmalla arvosanoja jakautumista kuvaava absoluuttinen jakauma. Piirrä absoluuttista jakaumaa kuvaava pylväskuvaaja.

b) Määritä taulukkolaskentaohjelmalla arvosanojen suhteellinen jakauma. Ilmoita prosenttiosuudet kokonaisina prosentteina. Piirrä suhteellista jakaumaa kuvaava pylväskuvaaja.



Kappaleen alkuun.



1.3 Tilastolliset tunnusluvut

Tilastoon sisältyvää tietoa voidaan tiivistää tilastollisten tunnuslukujen avulla.


Keskiluvut

Keskiluvut kuvaavat jakauman keskikohtaa.

Keskilukuja ovat muun muassa:


Moodi

Moodi eli tyyppiarvo on tilaston eniten esiintyvä havaintoarvo (suurin frekvenssi). Jos suurin frekvenssi esiintyy useilla havaintoarvoilla, ne kaikki ovat tyyppiarvoja.


Mediaani

Mediaani on tilaston suuruusjärjestyksessä keskimmäinen havaintoarvo silloin, kun havaintoarvoja on pariton määrä. Jos havaintoarvoja on parillinen määrä, mediaani on kahden keskimmäisen keskiarvo.


Keskiarvo

Keskiarvo on havaintoarvojen summa jaettuna havaintoarvojen lukumäärällä.

$$\bar{x}=\frac{x_{1}+x_{2}+\ldots+x_{n}}{n}=\frac{\sum_{i=1}^{n}x_{i}}{n},$$

missä \(x_{1}, x_{2},\ldots, x_{n}\) ovat havaintoarvoja ja \(n\) havaintoarvojen lukumäärä.


Hajontaluvut

Hajontaluvut kuvaavat, kuinka paljon havaintoarvot vaihtelevat keskiarvon ympärillä.

Hajontalukuja ovat muun muassa:


Vaihteluväli

Vaihteluväli ilmaistaan ilmoittamalla tilaston pienin ja suurin havaintoarvo.


Vaihteluvälin pituus

Vaihteluvälin pituus on tilaston suurimman ja pienimmän havaintoarvon erotus.


Keskihajonta

Keskihajonta kuvaa, miten havaintoarvot ovat jakautuneet keskiarvon ympärille. Mitä lähempänä nollaa keskihajonnan arvo on, sitä lähemmäksi keskiarvoa havaintoarvot tilastossa sijoittuvat.


Esim. 1

Määritä havaintoaineiston 8, 7, 9, 10, 9, 6, 9 mediaani, moodi, keskiarvo, vaihteluväli ja vaihteluvälin pituus.


Tunnusluvut laskinohjelmilla

GeoGebran komentoja

  • havaintoarvojen lukumäärä =Pituus()
  • moodi eli tyyppiarvo =Tyyppiarvo()
  • mediaani =Mediaani()
  • keskiarvo =Keskiarvo()
  • keskihajonta =Keskihajonta()
  • otoskeskihajonta =Otoskeskihajonta()
  • pienin arvo =Min()
  • suurin arvo =Max()

LibreOffice Calc -ohjelman komentoja

  • havaintoarvojen lukumäärä =LASKE.A()
  • moodi eli tyyppiarvo =MOODI.USEA()
  • mediaani =MEDIAANI()
  • keskiarvo =KESKIARVO()
  • keskihajonta =KESKIHAJONTA.P()
  • otoskeskihajonta =KESKIHAJONTA.S()
  • pienin arvo =MIN()
  • suurin arvo =MAKS()

Esim. 2

Alla olevassa aineistossa on erään matematiikan opintojakson päättöarvosanojen jakauma.

Määritä GeoGebra-laskinohjelmistolla arvosanojen

a) mediaani

b) keskiarvo

c) (otos)keskihajonta.


Esim. 3

Alla olevassa aineistossa on taulukoituna opiskelijoiden eräällä matematiikan opintojaksolla saamat arvosanat.

Määritä Libre Office Calc -taulukkolaskentaohjelmalla arvosanojen

a) lukumäärä

b) mediaani

c) moodi

d) vaihteluväli

e) vaihteluvälin pituus

f) keskiarvo

g) keskihajonta.


Kappaleen alkuun.



1.4 Jatkuva tilastojakauma

Tilastollinen muuttuja on jatkuva, jos se voi saada minkä tahansa arvon tarkasteluvälillä. Esimerkiksi ihmisen pituus voi mittaustarkkuuden rajoissa saada minkä tahansa lukuarvon siltä lukuväliltä, jolla pituus voi vaihdella.

Jatkuvan tilastollisen muuttujan jakaumaa kutsutaan jatkuvaksi jakaumaksi.

Jatkuvia jakaumia on usein luontevinta käsitellä luokiteltuna.


Esim. 1

Eräällä MAB5-opintojaksolla selvitettiin ryhmän opiskelijoiden pituudet. Pituudet ovat taulukoituna alla olevassa aineistossa.

a) Luokittele pituudet neljään tasalevyiseen luokkaan taulukkolaskentaohjelmalla.

b) Määritä luokkien frekvenssit taulukkolaskentaohjelmalla.

c) Kokoa luokat ja frekvenssit luokitelluksi jatkuvaksi jakaumaksi.

d) Mikä on pituuksien moodiluokka?


Tilastolliset tunnusluvut luokitellulle aineistolla

Luokitellusta aineistoista keskiarvon ja keskihajonnan kaltaisten tunnuslukujen selvittämiseksi on tiedettävä luokkien luokkakeskukset, jotka ovat luokkien todellisten ala- ja ylärajojen keskiarvoja. Todelliset ala- ja ylärajat määritetään edellisen ja seuraavan luokan ylä- ja alarajan puoliväliin (poikkeuksena ikä).


Esim. 2

Määritä arvio esimerkin 1 pituuksien keskiarvolle ja keskihajonnalle luokitellusta aineistosta laskinohjelmalla (GeoGebra). Mikä on pituuksien moodiluokka?


Histogrammi

Histogrammi on pylväskuvaaja, jossa pylväät on ovat kiinni toisissaan. Jatkuvaa jakaumaa kuvataan yleensä histogrammilla.


Esim. 3

a) Määritä esimerkin 1 luokitteluille pituuksille suhteelliset frekvenssit taulukkolaskentaohjelmalla.

b) Piirrä taulukkolaskentaohjelmalla suhteellista jakaumaa kuvaava histogrammi.


Kertymä

Kun frekvenssejä lasketaan yhteen saadaan summafrekvenssi, sf. Summafrekvenssi kuvaa, kuinka paljon havaintoja on kertynyt suuruusjärjestyksessä tiettyyn tilastomuuttujan arvoon mennessä.

Suhteellisille frekvensseille voidaan laska suhteellinen summafrekvenssi, sf %. Suhteellinen summafrekvenssi kuvaa, kuinka suuri osuus havainnoista on kertynyt tiettyyn tilastomuuttujan arvoon mennessä.

Luokitellun aineiston mediaaniluokka löydetään etsimällä se luokka, jonka kohdalla suhteellinen summafrekvenssi ylittää 50 prosentin rajan.

Havaintojen kertymää voidaan kuvata kertymäkuvaajalla.


Esim. 4

a) Määritä esimerkin 3 suhteelliselle jakaumalle suhteelliset summafrekvenssit.

b) Mikä on jakauman mediaaniluokka?

c) Piirrä opiskelijoiden pituuksien kertymäkuvaaja.

d) Kuinka pitkiä ovat alimpaan kvartiiliin kuuluvat opiskelijat eli mitä pituutta lyhyempiä on 25 % opiskelijoista?


Kappaleen alkuun.



2 BINOMIJAKAUMA


2.1 Todennäköisyyden laskusääntöjä

Tapahtumat ovat riippumattomia, jos ne eivät vaikuta toisiinsa.


Riippumattomien tapahtumien kertolaskusääntö ( ja-sääntö)

Todennäköisyys riippumattomien tapahtumien tapahtumiselle yhdessä saadaan kertomalla tapahtumien todennäköisyydet keskenään.


Esim. 1

Matkalla asemalta torille on kahdet liikennevalot. Ensimmäiset ovat vihreänä 30 % ja toiset 40 % ajasta.

Millä todennäköisyydellä molemmat valot ovat vihreänä?


Tapahtumat ovat erillisiä eli toisensa poissulkevia, jos niillä ei ole yhteisiä alkeistapauksia. Kaksi tapahtumaa ovat erillisiä, jos toisen tapahtuessa toinen ei voi tapahtua.


Erillisten tapahtumien yhteenlaskusääntö (tai-sääntö)

Todennäköisyys erillisistä tapahtumista vähintään yhden tapahtumiselle saadaan laskemalla tapahtumien todennäköisyydet yhteen.


Esim. 2

Millä todennäköisyydellä esimerkin 1 liikennevaloista vain yksi on vihreänä?


Tapahtuman ''tapahtuu \(A\)'' vastatapahtuma eli komplementtitapahtuma on ''ei tapahdu \(A\)''.

Tapahtuman \(A\) vastatapahtumaa merkitään \(\bar{A}\).


Vastatapahtuman todennäköisyys

Tapahtuma ja sen vastatapahtuma ovat erilliset ja sisältävät yhdessä kaikki perusjoukon alkeistapaukset. Siten tapahtuman todennäköisyyden ja vastatapahtuman todennäköisyyden summa on yksi eli varma tapahtuma: $$P(A) + P(\bar{A})=1.$$ Näin ollen tapahtuman todennäköisyys voidaan ilmoittaa vastatapahtuman avulla: $$P(A)=1-P(\bar{A}).$$


Esim. 3

Millä todennäköisyydellä kolmella peräkkäisellä nopan heitolla tulee ainakin yksi kuutonen?


Esim. 4

Oletetaan, että seuraavan päivän sää riippuu edellisen päivän säästä seuraavasti: Jos tänään on pouta, huomenna sataa 10 % todennäköisyydellä, ja jos tänään sataa, huomenna sataa 40 % todennäköisyydellä.

Millä todennäköisyydellä keskiviikkona sataa, jos maanantaina satoi?


Kappaleen alkuun.



2.2 Toistokoe

Kertausta

Kuinka monella eri tavalla kolme valkoista ja yksi musta pallo voidaan asettaa jonoon, kun samanväristen pallojen eri järjestyksiä ei huomioida?


Toistokoe tarkoittaa, että


Esim. 1

Millä todennäköisyydellä nopanheitossa neljästä heitosta tasan kolme on kuutosia.



Toistokokeen todennäköisyys

Olkoon tapahtuman \(A\) todennäköisyys \(p\). Tällöin

\(P(''A\ \text{tapahtuu}\ n\ \text{toistossa tasan}\ k\ \text{kertaa}'')\)

\(\displaystyle{=\binom{n}{k}p^{k}(1-p)^{n-k}}.\)


Esim. 2

Koripalloilija heittää vapaaheitolla korin \(80\ \%\) todennäköisyydellä. Oletetaan, että seuraavan heiton onnistumisen todennäköisyys on riippumaton edellisestä heitosta. Millä todennäköisyydellä koripalloilija heittää korin kahdeksalla peräkkäisellä vapaaheitolla

a) tasan kaksi kertaa

b) korkeintaan kaksi kertaa

c) vähintään kolme kertaa?


Kappaleen alkuun.



2.3 Binomijakauma

Satunnaismuuttuja on funktio, joka liittää satunnaisilmiön jokaiseen alkeistapaukseen täsmälleen yhden reaaliluvun, jota kutsutaan satunnaismuuttujan arvoksi.

Jos satunnaismuuttujan arvot ovat erillisiä (esim. kokonaislukuja), kyseessä on diskreetti satunnaismuuttuja.

Satunnaismuuttujan todennäköisyysjakauma saadaan laskemalla satunnaismuuttujan jokaisen arvon todennäköisyys. Todennäköisyysjakauma voidaan diskreetin tilastollisen jakauman tavoin esittää taulukkona tai pylväskuvaajana.


Esim. 1

Heitetään kolikkoa neljä kertaa. Määritetään todennäköisyydet, että kruunia tulee tasan 0, 1, 2, 3 tai 4.


Diskreetti todennäköisyysjakauma

Vasemmanpuoleisessa taulukossa sarakkeessa Mahdolliset heittosarjat on lueteltu satunnaisilmiön Heitetään kolikkoa neljä kertaa kaikki alkeistapaukset. Satunnaismuuttuja on Kruunien lukumäärä, ja sen alla on satunnaismuuttujan saamat arvot. Sarakkeet Kruunien lukumäärä ja Todennäköisyys muodostavat todennäköisyysjakauman. Oikealla todennäköisyysjakauma esitettynä pylväskuvaajana.


Binomijakauma on diskreetti todennäköisyysjakauma, jonka satunnaismuuttujan arvoiksi voidaan valita tapahtuman \(A\) toteutumiskertojen \(k\) lukumäärä \(n\)-toistossa ja satunnaismuuttujan arvojen todennäköisyydet (eli pistetodennäköisyydet) voidaan laskea toistokokeen todennäköisyyksinä.


Merkintä

$$X\ \sim\ \text{Bin}(n,p)$$ tarkoittaa, että satunnaismuuttuja \(X\) noudattaa binomijakaumaa parametrein \(n\) (toistojen määrä) ja \(p\) (tapahtuman \(A\) todennäköisyys).


Binomijakauman pistetodennäköisyyden laskeminen

Olkoon satunnaismuuttuja$$X\ \sim\ \text{Bin}(n,p).$$ Tällöin satunnaismuuttujan \(X\) arvojen todennäköisyydet eli pistetodennäköisyydet lasketaan kaavalla $$P(X=k)=\binom{n}{k}p^{k}(p-1)^{n-k},$$ jossa tapahtuman \(A\) toteutumiskertojen määrä on \(k=0,1,2,\ \ldots\ ,n\).


Huom.

GeoGebran todennäköisyyslaskurilla voidaan määrittää binomijakauma ja todennäköisyyksiä \(P(k_{i_1}\leq X\leq k_{i_2})\). Valitse vaihtoehto Binomijakauma ja syötä arvot parametreille \(n\) ja \(p\).


Esim. 1

Noppaa heitetään 10 kertaa. Olkoon satunnaismuuttuja \(X\): "kuutosten lukumäärä". Määritä GeoGebran todennäköisyyslaskurilla satunnaismuuttujan jakauma. Millä todennäköisyydellä saadaan täsmälleen kolme kuutosta? Anna vastauksesi neljän desimaalin tarkkuudella.


Esim. 2

Olkoon \(X\sim \text{Bin}(10;0{,}2)\) ja \(Y\sim \text{Bin}(10;0{,}8)\). Havainnollista satunnaismuuttujien \(X\) ja \(Y\) jakaumia pylväskuvaajilla. Miten jakaumat eroavat toisistaan?


Kappaleen alkuun.



2.4 Todennäköisyyksiä binomijakaumalla

Esim. 1

Yo, lyhyt matematiikka, syksy 2025, t. 6 (A-osa)

HÄTÄPUHELUT (12 p.)

Hätäkeskukseen soitettiin vuonna 2022 yhteensä 2 920 000 puhelua. Niistä 694 600 oli vahinkopuheluita ja 37 600 häiriköintiä tai muuten asiattomia puheluita. Kutsutaan näitä turhiksi hätäpuheluiksi.

  1. Kuinka monta turhaa hätäpuhelua tuli keskimäärin yhden tunnin aikana? (3 p.)

  2. Arvioi binomijakauman kaavaa käyttämällä, millä todennäköisyydellä kymmenestä satunnaisesti valitusta puhelusta korkeintaan yksi oli turha. (9 p.)

Esim. 2

Tehtaassa on havaittu, että yksi kymmenestä valmistetusta tuotteesta on viallinen.

Arvioi binomijakauman avulla, millä todennäköisyydellä sadan tuotteen erästä

a) täsmälleen 10 on viallisia

b) korkeintaan 10 on viallisia

c) viallisia on yli 10 mutta alle 20.


Kappaleen alkuun.



2.5 Odotusarvo ja keskihajonta

Satunnaismuuttujan todennäköisyysjakaumaa voidaan kuvata tunnusluvuilla kuten tilastollista jakaumaakin. Todennäköisyysjakauman tunnuslukuja ovat satunnaismuuttujan odotusarvo ja satunnaismuuttujan keskihajonta.


Binomijakauman odotusarvo ja keskihajonta

Olkoon satunnaismuuttuja$$X\ \sim\ \text{Bin}(n,p).$$ Tällöin satunnaismuuttujan odotusarvo on $$E(X)=\mu=np$$ ja keskihajonta $$D(X)=\sigma=\sqrt{np(1-p)}.$$


Satunnaismuuttujan odotusarvo ilmaisee, mitä lukua satunnaismuuttujan saamien arvojen keskiarvo lähestyy toistettaessa satunnaisilmiötä lukuisia kertoja.

Satunnaismuuttujan keskihajonta kuvaa satunnaismuuttujan arvojen vaihtelun suuruutta odotusarvon ympärillä.


Esim. 1

Satunnaismuuttuja noudattaa binomijakaumaa \(X\sim\text{Bin}(20;0{,}3)\). Laske satunnaismuuttujan

a) odotusarvo

b) keskihajonta.


Esim. 2

Tehtaassa on havaittu, että yksi kymmenestä valmistetusta tuotteesta on viallinen.

Tuotetta valmistetaan sadan kappaleen erä. Määritä viallisten tuotteiden

a) odotusarvo

b) keskihajonta.


Kappaleen alkuun.



3 NORMAALIJAKAUMA


3.1 Normaalijakauma

Normaalijakauma on jatkuva todennäköisyysjakauma. Todennäköisyysjakauma on jatkuva, jos satunnaismuuttuja voi saada minkä tahansa arvon tarkasteluvälillä. Monia luonnossa esiintyviä ilmiöitä voidaan mallintaa normaalijakaumalla.


Merkintä

$$X\ \sim\ \text{N}(\mu,\sigma)$$ tarkoittaa, että satunnaismuuttuja \(X\) noudattaa normaalijakaumaa parametrein \(\mu\) (odotusarvo) ja \(\sigma\) (keskihajonta).


Normaalijakauman tiheysfunktion kuvaaja on keskilinjan suhteen symmetrinen käyrä (ns. Gaussin käyrä tai ''kellokäyrä'').

Yllä olevan kuvan normaalijakauman odotusarvo on \(\mu=172\) ja keskihajonta \(\sigma=2\).

Normaalisti jakautuneella satunnaismuuttujalla todennäköisyys, että satunnaismuuttujan arvo on korkeintaan yhden keskihajonnan päässä odotusarvosta on 34 % + 34 % = 68 %, ja todennäköisyys, että satunnaismuuttujan arvo on yhden viiva kahden keskihajonnan päässä on 14 % + 14 % = 28 %. Todennäköisyys, että satunnaismuuttujan arvo on yli kahden keskihajonnan etäisyydellä odotusarvosta on 2 % + 2 % = 4 %.

Esim. 1

Oppitunnilla käydään kirjan kappaleen 8 esimerkki 1.


Esim. 2

Suomalaisten naisten keskipituus on 167,5 cm ja pituuden keskihajonta 5,40 cm. Suomalaisten miesten keskipituus on 181,0 cm ja pituuden keskihajonta 6,06 cm. Oletetaan suomalaisten miesten ja naisten pituudet normaalijakautuneiksi.

Millä todennäköisyydellä satunnaisesti valittu

a) nainen on alle 162 cm pitkä?

b) mies on yli 180 cm pitkä?

c) mies on pituudeltaan 175 - 185 cm?


Kappaleen alkuun.



3.2 Normaalijakaumatehtäviä

Esim. 1

Erään pääsykokeen keskiarvo oli 60 ja keskihajonta 12. Tulokset noudattivat normaalijaukaumaa. Mikä oli valintaan tarvittava pistemäärä, jos kokelaista 30 % valittiin?


Esim. 2

Suomalaisten naisten keskipituus on 167,5 cm ja pituuden keskihajonta 5,40 cm. Määritä keskiarvon suhteen symmetrinen väli, johon kuuluu 60 % naisista. Oletetaan suomalaisten naisten pituudet normaalijakautuneiksi.


Esim. 3

Yo, lyhyt matematiikka, syksy 2022, t. 9 (B1-osa)

SUOMALAISTEN MIESTEN JA NAISTEN PITUUDET (12 p.)

Suomalaisten naisten keskipituus on 167,5 cm ja pituuden keskihajonta 5,40 cm. Suomalaisten miesten keskipituus on 181,0 cm ja pituuden keskihajonta 6,06 cm. Oletetaan suomalaisten miesten ja naisten pituudet normaalijakautuneiksi.

  1. Laske todennäköisyys, että kun valitaan satunnaisesti yksi suomalainen mies ja yksi suomalainen nainen, niin molemmat ovat lyhyempiä kuin 160 cm. (6 p.)

  2. Annelin pituus on 171 cm. Hän laskee todennäköisyyden, että satunnaisesti valittu suomalainen nainen on häntä itseään pidempi mutta ei kuitenkaan enempää kuin x cm, ja saa tulokseksi 0,1. Mikä on Annelin käyttämä luku x? (6 p.)

Kappaleen alkuun.



3.3 Normitettu normaalijakauma

Normitetun normaalijakauman eli standardinormaalijakauman odotusarvo on \(0\) ja keskihajonta \(1\).


Merkintä

$$Z\ \sim\ \text{N}(0,1)$$ tarkoittaa, että satunnaismuuttuja \(Z\) noudattaa normitettua normaalijakaumaa parametrein \(0\) (odotusarvo) ja \(1\) (keskihajonta).


Huom.

Koska normitetun normaalijakauman odotusarvo on \(0\), niin sen tiheysfunktion kuvaaja on symmetrinen y-akselin suhteen.


Esim. 1

Satunnaismuuttuja \(Z\) noudattaa normitettua normaalijakaumaa. Määritä

a) todennäköisyys \(P(Z\le-1{,}2)\)

b) satunnaismuuttujan arvo \(a\), jolla \(P(Z\le a)=0{,}56\).


Mikä tahansa normaalijakauma voidaan normittaa eli kuvata normitetulle normaalijakaumalle.


Normittaminen

Jos normaalijakaumassa satunnaismuuttuja \(X\sim \text{N}(\mu,\sigma)\), niin vastaavassa normitetussa normaalijakaumassa satunnaismuuttuja \(Z=\frac{X-\mu}{\sigma}\sim \text{N}(0,1)\).


Huom.

Satunnaismuuttujan \(X\) arvoa \(x\) vastaava normitettu arvo \(z=\frac{x-\mu}{\sigma}\) ilmaisee, kuinka monen keskihajonnan \(\sigma\) verran arvo \(x\) poikkeaa odotusarvosta \(\mu\) ja mihin suuntaan.


Esim. 2

Satunnaismuuttuja \(X\sim\text{N}(42,3)\). Laske arvoa \(x\) vastaava normitettu arvo. Kuinko monen keskihajonnan verran ja mihin suuntaan arvo \(x\) poikkeaa odotusarvosta 42?

a) \(x=48\)

b) \(x=30\)


Esim. 3

Kahvi myydään 500 g pakkauksissa. Automaattisesti pakatun kahvin määrä pakkauksessa noudattaa normaalijakaumaa. Mikä on odotusarvon oltava, jos keskihajonta on 4 g ja 90 prosentissa pakkauksista on oltava kahvia vähintään 500 g?


Kappaleen alkuun.



3.4 Normaalijakauma ja binomijakauma

Toistokokeeseen liittyviä todennäköisyyksiä voidaan mallintaa binomijakauman avulla. Kun toistojen lukumäärä kasvaa, binomijakauman kuvaajan muoto lähestyy normaalijakauman kuvaajaa.

Esim. 1

Satunnaismuuttuja \(X\sim\text{Bin}(n;0{,}2)\). Vertaa GeoGebran todennäköisyyslaskurilla binomijakauman ja normaalijakauman muotoa, kun

a) \(n=5\)

b) \(n=50\)

c) \(n=150\).


Esimerkissä 1 GeoGebran työkalu sovittaa binomijakaumaan normaalijakauman, jolla on sama odotusarvo ja keskihajonta kuin binomijakaumalla.

Binomijakauman odotusarvo \(\mu\) ja keskihajonta \(\sigma\) voitiin laskea, jos tunnettiin toistokokeen toistojen lukumäärä \(n\) ja toistettavan tapahtuman todenköisyys \(p\).


Binomijakauman odotusarvo

\(\mu=np\).


Binomijakauman keskihajonta

\(\sigma=\sqrt{np(1-p)}\).


Esim. 2

Kolikkoa heitetään 20 kertaa. Määritä todennäköisyys, että saadaan täsmälleen 12 kruunaa

a) toistokokeen todennäköisyyden laskukaavalla

b) mallintamalla normaalijakaumalla.


Esim. 3

Jousiampuja ampuu kympin todennäköisyydellä 0,4. Oletetaan, että peräkkäisten ammuntojen tulokset ovat riippumattomia. Arvioi normaalijakaumalla todennäköisyyttä, että jousiampuja ampuu 500 peräkkäisellä kerralla 200 - 210 kymppiä.


Kappaleen alkuun.



3.5 Normaalijakauman taulukko

Normitetun normaalijakauman kertymäfunktion taulukoitujen arvojen avulla voidaan ratkoa binomi- ja normaalijakaumien todennäköisyyksiin liittyviä ongelmia silloin, kun käytössä ei ole tähän soveltuvia ohjelmistoja.

Normaalijakauman taulukko.


Esim. 1

Määritä normaalijakauman taulukon avulla todennäköisyys \(P(-1{,}21\le Z\le0{,}96)\).


Esim. 2

Suomalaisten naisten keskipituus on 167,5 cm ja pituuden keskihajonta 5,40 cm. Oletetaan suomalaisten naisten pituudet normaalijakautuneiksi. Kuinka monta prosenttia naisista on alle 165 cm pitkiä?


Esim. 3

Suomalaisten naisten keskipituus on 167,5 cm ja pituuden keskihajonta 5,40 cm. Oletetaan suomalaisten naisten pituudet normaalijakautuneiksi. Määritä pituus, jota lyhyempiä on 90 % suomalaisista naisista.


Kappaleen alkuun.



4 LUOTTAMUSVÄLI


4.1 Keskiarvon keskivirhe

Keskiarvon keskivirhe kuvaa, kuinka paljon otoskeskiarvot poikkeavat keskimäärin perusjoukon keskiarvosta.


Keskiarvon keskivirhe

\(s_{\bar{x}}=\dfrac{s}{\sqrt{n}}\),

missä \(s\) on perusjoukon keskihajonta ja \(n\) on otoskoko.


Huom.

Jos otoskoko \(n\) on vähintään 30, voidaan perusjoukon keskihajonnan sijasta käyttää otoskeskihajontaa.


Otoskeskiarvojen arvioiminen normaalijakaumalla

Perusjoukosta poimittujen kaikkien mahdollisten yhtä suurten otosten otoskeskiarvot noudattavat normaalijakaumaa, jonka

  • odotusarvo on perusjoukon keskiarvo ja

  • keskihajonta keskiarvon keskivirhe.

Esim. 1

Oppikirjan kpl 13 E1.


Kappaleen alkuun.



4.2 Otoskeskiarvon luottamusväli

Virhemarginaali ilmaisee, kuinka paljon perusjoukon keskiarvo enintään poikkeaa otoskeskiarvosta.

Keskiarvon luottamusväli on lukuväli, jolla perusjoukon keskiarvo on tietyllä todennäköisyydellä.

Luottamusvälin pituus määräytyy sen mukaan, kuinka suurella varmuudella eli luottamustasolla virhemarginaali halutaan tietää. Jos esimerkiksi käytetään 95 %:n luottamustasoa, niin luottamusväli sisältää 95 %:n varmuudella perusjoukon todellisen keskiarvon.

Luottamustasoja vastaavia kriittisiä arvoja on taulukoitu.

Luottamustaso Kriittinen arvo
95 % 1,96
99 % 2,58
99,9 % 3,29


Keskiarvon virhemarginaali

Keskiarvon virhemarginaali lasketaan:

\(\text{kriittinen arvo}\cdot\frac{s}{\sqrt{n}}\),

missä \(s\) on perusjoukon keskihajonta ja \(n\) on otoskoko.


Keskiarvon luottamusväli

\(\left[\bar{x}-\text{virhemarginaali},\bar{x}+\text{virhemarginaali}\right]\),

missä \(\bar{x}\) on otoskeskiarvo.


Huom.

Jos otoskoko \(n\) on vähintään 30, voidaan perusjoukon keskihajonnan sijasta käyttää jälleen otoskeskihajontaa.


Esim. 1

Oppikirjan kpl 13 E2.


Kappaleen alkuun.



4.3 Prosenttiosuuden luottamusväli

Prosenttiosuuden luottamusväli eli suhteellisen osuuden luottamusväli on lukuväli, jolla prosenttiosuus on tietyllä todennäköisyydellä.


Prosenttiosuuden virhemarginaali

Prosenttiosuuden virhemarginaali lasketaan:

\(\text{kriittinen arvo}\cdot\sqrt{\frac{p(1-p)}{n}}\),

missä \(p\) on otoksesta määritetty prosenttiosuus desimaalilukuna ja \(n\) on otoskoko.


Prosenttiosuuden luottamusväli

\(\left[p-\text{virhemarginaali},p+\text{virhemarginaali}\right]\),

missä \(p\) on otoksesta määritetty prosenttiosuus desimaalilukuna.


Esim. 1

Oppikirjan kpl 14 E1.


Kappaleen alkuun.