1.5 Jakauma

Tilastossa tarkastellaan yhtä ominaisuutta kerrallaan ja tehdään siitä mittaukset kunkin havainnon (esimerkiksi henkilön) kohdalla erikseen. Kutakin havaintoa koskevan mittauksen tulos eroaa toisista enemmän tai vähemmän ja tulokset muodostavat tarkasteltavan ominaisuuden suhteen jakauman. Yksinkertaisin jakauma syntyy ns. tukkimiehen kirjanpidon avulla.

Suomen väestö ikäryhmittäin (5-v.), 2006

Lähde: Tilastokeskus, väestö, http://tilastokeskus.fi/til/vaerak/tau.html (22.2.2007)

Jakaumaa voidaan kuvata mitta-asteikolla esimerkiksi histogrammin  avulla. Siinä tutkittavan joukon tapaukset on sijoitettu käytetyn mittarin luokkiin ikään kuin päällekkäin. Näin saatu kuvio kuvaa, kuinka monta tapausta kuhunkin luokkaan sijoittuu.

Jakauman huipuksi kutsutaan sitä kohtaa, johon osuu eniten havaintoja. Usein se on lähellä jakauman keskiarvoa.

Jakauman muoto vaihtelee

Jakaumat ovat muodoltaan hyvin monenlaisia. Yleisimmin tunnettu jakauma on normaalijakauma, jota joskus kutsutaan myös Gaussin käyräksi. Siinä valtaosa havainnoista keskittyy keskiarvon lähelle ja se on symmetrinen. Symmetrisyys tarkoittaa, että positiivisia poikkeamia keskiarvosta on suunnilleen samassa määrin kuin negatiivisia. Kun keskiarvosta edetään positiiviseen tai negatiiviseen suuntaan vähenee havaintojen määrä. Normaalijakaumassa puolet havainnoista on korkeintaan keskihajonnan etäisyydellä keskiarvosta, 95 % havainnoista on korkeintaan kahden keskihajonnan etäisyydellä keskiarvosta.

Suuri osa tilastollisista malleista ja teoriasta on tehty juuri normaalijakaumaa ajatellen. Ajatuksena on, että suurissa joukoissa asiat jakautuvat sattumanvaraisesti niin, että syntyy kellomainen normaalijakauma. Esimerkiksi ihmisten aikuisiän pituus sukupuolen mukaan rajatussa joukossa on usein normaalisti jakautunut keskipituuden ympärille.

Kaikki jakaumat eivät tietenkään ole normaalijakaumia. Jakaumassa voi olla kaksi huippua tai jakaumat voivat olla vinoja. Vinolla jakaumalla tarkoitetaan sitä, että jakauman huippu sijaitsee jakauman toisessa reunassa. Kaksihuippuinen jakauma saadaan aikaan yhdistämällä kaksi selvästi erilaista ryhmää, esimerkiksi pituutta mitattaessa kaksi eri ikäluokkaa. Hyvä esimerkki vinosta jakaumasta on tulojen jakautuminen. Valtaosa tulonsaajista sijoittuu tulojakauman alapäähän. Suuret, ns. keskituloiset ryhmät ovat koko tulohaitarin pituuteen nähden melko vähän ansaitsevia. Tulojakauma venyy euromääräisesti pitkäksi keskituloisista ylöspäin, alaspäin ei ole tilaa venyä.

Tulonsaajien lukumäärä tuloluokittain 2005

Lähde: Tilastokeskus, tulonjakotilasto

Jakauma on joko luokiteltu tai jatkuva-arvoinen

Jakauman esittämiä mittareita kutsutaan yleensä muuttujiksi. Muuttuja voi olla jatkuva-arvoinen tai epäjatkuva. Jatkuva-arvoisessa muuttujassa kaikilla havainnolla on omat mittalukunsa, kun taas epäjatkuvassa muuttujassa havainnot sijoittuvat suurempiin ryhmiin.

Käsittelyn helpottamiseksi jatkuva-arvoiset jakaumat esitetään yleensä luokiteltuina. Luokittelu on ikään kuin karkea mittauslaite, joka ei ota huomioon pieniä yksityiskohtia.

Pituuden mittaustulokset jatkuva-arvoisena muuttujana

Pituus (cm) Havainnot
165,5 1
167 1
169,3 1
170,7 1
172 1
175 1
176,5 1
180,5 1
181 1
183,7 1

Pituuden mittaustulokset luokiteltuna muuttujana

Pituus (cm) Havainnot
165-169 3
170-179 4
180- 3

Oikea tapa luokitella havaintoja riippuu tiedon käyttötarkoituksesta. Yleisperiaatteena on kuitenkin se, että luokittelu ei saa muuttaa havaitun jakauman muotoa olennaisesti. Tyhjiä luokkia tulee välttää. Toisaalta luokkien olisi hyvä olla tasavälisiä, ts. kaikkien luokkien tulisi kattaa luokittelumuuttujasta yhtä suuri alue - lukuun ottamatta asteikon ylä- ja alapään reunaluokkia (esimerkiksi ikäjakaumassa vanhimmat ikäryhmät niputetaan usein yhteen, koska vanhimpien ikäluokkien koko on hyvin pieni).

Harjoitukset



Linkkipolku

Olet sivulla: Etusivu > Tuotteet ja palvelut > Verkkopalvelut > Verkkokoulu > Tilastojen luku- ja käyttötaito > Tilastoajattelun perusteet > 1.5 Jakauma

Navigointi

Tuotteet ja palvelut

Verkkokoulu

På svenska In English Tulostusversio
Hakemisto| Sivukartta| Palaute| Yhteystiedot
Förstasidan| Home
Etusivu Tilastot Tietoa tilastoista Tiedonkeruut Tuotteet ja palvelut Ajankohtaista Tilastokeskus

Haku

Tilastokeskus
Tilastokeskus PalloVaihde (09) 17 341 PalloYhteystiedot PalloTekijänoikeudet ja käyttöehdot PalloPalaute