Oppikirjan
Mustonen, S. (1995). Tilastolliset monimuuttujamenetelmät. Survo
Systems, Helsinki. (209 s.) ISBN 951-96634-1-X
PDF-versio ja kirjan esimerkit ovat olleet saatavilla verkosta
marraskuusta 2004 lähtien.
Seppo Mustonen:
Olen pitänyt Helsingin yliopistossa tilastollisten monimuuttujamenetelmien kurssia vuodesta 1964 lähtien, aluksi matematiikan laitoksella ja myöhemmin kesäyliopistossa ja tilastotieteen laitoksella ehkä lähes parikymmentä kertaa.
Kysyntää oli jo alkuvaiheessa. Ensimmäiselle kurssille ilmoittautui yli 60 osanottajaa, mukana mm. tulevat professorit Pentti Manninen, Timo Mäkeläinen, Leif Nordberg, Seppo Sarna, Timo Teräsvirta ja Tapani Valkonen.
Alkuvaiheissa opetukseni perustui teorian osalta T.W.Andersonin kirjaan "An Introduction to Multivariate Statistical Analysis" (1958). Myöhemmin olen, turhan koukeroisia matemaattisia keinoja välttäen, yrittänyt rakentaa teoriaosan yksinkertaisemmalla tavalla tarkkuudesta tinkimättä. Esim. multinormaalijakauman määrittely yksiulotteisten normaalisten muuttujien eri tavoin painotettujen summien yhteisjakaumana on paljon selkeämpää kuin lähtemällä raa'asti esim. jakauman tiheysfunktiosta. Monet po. jakauman tärkeät ominaisuudet pystyy johtamaan tuon konkreettisen määritelmän avulla olennaisesti helpommin kuin integroimalla tiheysfunktiota ja sen johdannaisia. Lineaarikuvauksen purkaminen matriisin singulaariarvohajotelman avulla on pitkään ollut suosikkityövälineeni melkein kaikkien monimuuttujamenetelmien hallinnassa.
Vuonna 1995 julkaisin luentomuistiinpanoni kirjana, jonka kannesta kanteen tuotin Survon avulla. Kirja sisältää runsaasti esimerkkejä, joihin liittyvät laskelmat ja kuvanpiirrot on esitetty valmiina Survon työkaavioina ja jotka ovat nyt saatavilla myös verkon välityksellä. Aikaisemmin esimerkit annettiin kurssien osanottajille levykkeellä.
Survossa on tapahtunut paljon uutta kehittelyä vuoden 1995 jälkeen myös monimuuttujamenetelmien alueella.
Kirjan Survolla suoritettavat esimerkit ovat saatavilla pakattuna
tiedostona
http://www.survo.fi/mustonen/multi.zip
Esimerkkitiedostot voi purkaa mihin tahansa (mieluiten uuteen)
hakemistoon (esim. D:\MULTI
) vaikkapa UNZIP
-ohjelmalla.
Esimerkkiluettelo viitteineen kirjan sivuille löytyy tällöin (hakemiston
D:\MULTI
) toimituskentästä INDEX
.
Koska Survoon on tehty vuoden 1995 jälkeen monia uudistuksia, useat esimerkkilaskelmat voi nykyisin tehdä helpommin ja nopeammin.
Survoon on tehty vuoden 1995 jälkeen monia uudistuksia, joista hyödyllisiä monimuuttujamenetelmien yhteydessä ovat mm. seuraavat:
Matriisitulkkia on yleistetty mm. niin, että käskyissä saa esiintyä mutkikkaitakin matriisilausekkeita.
Esim. ortogonaalista faktorirakenteen mukaisen korrelaatiomatriisin
R=A*A'+PSI
,
kun A
tiedetään, voi nykyään laskea lyhyesti käskyillä
MAT DIM A MAT R=A*A'+IDN(rowA,rowA)-DV(VD(A*A'))
kun vastaava laskenta jouduttiin aikaisemmin (kirjan tekovaiheessa) paloittelemaan ja tarvittiin seuraavat käskyt:
MAT DIM A MAT R=A' MAT R=A*R MAT D=VD(R) MAT D=DV(D) MAT I=IDN(rowA,rowA) MAT PSI!=I-D MAT R=R+PSI
Entinen paloittelutyyli on edelleen täysin kelvollinen, mutta johtaa
hitaampaan toteutukseen kuin uusi. Vaikka komennossa
MAT R=A*A'+IDN(rowA,rowA)-DV(VD(A*A'))
työläin laskettava A*A'
esiintyy kahdesti, matriisitulkki laskee
sen vain kerran ja pitää muistissaan toista kertaa varten.
Lisäksi tulkki "tajuaa", että tulomatriisi A*A'
on aina symmetrinen,
jolloin se laskee vain "puolet" alkioista ja kopioi loput.
Kirjassa käytetään tähän tehtävään sukroa /MNSIMUL
, joka on edelleen
olemassa, mutta paljon (noin 50 kertaa) nopeampi vaihtoehto on
MNSIMUL
-komento (C-ohjelma), joka on käyttötavaltaan samanlainen
kuin sukro /MNSIMUL
.
Saat tarkempia tietoja eri toiminnoista käyttäessäsi Survoa aktivoimalla alla olevia kyselyjä.
MNTEST? | otoksen multinormaalisuuden testaamiseen |
TEST?:4 | erilaisiin multinormaalisten otosten vertailuihin |
MULTVAR? | moniulotteisen vaihtelun mittaamiseen |
ROTATE? | täsmennyksellä ROTATION=GRAPHICAL graafiseen rotaatioon
(omassa ikkunassaan ja hiirellä ohjattuna) |
/LOADFACT ? | faktorimatriisin esittämiseen toimituskentässä erilaisin tehostuksin ja järjestelyin |
CANON? | kanonisiin korrelaatioihin (korvaa sukron /CANCORR ) |
DCLUSTER? | ryhmittelyanalyysiin medoidi-menetelmällä ym. |
HCLUSTER? | hierarkiseen ryhmittelyyn (Fredrik Åberg) |
/MCORRESP | korrespondenssianalyysin yleistyksiin (Kimmo Vehkalahti) |
RELIAB? | mitta-asteikkojen reliabiliteettien laskentaan (Kimmo Vehkalahti) |
PLOTSUC? | (Kimmo Vehkalahden tekemä 7 sukron kokoelma) erilaisiin yhdistettyjen graafisten esitysten tekoon. Näistä useimmat liittyvät kaksi- tai useampiulotteisten aineistojen kuvaamiseen. Esimerkkejä mm. näistä löytyy Vehkalahden luentomonisteesta. |
Vuosina 1994-2000 Helsingin yliopiston tilastotieteen laitoksella pitämilläni kursseilla eräs suoritusvaihtoehto on ollut Survon äärellä 3 tunnin aikana tapahtuva 5-6 tehtävän ratkaiseminen. Se oli opiskelijoilla tavanomaiseen kirjatenttiin verrattuna selvästi suositumpi vaihtoehto. Survolla tapahtuvassa tentissä oli sallittua pitää mukanaan mitä kirjallisuutta tahansa. Vain yhteydenpito ulkomaailmaan oli kielletty.
Tenttitehtävät on koottu sivulle http://www.helsinki.fi/survo/mindex.html.
Lisää Survoon liittyviä kirjoja