Käyttöympäristö tekstin ja numeerisen tiedon luovaan käsittelyyn

SURVO MM
Etusivu  |  Keskustelu  |  Uutuudet  |  Download  |  Flash

Tilastolliset monimuuttujamenetelmät

Oppikirjan

Mustonen, S. (1995). Tilastolliset monimuuttujamenetelmät. Survo Systems, Helsinki. (209 s.) ISBN 951-96634-1-X
PDF-versio ja kirjan esimerkit ovat olleet saatavilla verkosta marraskuusta 2004 lähtien.

Taustaa

Seppo Mustonen:

Olen pitänyt Helsingin yliopistossa tilastollisten monimuuttujamenetelmien kurssia vuodesta 1964 lähtien, aluksi matematiikan laitoksella ja myöhemmin kesäyliopistossa ja tilastotieteen laitoksella ehkä lähes parikymmentä kertaa.

Kysyntää oli jo alkuvaiheessa. Ensimmäiselle kurssille ilmoittautui yli 60 osanottajaa, mukana mm. tulevat professorit Pentti Manninen, Timo Mäkeläinen, Leif Nordberg, Seppo Sarna, Timo Teräsvirta ja Tapani Valkonen.

Alkuvaiheissa opetukseni perustui teorian osalta T.W.Andersonin kirjaan "An Introduction to Multivariate Statistical Analysis" (1958). Myöhemmin olen, turhan koukeroisia matemaattisia keinoja välttäen, yrittänyt rakentaa teoriaosan yksinkertaisemmalla tavalla tarkkuudesta tinkimättä. Esim. multinormaalijakauman määrittely yksiulotteisten normaalisten muuttujien eri tavoin painotettujen summien yhteisjakaumana on paljon selkeämpää kuin lähtemällä raa'asti esim. jakauman tiheysfunktiosta. Monet po. jakauman tärkeät ominaisuudet pystyy johtamaan tuon konkreettisen määritelmän avulla olennaisesti helpommin kuin integroimalla tiheysfunktiota ja sen johdannaisia. Lineaarikuvauksen purkaminen matriisin singulaariarvohajotelman avulla on pitkään ollut suosikkityövälineeni melkein kaikkien monimuuttujamenetelmien hallinnassa.

Vuonna 1995 julkaisin luentomuistiinpanoni kirjana, jonka kannesta kanteen tuotin Survon avulla. Kirja sisältää runsaasti esimerkkejä, joihin liittyvät laskelmat ja kuvanpiirrot on esitetty valmiina Survon työkaavioina ja jotka ovat nyt saatavilla myös verkon välityksellä. Aikaisemmin esimerkit annettiin kurssien osanottajille levykkeellä.

Kirjan uusi laitos

Kirjan uusi laitos
http://www.survo.fi/mustonen/monim.pdf
on sanasta sanaan ja kaavasta kaavaan sama kuin vuoden 1995 kirja. Vain painovirheitä on karsittu.

Survossa on tapahtunut paljon uutta kehittelyä vuoden 1995 jälkeen myös monimuuttujamenetelmien alueella.

Kirjan esimerkit

Kirjan Survolla suoritettavat esimerkit ovat saatavilla pakattuna tiedostona
http://www.survo.fi/mustonen/multi.zip

Esimerkkitiedostot voi purkaa mihin tahansa (mieluiten uuteen) hakemistoon (esim. D:\MULTI) vaikkapa UNZIP-ohjelmalla. Esimerkkiluettelo viitteineen kirjan sivuille löytyy tällöin (hakemiston D:\MULTI) toimituskentästä INDEX.

Koska Survoon on tehty vuoden 1995 jälkeen monia uudistuksia, useat esimerkkilaskelmat voi nykyisin tehdä helpommin ja nopeammin.

Survon uusia ominaisuuksia

Survoon on tehty vuoden 1995 jälkeen monia uudistuksia, joista hyödyllisiä monimuuttujamenetelmien yhteydessä ovat mm. seuraavat:

Matriisitulkki

Matriisitulkkia on yleistetty mm. niin, että käskyissä saa esiintyä mutkikkaitakin matriisilausekkeita.

Esim. ortogonaalista faktorirakenteen mukaisen korrelaatiomatriisin
R=A*A'+PSI,
kun A tiedetään, voi nykyään laskea lyhyesti käskyillä

MAT DIM A
MAT R=A*A'+IDN(rowA,rowA)-DV(VD(A*A'))

kun vastaava laskenta jouduttiin aikaisemmin (kirjan tekovaiheessa) paloittelemaan ja tarvittiin seuraavat käskyt:

MAT DIM A
MAT R=A'
MAT R=A*R
MAT D=VD(R)
MAT D=DV(D)
MAT I=IDN(rowA,rowA)
MAT PSI!=I-D
MAT R=R+PSI

Entinen paloittelutyyli on edelleen täysin kelvollinen, mutta johtaa hitaampaan toteutukseen kuin uusi. Vaikka komennossa
MAT R=A*A'+IDN(rowA,rowA)-DV(VD(A*A'))
työläin laskettava A*A' esiintyy kahdesti, matriisitulkki laskee sen vain kerran ja pitää muistissaan toista kertaa varten. Lisäksi tulkki "tajuaa", että tulomatriisi A*A' on aina symmetrinen, jolloin se laskee vain "puolet" alkioista ja kopioi loput.

MNSIMUL multinormaalijakauman simulointiin

Kirjassa käytetään tähän tehtävään sukroa /MNSIMUL, joka on edelleen olemassa, mutta paljon (noin 50 kertaa) nopeampi vaihtoehto on MNSIMUL-komento (C-ohjelma), joka on käyttötavaltaan samanlainen kuin sukro /MNSIMUL.

Muita uusia toimintoja

Saat tarkempia tietoja eri toiminnoista käyttäessäsi Survoa aktivoimalla alla olevia kyselyjä.

MNTEST? otoksen multinormaalisuuden testaamiseen
TEST?:4 erilaisiin multinormaalisten otosten vertailuihin
MULTVAR? moniulotteisen vaihtelun mittaamiseen
ROTATE? täsmennyksellä ROTATION=GRAPHICAL graafiseen rotaatioon (omassa ikkunassaan ja hiirellä ohjattuna)
/LOADFACT ? faktorimatriisin esittämiseen toimituskentässä erilaisin tehostuksin ja järjestelyin
CANON? kanonisiin korrelaatioihin (korvaa sukron /CANCORR)
DCLUSTER? ryhmittelyanalyysiin medoidi-menetelmällä ym.
HCLUSTER? hierarkiseen ryhmittelyyn (Fredrik Åberg)
/MCORRESP korrespondenssianalyysin yleistyksiin (Kimmo Vehkalahti)
RELIAB? mitta-asteikkojen reliabiliteettien laskentaan (Kimmo Vehkalahti)
PLOTSUC? (Kimmo Vehkalahden tekemä 7 sukron kokoelma) erilaisiin yhdistettyjen graafisten esitysten tekoon. Näistä useimmat liittyvät kaksi- tai useampiulotteisten aineistojen kuvaamiseen. Esimerkkejä mm. näistä löytyy Vehkalahden luentomonisteesta.

Tenttitehtäviä

Vuosina 1994-2000 Helsingin yliopiston tilastotieteen laitoksella pitämilläni kursseilla eräs suoritusvaihtoehto on ollut Survon äärellä 3 tunnin aikana tapahtuva 5-6 tehtävän ratkaiseminen. Se oli opiskelijoilla tavanomaiseen kirjatenttiin verrattuna selvästi suositumpi vaihtoehto. Survolla tapahtuvassa tentissä oli sallittua pitää mukanaan mitä kirjallisuutta tahansa. Vain yhteydenpito ulkomaailmaan oli kielletty.

Tenttitehtävät on koottu sivulle http://www.helsinki.fi/survo/mindex.html.

Lisää Survoon liittyviä kirjoja

Etusivu  |  Keskustelu  |  Uutuudet  |  Download  |  Flash
Copyright © Survo Systems 2001-2009. All rights reserved.
Updated 2009-08-13 by webmaster'at'survo.fi.
Best viewed with any browser.