[vastaus aiempaan viestiin]
Kirjoittaja: | Jukka Ranta |
---|---|
Sähköposti: | jukka.ranta'at'eela.fi |
Päiväys: | 11.12.2002 10:13 |
Tervehdys! Sepon ja Laurin kommentit ovat jo varsin tyhjentäviä, mutta en malta olla lisäämättä myllyyn vielä muutamaa: >>Jos 5 prosentille kokelaista suodaan laudatur, voi pisterajan toki >>määrätä suoraan empiirisen jakaumankin pohjalta ilman >>normaalisuusolettamusta. > >Tämä on myös varsin oleellinen huomautus, ei aina ole pakko >lähteä liikkeelle puhdasoppisista matemaattisista rakennelmista, >vaan usein olisi syytä lähteä myös empiirisestä todellisuudesta. Tässä esimerkissä olisi ollut erittäin hyvä tilaisuus myös demonstroida sitä mikä ero on tilanteilla joissa A) dataa ei vielä ole, ja B) kun data on havaittu. Oleellista on tietää halutaanko pisterajat lyödä lukkoon *ennen* kokeita vai vasta kokeiden tulosten *jälkeen*. Ohjelmassa näytetty esimerkki koskee ensin mainittua tilannetta, vaikka siinä ei valitettavasti suoraan niin sanottukaan. Jos rajat määrätään priorisesti, niin kyseistä empiiristä aineistoa ei silloin vielä ole olemassa, joten Sepon ehdottama ratkaisu ei ole vielä tässä vaiheessa käytettävissä. Tämä esimerkki sopisi hyvin myös Bayes-analyysin havainnollistamiseksi. Priorijakauma voidaan konstruoida aiempien koetulosten perusteella, mutta uudelle kokeelle se on vain abstrakti ennustemalli jossa voi olla käytetty normaalijakaumaa tai sitten jotain muuta. Tätä voidaan sitten tarkentaa kun uutta dataa saadaan - laskemalla posteriorijakauma, tai vaikkapa posterioriprediktiivinen jakauma taas seuraavan vuoden tuloksille. Empiria olisi tässäkin vahvasti taustalla, mutta ohjelmassa voisi tehdä paremmin selkoa siitä mikä on aiempaa empiriaa (aiempaa dataa) ja mikä on vasta mahdollisesti tulossa; eli mikä on tunnettua ja mikä tuntematonta sillä hetkellä kun analyysi ja päätökset tehdään. Todellisuudessahan pisterajat on alustavasti määrätty ennakkoon, mutta tutkintolautakunta saattaa joskus muuttaa niitä jälkeenpäin saamiensa koetulosten perusteella. Voisi myös keskustella onko pisterajojen rukkaaminen jälkikäteen edes moraalisesti oikein mutta se ehkä menee jo ohi tilastotieteen?... (Tavallaan tilanne on hieman sama kuin jos kauppias tulisi viikon kuluttua asiakkaan luo hakemaan osan kauppatavaroista takaisin ja sanoisi että kauppapäivän kokonaistuloksen perusteella maksu ei riittänytkään ;-) (tai toisessa tapauksessa kantaisi asiakkaalle lisää tavaraa) ). >Tässä kohdassa leikkaaminen on ollut aika onnetonta. Vierailija >joutuu kommentteineen aivan tyhjän päälle eikä asiaan perehtymät- >tömällä kuulijoilla ole juuri mahdollisuutta ymmärtää mistä on >kysymys, he kenties uskovat sen. Tilastollinen päätöksenteko olisi >voitu pohjustaa melkein kaikille televisionkatsojille tutun amerik- >kalaisen oikeudenkäyntiperiaatteen kanssa. Aivan. Vierailijakommentti jää pahasti pohjustusta vaille. Tässäkin kohtaa ohjelmassa on hypätty asioiden edelle. Siirrytään suoraan hypoteesin testaukseen ilman että ensin selitetään että sekin on vain yksi mahdollinen menetelmä. Testauksen lopputulos on mustavalkoinen: hypoteesi hylätään tai se jää voimaan. Toinen lähestymistapa olisi tehdä pelkästään estimointia: likelihood inferenssiä tai Bayes-inferenssiä ja esittää luottamusvälit tms. Dikotomista päätöksentekoakin voisi harrastaa Bayesläisesti minimoimalla kustannusfunktion odotusarvo posteriorijakauman suhteen. Kaiken kaikkiaan erilaisia lähestymistapoja on useita ja ohjelma oli erittäin yksipuolinen eikä valottanut laajempaa taustatietoa lainkaan. Pelkkä hypoteesin testaamis -esimerkin muuttaminen paremmaksi ei olisi riittävä toimenpide. Olisi paljon muitakin asioita joita ei esitelty ohjelmassa ollenkaan! Jukka Ranta, EELA & RNI
Vastaukset: |
---|
Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!