[viesti Survo-keskustelupalstalla (2001-2013)]
Kirjoittaja: | Seppo Mustonen |
---|---|
Sähköposti: | - |
Päiväys: | 12.11.2002 16:54 |
Vastasin aikoinaan 1970-luvun puolivälissä eri yliopistojen ja korkeakoulujen tilastotieteen laitosten yhteisen tiedotuslehden SATTUMA toimittamisesta. Keksin mielestäni hauskan ja "opettavaisen" kansikuvan lehden toiseen numeroon keväällä 1975. Siinä oli Wang 2200 -pientietokoneelle tekemäni "sananarvausohjelman" tulostusta tyyliin: 1 UUSMUS 4 46 SA 7 91 SATU 7 2 MM 4 47 SASATU 8 92 SATU 7 3 SU 7 48 SASA 7 93 SA 8 4 SUATUAS 8 49 SA 7 94 SA 7 5 TTU 8 50 SA 8 95 SATMA 8 6 AUTAMST 4 51 SA 8 96 SA 8 7 SASAASA 8 52 SAATMTS 7 97 SATU 7 8 TTU 8 53 SA 8 98 SATTTMS 8 9 TTMASSA 7 54 SA 8 99 SA 7 10 SSAA 7 55 SA 7 100 SA 7 .................................................. 36 SASATSA 8 81 SA 8 126 SASATU 7 37 SA 9 82 SA 8 127 SATTU 7 38 SASATU 8 83 SA 8 128 SATTUMA 10 39 SA 9 84 SASA 7 129 SATTUMA 10 40 SA 9 85 SA 7 41 SATMMTU 9 86 SA 7 42 SAA 8 87 SATTSAT 8 43 SA 8 88 SATU 8 44 SAAA 7 89 SATUA 8 45 SA 7 90 SATU 7 "Pääkirjoituksessa" kerrottiin asiasta tarkemmin seuraavasti: SATTUMAn tämänkertainen kansikuva ilmentää periaatetta "129 sanaa puhuu paremmin kuin 1 kuva". Lukijan harkittavaksi jää, missä määrin kansi ja lehden muu sisältö on syntynyt sattumalta. Harkinnan helpottamiseksi todettakoon kannesta seuraavaa. Sitä rakennettaessa on yritetty käyttää satunnaisia sanoja tuottavaa Markovin ketjua. Ketjun tiloina ovat kirjaimet A,U,M,S,T ja sanaväli. Siirtymätodennäköisyydet ovat aluksi kaikki tasaisia eli sanat syntyvät täysin umpimähkäisesti, mutta prosessin tuotosta on mahdollista arvostella tavan- omaisin kouluarvosanoin 4-10, joilla vaikutetaan ketjun siirtymätodennäköisyyksiin lähinnä viimeisessä sanassa esiintyvien siirtymien osalta. Tavoitteena on ollut saada prosessia matkiva pientietokone sanomaan SATTUMA ja sanojen arvostelu palvelee tässä tapa- uksessa vain tätä jaloa päämäärää. Hankkeen ajatus on (tyhjän tilan täyttämisen ohella) siinä, että nähtäisiin, voiko näin yksinkertaisen mallin puitteissa saada pelkällä yleisarvostelulla jonkinlaista opppimista aikaan. Kansi on suoraan ohjelman tulostusta. Jokaisen koneen tar- joaman sanan jälkeen on allekirjoittaneen antama arvosana. --- Liekö tuo todella sattuma, että kaksi ensimmäistä SATTUMAa ovat syntyneet jo yrityksillä 128 ja 129. 1.6.1975 SM Innostumiseni tuosta aiheesta oli sikäli ymmärrettävää, että tuohon aikaan ei monilla ollut välttämättä käsitystä siitä, että tietokoneen kanssa voidaan toimia "interaktiivisesti". Tällaiset yritykset osaltaan ennakoivat ensimmäisen keskustelevaan käyttötapaan pohjautuvan Survon (SURVO 76) syntyä. Nyt tarkoituksenani on palauttaa eloon "sananarvauspeli" nykysurvon yhteydessä. Olen sen tehnyt kahdessakin muodossa, C-ohjelmamodulina ja sukrona. C-ohjelmasta (joka on sukroa monipuolisempi ja nopeampi) tulen kertomaan joskus myöhemmin. Tässä kuvaan SANO-sukroperhettä, jonka listaus on sanomani lopussa ja jota houkuttelen survoilijat uuden kilpatehtävän muodossa kokeilemaan. Selitän aluksi sukron toimintaa pienellä esimerkillä. Nyt on tavoitteena saada sukro SANO-SANA lausumaan sana ILO, kun tarjolla on kirjaimet A,E,I,K,L,O ja sanaväli. Arvaaminen alkaa esim. aktivoimalla /SANO-SANA ILO seuraavasti: ...................................................................... RND=rand(3011) / valittu satunnaislukugeneraattori STATES=AEIKLO /SANO-SANA ILO_ ...................................................................... Aktivoinnin jälkeen syntyy keskustelu, jossa ohjelma ehdottaa sanoja ja käyttäjän tulisi arvioida niitä asteikolla -30 ... 30. Ensimmäinen kysymystilanne näyttää seuraavalta: ...................................................................... RND=rand(3011) STATES=AEIKLO /SANO-SANA ILO 1 KOOAAKO? _ * P=0.00065104166667 Arvioi sanaehdotus asteikolla -30 ... 30. Lopeta napeilla '.' ENTER! ...................................................................... Se, että tavoiteltu sana (ILO) ilmaistaan aktivoinnin yhteydessä, antaa ohjelmalle tilaisuuden kertoa käyttäjälle joka vaiheessa, mikä on tuon sanan todennäköisyys juuri ennen tämänhetkistä kysymystä. (Ohjelma ei käytä, kuten jokainen asiasta kiinnostunut voi tarkistaa sukrojen listauksesta, tätä tietoa millään muotoa sen enempää käyttäjän eduksi kuin haitaksi.) Todennäköisyys ilmoitetaan kyselyrivin lopussa. Koska alkutilanteessa sanan päättymistodennäköisyys on aina 1/4 ja kullakin vaihtoehtoisista siirtymistä on sama todennäköisyys eli tässä (1-1/4)/6=1/8, on sanan ILO todennäköisyys vaatimattomasti 1/6*(1/8)^2*(1/4)=0.00065104166667. (Huom. alkukirjaimen tn.=1/6). Tätä todennäköisyyttä käyttäjän tulee siis yrittää kasvattaa antamalla "hyville" ehdotuksille positiivisia pisteitä ja "huonoille" negatiivi- sia. Koska 1. ehdotuksessa KOOAAKO loppu on varsin onnistunut, kannat- taa ehkä antaa maksimipisteet (30) ja jatko ensimmäiseen onnistumiseen näyttää seuraavalta: ....................................................................... RND=rand(3011) STATES=AEIKLO /SANO-SANA ILO 1 KOOAAKO 30 P=0.00065104166667 2 EOOAEA -30 P=0.0007067609373 3 LLO 30 P=0.00079610002861 4 AA -30 P=0.00113791542345 5 OLAKOI -20 P=0.00118562777604 6 AEELKLEA -30 P=0.00135769001846 7 OOO 10 P=0.0014934526632 8 E -30 P=0.00152693395058 9 KIALIO -30 P=0.00157834963017 10 KKKI -30 P=0.00154419367163 11 OAOK -30 P=0.00172564863298 12 IAKAO 10 P=0.00192158970554 13 K -30 P=0.0021883836389 14 LLEEI -30 P=0.00227643959625 15 K -30 P=0.00277004501401 16 AAO 10 P=0.00286211178505 17 AAKKEAEI -30 P=0.00300056389594 18 AOKEI -30 P=0.0032298901055 19 E -30 P=0.00349178675082 20 IKO 30 P=0.00361844197848 21 LO 30 P=0.00495505661294 22 IO 30 P=0.00669244491744 23 L -30 P=0.0088041142107 24 ILOAIKAO 30 P=0.01012606158883 25 K -30 P=0.01932950899755 26 AO -10 P=0.01970467326663 27 EILO 30 P=0.01919669243736 28 L -30 P=0.03157453914427 29 EKLOOO -20 P=0.03466295260382 30 ILK 30 P=0.03014218816284 31 ILO . P=0.04155733377666 ....................................................................... Tämä on samalla tuloslistaus, joka jäljentyy suoraan toimituskenttään. Todennäköisyysarvioiden muutoksista käyttäjä voi päätellä, kuinka hyvin hänen pisteytyksensä toimii eli samalla kuin ohjelma oppii (muuntamalla siirtymätodennäköisyyksiä vastausten mukaan; huom. vastauksella 0 mitään muutosta ei tapahdu) myös käyttäjä saattaa oppia noiden muutosten perusteella, miten käyttää arvosteluasteikkoa. Tässä tapauksessa onnistuttiin saamaan etsitty sana jo yrityksellä 31. Sillonkin onnistumisen todennäköisyys oli vain noin 0.04, mutta se ei kerro koko totuutta. Onnistuminen olisi voinut tapahtua jo aikaisemminkin. Tässä kokeessa todennäköisyys sille, että onnistutaan 31 ensimmäisen kysymyksen aikana on selvästi suurempi eli yli 0.23 (Lukija saa itse selvittää, miten tämä lasketaan.) Vertailun vuoksi todettakoon, että jos käyttäjä ei olisi opettanut ohjelmaa (eli olisi antanut aina vain vastauksia 0), onnistumis- todennäköisyys yrityksellä 31 oli ollut edelleen alkuperäinen 0.00065 ja vastaava todennäköisyys 31 ensimmäisen kysymyksen aikana noin 0.02 . Tässä tapauksessa tarvittaisiin yli 400 yritystä, ennenkuin päästäisiin "onnistumiskertymässä" tasolle 0.23. * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * KILPATEHTÄVÄ ============ Yritä saada sukro /SANO-SANA sanomaan mahdollisimman vähin yrityksin 1) sana SATTUMA, 2) sana SURVO seuraavissa tilanteissa: ...................................................................... SATTUMA: RND=rand(1000011) STATES=AMSUT /SANO-SANA SATTUMA ...................................................................... Tässä tapauksessa ensimmäisen kysymys tulee olemaan: 1 SA? * P=0.00000056953125 ...................................................................... SURVO: RND=rand(1000082) STATES=AEHIJKLMNOPRSTUV /SANO-SANA SURVO ...................................................................... Tämä vuorostaan tulee alkamaan kysymyksellä 1 UPI? * P=0.00000007543713 Ratkaisut tulee saada erillisessä viestissä lähetetyllä SANO-sukrolla. Satunnaislukugeneraattoreiden siemenlukuja ei saa muuttaa. Lähettäkää ratkaisunne (eli siis sukron antamat sanojen ja niiden arvioiden listaukset) minulle sähköpostina (seppo.mustonen@survo.fi) 15.1.2003 mennessä. Parhaista ratkaisuista eli 1) lyhyimmästä yhdistetystä ratkaisusta (SATTUMAn ja SURVOn kysymysten määrä yhteenlaskettuna), 2) lyhimmästä SATTUMA-ratkaisusta, 3) lyhimmästä SURVO-ratkaisusta kustakin erikseen ratkaisija tulee saamaan palkinnoksi Olli Mustosen uuden Sibeliuksen pianoteoksia sisältävän CD-levyn. Kukin ratkaisija voi saada vain yhden palkinnon, jolloin seuraavaksi parhaat ratkaisutkin saattavat päästä palkinnoille. Tulokset ym. muuta tietoa tulen kertomaan tässä keskusteluryhmässä parin päivän sisällä kilpailun päättymisestä. * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * Kilpailuun kannattaa osallistua, vaikka ei olisikaan selvillä esim. todennäköisyyslaskennan tai sukrokielen tuntemisen mahdollisista eduista. Puhtaalla intuitiolla ja kokeilemalla omillakin esimerkeillä saattaa päästä hyviin ratkaisuihin. Kannattaa kuitenkin harkita, olisiko joistain Survon ominaisuuksista apua tehtäviä ratkaistaessa. ...................................................................... Tehtävien ratkaiseminen edellyttää, että käytössäsi on SURVO MM. Koska ratkaiseminen ottaa aina jonkin verran aikaa, ilmaisversio ei riitä näihin tehtäviin. Saat SANO-sukron käyttöösi erillisestä viestistä "SANO-sukrot"
Vastaukset: |
---|
Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!