[viesti Survo-keskustelupalstalla (2001-2013)]
Kirjoittaja: | Seppo Mustonen |
---|---|
Sähköposti: | - |
Päiväys: | 19.6.2002 16:06 |
Survotaan jalkapalloa! Meneillään olevat Jalkapallon MM-kisat antavat jälleen aiheen pohtia sääntöjen oikeudenmukaisuutta. Keskustelua synnyttää tietenkin tuomarityöskentely ja mm. se pitäisikö esim. maali- tilanteet tarvittaessa tarkistaa videonauhoituksesta. Nyt kiinnittäisin kuitenkin huomiota siihen, miten suuri osuus on pelkästään onnella tai sattumalla otteluiden lopputuloksiin. Mielestäni se, että otteluissa tehdään tyypillisesti vain pari maalia, johtaa epäilyksiin, että "huonompi" joukkue voittaa liian suurella todennäköisyydellä. Onhan kisoissa koettu ainakin muutamia "jättiyllätyksiä". Kun jo neljännesfinaalit pelataan kerrasta poikki -systeemillä, sattuma voi vaikuttaa paljonkin koko turnauksen lopputulokseen. Tietenkin voi lähteä myös siitä, että juuri tuo satunnaisuus on pelin suola ja tekee Jalkapallosta elämää suuremman ilmiön, mutta sittenkin... Niinpä päätin tarkastella ottelun kulkua maalien osalta Survoa käyttäen yksinkertaisen todennäköisyysmallin avulla. Tarkoituksenani on näyttää, että jos maalien lukumäärää saataisiin lisätyksi (esim. maalia suurentamalla), sattuman osuus vähenisi selvästi. Mallin olettamukset ovat seuraavat: Ajatellaan ottelu koostuvaksi 90 jaksosta, joista jokainen on minuutin pituinen. Joukkueiden (J1 ja J2) hyvyyttä (suhteessa toisiinsa) kuvatkoon todennäköisyydet p1 ja p2, missä p1 on todennäköisyys sille, että joukkue J1 tekee minuutin mittaisen jakson aikana maalin ja p2 on vastaava todennäköisyys joukkueelle J2, jolloin maalittoman minuutin todennäköisyys on 1-p1-p2. Jos nyt oletetaan, että J2 on "puolta huonompi" joukkue eli p2=p1/2, saadaan p1-arvoilla, jotka vastaavat keskimääräisiä maalimääriä M=2,3,4,5,6,7,8,9,10, seuraavat todennäköisyydet (prosentteina) eri ottelutuloksille (laskentatapa kuvataan myöhemmin): Maaleja keskim. (M) 2 3 4 5 6 7 8 9 10 J1 häviää (%) 19 18 17 16 15 14 13 12 11 tasapeli 28 21 17 14 12 11 9 8 7 J1 voittaa 53 61 66 70 73 76 78 80 82 Havaitaan, että maalimahdollisuuksien lisääntyminen vaikuttaa aika lailla J1:n voittotodennäköisyyteen nimenomaan siirryttäessä 2:sta 3-5:een. Kun keskimääräinen maaliluku on 2, huonompi joukkue pääsee ainakin tasapeliin 47%:n todennäköisyydellä, mutta maaliluvulla 5 enää vain 30%:n todennäköisyydellä. Jos oletetaan, että neljän välieriin selvinneiden joukossa kaikki ovat yhtä hyviä yhtä lukuunottamatta, joka olisi "puolta huonompi" muihin verrattuna, tuo huonoin voittaisi MM:n noin 10 prosentin todennäköisyydellä, kun keskimääräinen maaliluku on 2, mutta vain 2 prosentin todennäköisyydellä, jos keskimääräinen maaliluku olisi 10. Kenenkään ei ole syytä ottaa tätä luvuilla leikittelyä liian kirjaimellisesti. Laskentakoe näyttää kuitenkin vääjäämättä, että sattuma näyttelee *yksittäisessä* jalkapallo-ottelussa suurempaa roolia kuin mitä ehkä useat kuvittelevat ja että maalien syntytodennäköisyyttä kasvattamalla (esim. maalia suurentamalla) tuo sattuman osuus olisi mahdollista säätää pienemmäksi. .................................................................. Edellä esitettyjen todennäköisyyksien arviointi käy Survolla seuraavaan tapaan: Laskelmat perustuvat simulointikokeeseen, jossa kullakin p1-arvolla käydään läpi minuuteittain (90 kpl.) 100000 kuvitellun ottelun kulut. Tätä varten luodaan havaintotiedosto OTTELUT, jossa on muuttujat X1,X2,...,X90 ja 100000 havaintoa: FILE MAKE OTTELUT,90,100000,X,2 Luodaan vielä erikseen ottelun tulosta kuvaava Maaliero-muuttuja: VAR Maaliero:S3=MISSING TO OTTELUT ja tehdään se passiiviseksi: FILE UPDATE OTTELUT FIELDS: 91 S-- 3 Maaliero END .................................................................. Yhden ottelun keskimääräinen maalien määrä on M=90*(p1+p2) eli kun p2=p1/2, se on 270/2*p1 Jos asetetaan M=2, saadaan p1:lle arvo p1=2*2/270 p1=0.0148... ja vastaavasti p2=p1/2 p2=0.0074... Ottelun kulku kuvataan tiedostossa 90 muuttujan X1-X90 arvoina -1,0,1, missä -1 tarkoittaa J2:n saamaa maalia ko. minuutilla, 1 J1:n maalia ja 0 maalitonta peliminuuttia. Näiden osatapahtumien todennäköisyydet ilmaistaan matriisina P: MATRIX P /// -1 p2 0 1-p1-p2 1 p1 MAT SAVE P / Matriisin P talletus Kaikkien 100000 ottelun simuloinnit tapahtuvat nyt P:n mukaisen multinomijakauman mukaisesti TRANSFORM-komennolla TRANSFORM OTTELUT BY #DISTR(P) ja ottelukohtaiset maalierot saadaan summana X1+X2+...+X90 VARSTAT- komennolla VARSTAT OTTELUT,Maaliero,SUM .................................................................. Ottelujen tulokset kootaan seuraavalla TAB-operaatiolla: Maaliero=-99,-1(Tappio),0(Tasapeli),99(Voitto) TAB OTTELUT,CUR+1 / VARIABLES=Maaliero LABELS=- Maaliero * Tappio 18777 Tasapeli 28424 Voitto 52799 eli tästä on luettavissa tilannetta M=2 vastaavat tulokset: J1 voittaa tn.llä 53%, häviää tn.llä 19% ja joutuu tyytymään tasapeliin tn.llä 28%. .................................................................. Lisäksi voidaan laskea eri ottelutulosten frekvenssit seuraavasti: VARSTAT OTTELUT,Maalit1:1,#VAL,1 VARSTAT OTTELUT,Maalit2:1,#VAL,-1 Maalit1=0(1)5 Maalit2=0(1)5 RESULTS=RSUMS,CSUMS TAB OTTELUT,CUR+1 / VARIABLES=Maalit2,Maalit1 LABELS=- CHI2=- Maalit2 0 1 2 3 4 5 sum Maalit1 ******* 0 13278 9044 3084 685 102 10 26203 1 17899 12232 4012 945 159 15 35262 2 12043 8142 2644 569 90 10 23498 3 5537 3541 1145 255 41 1 10520 4 1744 1168 381 83 15 2 3393 5 472 292 92 29 3 0 888 sum 50973 34419 11358 2566 410 38 99764 Yleisin on siis 0-0-tasapeli noin 13 %:n tn.llä. Korkeintaan 2 maalia syntyy noin 68 %:ssa otteluista. Yli 5 maalia on tehnyt jompikumpi joukkueista 100000-99764=236 ottelussa. .................................................................. Tarkistuksen vuoksi on vielä laskettu maalien lukumääriä kuvaavat tunnusluvut: STAT OTTELUT,CUR+1 / VARS=Maalit1,Maalit2 RESULTS=0 Basic statistics: OTTELUT N=100000 Variable: Maalit1 min=0 in obs.#2 max=8 in obs.#7973 mean=1.33247 stddev=1.147243 skewness=0.842039 kurtosis=0.654124 lower_Q=0 median=1 upper_Q=2 Variable: Maalit2 min=0 in obs.#2 max=8 in obs.#85393 mean=0.66837 stddev=0.814308 skewness=1.20906 kurtosis=1.450979 lower_Q=0 median=0 upper_Q=1 Keskiarvojen summa 1.33247+0.66837=2.00084 on uskottavan lähellä teoreettista maalilukua M=2. Tämän mallia toistamalla on helppo laskea halutut todennäköisyydet ja muut tunnusluvut mille tahansa p1,p2-yhdistelmälle. Em. laskentakaavio on helppo kopioida leikepöydän välityksellä Survoon. Huom. ne, joilla ei ole Survoa käytössään, voivat imuroida näiltä sivuilta ilmaisversion, jolla nämäkin laskelmat pystyy tekemään.
Vastaukset: |
---|
Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!