Survotaan jalkapalloa

[viesti Survo-keskustelupalstalla (2001-2013)]

Kirjoittaja: Seppo Mustonen
Sähköposti:    -
Päiväys: 19.6.2002 16:06

Survotaan jalkapalloa!

Meneillään olevat Jalkapallon MM-kisat antavat jälleen aiheen
pohtia sääntöjen oikeudenmukaisuutta. Keskustelua synnyttää
tietenkin tuomarityöskentely ja mm. se pitäisikö esim. maali-
tilanteet tarvittaessa tarkistaa videonauhoituksesta.
Nyt kiinnittäisin kuitenkin huomiota siihen, miten suuri osuus
on pelkästään onnella tai sattumalla otteluiden lopputuloksiin.
Mielestäni se, että otteluissa tehdään tyypillisesti
vain pari maalia, johtaa epäilyksiin, että "huonompi" joukkue
voittaa liian suurella todennäköisyydellä. Onhan kisoissa
koettu ainakin muutamia "jättiyllätyksiä".
Kun jo neljännesfinaalit pelataan kerrasta poikki -systeemillä,
sattuma voi vaikuttaa paljonkin koko turnauksen lopputulokseen.
Tietenkin voi lähteä myös siitä, että juuri tuo satunnaisuus
on pelin suola ja tekee Jalkapallosta elämää suuremman ilmiön,
mutta sittenkin...

Niinpä päätin tarkastella ottelun kulkua maalien osalta
Survoa käyttäen yksinkertaisen todennäköisyysmallin avulla.
Tarkoituksenani on näyttää, että jos maalien lukumäärää
saataisiin lisätyksi (esim. maalia suurentamalla),
sattuman osuus vähenisi selvästi.

Mallin olettamukset ovat seuraavat:
Ajatellaan ottelu koostuvaksi 90 jaksosta, joista jokainen on
minuutin pituinen.
Joukkueiden (J1 ja J2) hyvyyttä (suhteessa toisiinsa) kuvatkoon
todennäköisyydet p1 ja p2, missä
p1 on todennäköisyys sille, että joukkue J1 tekee minuutin
mittaisen jakson aikana maalin ja p2 on vastaava todennäköisyys
joukkueelle J2, jolloin maalittoman minuutin todennäköisyys on
1-p1-p2.

Jos nyt oletetaan, että J2 on "puolta huonompi" joukkue eli p2=p1/2,
saadaan p1-arvoilla, jotka vastaavat keskimääräisiä maalimääriä
M=2,3,4,5,6,7,8,9,10, seuraavat todennäköisyydet (prosentteina)
eri ottelutuloksille (laskentatapa kuvataan myöhemmin):

Maaleja keskim. (M) 2  3  4  5  6  7  8  9 10
J1 häviää  (%)     19 18 17 16 15 14 13 12 11
tasapeli           28 21 17 14 12 11  9  8  7
J1 voittaa         53 61 66 70 73 76 78 80 82

Havaitaan, että maalimahdollisuuksien lisääntyminen vaikuttaa
aika lailla J1:n voittotodennäköisyyteen nimenomaan siirryttäessä 2:sta
3-5:een.
Kun keskimääräinen maaliluku on 2, huonompi joukkue pääsee ainakin
tasapeliin 47%:n todennäköisyydellä, mutta maaliluvulla 5 enää
vain 30%:n todennäköisyydellä.
Jos oletetaan, että neljän välieriin selvinneiden joukossa kaikki
ovat yhtä hyviä yhtä lukuunottamatta, joka olisi "puolta huonompi"
muihin verrattuna, tuo huonoin voittaisi MM:n noin 10 prosentin
todennäköisyydellä, kun keskimääräinen maaliluku on 2, mutta
vain 2 prosentin todennäköisyydellä, jos keskimääräinen maaliluku
olisi 10.

Kenenkään ei ole syytä ottaa tätä luvuilla leikittelyä liian
kirjaimellisesti. Laskentakoe näyttää kuitenkin vääjäämättä,
että sattuma näyttelee *yksittäisessä* jalkapallo-ottelussa suurempaa
roolia kuin mitä ehkä useat kuvittelevat ja että maalien
syntytodennäköisyyttä kasvattamalla (esim. maalia suurentamalla) tuo
sattuman osuus olisi mahdollista säätää pienemmäksi.

..................................................................
Edellä esitettyjen todennäköisyyksien arviointi käy Survolla
seuraavaan tapaan:

Laskelmat perustuvat simulointikokeeseen, jossa kullakin p1-arvolla
käydään läpi minuuteittain (90 kpl.) 100000 kuvitellun ottelun kulut.
Tätä varten luodaan havaintotiedosto OTTELUT, jossa on muuttujat
X1,X2,...,X90 ja 100000 havaintoa:
FILE MAKE OTTELUT,90,100000,X,2

Luodaan vielä erikseen ottelun tulosta kuvaava Maaliero-muuttuja:
VAR Maaliero:S3=MISSING TO OTTELUT
ja tehdään se passiiviseksi:
FILE UPDATE OTTELUT
FIELDS:
  91 S--   3 Maaliero
END
..................................................................
Yhden ottelun keskimääräinen maalien määrä on M=90*(p1+p2) eli
kun p2=p1/2, se on 270/2*p1
Jos asetetaan M=2, saadaan p1:lle arvo
p1=2*2/270     p1=0.0148...
ja vastaavasti
p2=p1/2        p2=0.0074...

Ottelun kulku kuvataan tiedostossa 90 muuttujan X1-X90 arvoina -1,0,1,
missä -1 tarkoittaa J2:n saamaa maalia ko. minuutilla, 1 J1:n maalia ja
0 maalitonta peliminuuttia.

Näiden osatapahtumien todennäköisyydet ilmaistaan matriisina P:
MATRIX P ///
-1 p2
 0 1-p1-p2
 1 p1

MAT SAVE P / Matriisin P talletus

Kaikkien 100000 ottelun simuloinnit tapahtuvat nyt P:n mukaisen
multinomijakauman mukaisesti TRANSFORM-komennolla
TRANSFORM OTTELUT BY #DISTR(P)

ja ottelukohtaiset maalierot saadaan summana X1+X2+...+X90 VARSTAT-
komennolla
VARSTAT OTTELUT,Maaliero,SUM
..................................................................
Ottelujen tulokset kootaan seuraavalla TAB-operaatiolla:

                    Maaliero=-99,-1(Tappio),0(Tasapeli),99(Voitto)
TAB OTTELUT,CUR+1 / VARIABLES=Maaliero  LABELS=-
Maaliero *
Tappio      18777
Tasapeli    28424
Voitto      52799

eli tästä on luettavissa tilannetta M=2 vastaavat tulokset:
J1 voittaa tn.llä 53%, häviää tn.llä 19% ja joutuu tyytymään
tasapeliin tn.llä 28%.
..................................................................
Lisäksi voidaan laskea eri ottelutulosten frekvenssit seuraavasti:

VARSTAT OTTELUT,Maalit1:1,#VAL,1
VARSTAT OTTELUT,Maalit2:1,#VAL,-1
                    Maalit1=0(1)5 Maalit2=0(1)5  RESULTS=RSUMS,CSUMS
TAB OTTELUT,CUR+1 / VARIABLES=Maalit2,Maalit1  LABELS=-  CHI2=-
        Maalit2      0      1      2      3      4      5    sum
Maalit1 *******
      0          13278   9044   3084    685    102     10  26203
      1          17899  12232   4012    945    159     15  35262
      2          12043   8142   2644    569     90     10  23498
      3           5537   3541   1145    255     41      1  10520
      4           1744   1168    381     83     15      2   3393
      5            472    292     92     29      3      0    888
            sum  50973  34419  11358   2566    410     38  99764

Yleisin on siis 0-0-tasapeli noin 13 %:n tn.llä.
Korkeintaan 2 maalia syntyy noin 68 %:ssa otteluista.
Yli 5 maalia on tehnyt jompikumpi joukkueista 100000-99764=236
ottelussa.
..................................................................
Tarkistuksen vuoksi on vielä laskettu maalien lukumääriä
kuvaavat tunnusluvut:

STAT OTTELUT,CUR+1 / VARS=Maalit1,Maalit2 RESULTS=0
Basic statistics: OTTELUT N=100000
Variable: Maalit1
min=0        in obs.#2
max=8        in obs.#7973
mean=1.33247  stddev=1.147243 skewness=0.842039 kurtosis=0.654124
lower_Q=0        median=1        upper_Q=2

Variable: Maalit2
min=0        in obs.#2
max=8        in obs.#85393
mean=0.66837  stddev=0.814308 skewness=1.20906  kurtosis=1.450979
lower_Q=0        median=0        upper_Q=1

Keskiarvojen summa 1.33247+0.66837=2.00084 on uskottavan lähellä
teoreettista maalilukua M=2.

Tämän mallia toistamalla on helppo laskea halutut todennäköisyydet
ja muut tunnusluvut mille tahansa p1,p2-yhdistelmälle.
Em. laskentakaavio on helppo kopioida leikepöydän välityksellä
Survoon.
Huom. ne, joilla ei ole Survoa käytössään, voivat imuroida näiltä
sivuilta ilmaisversion, jolla nämäkin laskelmat pystyy tekemään.

Vastaukset:
[ei vastauksia]

Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!

Etusivu  |  Keskustelu
Copyright © Survo Systems 2001-2013. All rights reserved.
Updated 2013-06-15.