Re: Logaritmisesta keskiarvosta

[vastaus aiempaan viestiin]

Kirjoittaja: Seppo Mustonen
Sähköposti:    -
Päiväys: 14.9.2002 15:32

Kerrottuani Yrjö Vartialle uusiintuneesta kiinnostuksestani logaritmista
keskiarvoa ja erityisesti sen yleistämistä kohtaan, hän palautti
mieleeni ja toimitti käsiini artikkelin

L.Törnqvist, P.Vartia, Y.Vartia (1985): How Should Relative Chages Be
Measured. The American Statistician. February 1985, Vol.39, No.1,

josta mm. ilmenee, että Leo Törnqvist on jo vuonna 1935 (ruotsin-
kielisessä julkaisussaan) tuonut esiin käsitteen "log-mean".
Yrjö Vartia on sitten 1970-luvun alkupuolelta lähtien käyttänyt
lausekkeesta L(x,y)=(x-y)/log(x/y) johdonmukaisesti nimitystä
logaritminen keskiarvo (logarithmic mean).

Tuossa vuoden 1985 artikkelissa suositellaan suhteellisen muutoksen
mittaamisessa käytettäväksi tavanomaisen

    R1(x,y)=(y-x)/x

asemasta logaritmista muutosta

    R2(x,y)=log(y/x) .

Suositus johtuu mm. siitä epäkohdasta, että esim. R1(1,2)=1 (100%)
mutta R1(2,1)=-0.5 (-50%), kun sen sijaan R2(1,2)=log(2)=0.693...
(69.3 L%) ja R2(2,1)=log(1/2)=-0.693... (-69.3 L%) eli
yleisesti logaritmisella muutoksella on miellyttävä käänteisominaisuus
    R2(x,y)=-R2(y,x)
joka puuttuu tavalliselta suhteelliselta muutokselta aiheuttaen
jatkuvaa sekaannusta monissa käytännön vertailutilanteissa.
Pienillä muutoksilla R1 ja R2 ovat toki lähellä toisiaan, mikä
ilmenee mielestäni parhaiten sarjakehitelmästä

    R2(x,y) = log(1+(y/x-1)) = log(1+R1(x,y))

            = R1(x,y) - R1(x,y)^2/2 + R1(x,y)^3/3 -...

eli tavanomainen suhteellinen muutos on luonteeltaan ensimmäisen asteen
approksimaatio logaritmiselle suhteelliselle muutokselle.

Samassa artikkelissa tuodaan esiin muitakin hyödyllisiä ominaisuuksia,
jotka R2(x,y) täyttää verrattuna muihin suhteellisen muutoksen mitta-
reihin.
Useat kirjallisuudessa näkyvät ehdotukset ovat muotoa
      R(x,y)=(x-y)/K(x,y),
missä K(x,y) on jokin keskiarvo. Törnqvist ja Vartiat toteavat,
että logaritmisella suhteellisella muutoksella tuo K on logaritminen
keskiarvo eli
                           x-y
     R2(x,y)=log(x/y)= -------------- = (x-y)/L(x,y) .
                       (x-y)/log(x/y)

Tätä seikkaa voi pitää eräänä lähtökohtana logaritmiseen keskiarvoon
kohdistuneelle mielenkiinnolle.

Tuossa Törnqvistin ja Vartioitten artikkelissa viitataan tällä kohtaa
myös omaan logaritmisen keskiarvon yleistykseeni n havainnon tapauk-
seen: "Unpublished manuscript (1976)". Muistan saaneeni aikoinaan
tuon maininnan johdosta ainakin yhden tiedustelun, jossa toivottiin
"käsikirjoitusta" nähtäväksi. Se oli kuitenkin vain läjä suttuisia
papereita, joiden kopioiden lähettämistä en voinut ajatellakaan.
Tuolloin minulla ei ollut mahdollisuutta ryhtyä viimeistelemään
ehdotustani.
On ehkä korkea aika yrittää sitä nyt ja perustella, mistä ehdotukseni
(eritoten tuo pirunnyrkkikaava)

                               n         xi
(1) L(x1,x2,...,xn) = (n-1)! SUMMA  ---------------
                              i=1     n
                                     TULO log(xi/xj)
                                     j=1
                                     j<>i
on kotoisin.

Motivaatiotani selvittää enemmälti asiaa on aikaisemmin hillinnyt se,
etten ole saanut mitenkään hyödynnettyä tätä tulosta. Kuten edellisessä
viestissäni totean, logaritmisen keskiarvon laskennassa pirunnyrkki
(rajoitetulla laskutarkkuudella) räjähtää herkästi älyttömiin arvoihin.
Kannattaa siis sen sijasta käyttää sarjakehitelmää.

Nyt olen kuitenkin löytänyt kiintoisan ominaisuuden, jonka
osoittamisessa pirunnyrkki-esitys on todella kätevä, mutta jonka
toteaminen sarjakehitelmästä lienee hankalaa.

Tarkastellaan eksponentiaalista havaintosarjaa
    x0, x0*c, x0*c^2, x0*c^3,..., x0*c^(n-1) .
Tässä tapauksessa (1) tulee aluksi muotoon

                   (n-1)!*x0       n       c^(i-1)
L(x1,x2,...,xn) = ------------   SUMMA  ------------  .
                  log(c)^(n-1)    i=1     n
                                         TULO (i-j)
                                         j=1
                                         j<>i

Tällöin summassa jakajat ovat muotoa (-1)^(n-i)*(i-1)!*(n-i)!,
jolloin binomikertoimen esityksen C(m,k)=m!/[k!*(m-k)!] mukaisesti

                     (n-1)!        n    (-1)^(n-i)*C(n-1,i-1)*c^(i-1)
L(x1,x2,...,xn) = ------------   SUMMA  -------------------------------
                  log(c)^(n-1)    i=1             (n-1)!

                   (n-1)!*x0     (c-1)^(n-1)
                = ------------ * -----------     (binomikaavasta)
                  log(c)^(n-1)     (n-1)!

                = x0*[(c-1)/log(c)]^(n-1)

                = x0*L(c,1)^(n-1) .

Siis, kun havainnot muuttuvat askeleittain kertoimella c, niin
logaritminen keskiarvo muuttuu kertoimella L(c,1).
Oli itselleni yllätys havaita, että samanlainen sääntö koskee geometris-
ta keskiarvoa eli todetaan helposti, että tässä havaintosarjassa

G(x1,x2,...,xn) = x0*G(c,1)^(n-1),

missä siis G(c,1)=sqrt(c*1). Geometrinen ja logaritminen keskiarvo
ovat siis näinkin sukua toisilleen.
Kuitenkin, kun c<>1, seuraa väistämättä, että  L/G -> oo, kun n -> oo,
koska L(c,1)>G(c,1).


Pirunnyrkkikaavan johtaminen:
-----------------------------

Tarkastellaan havaintoaineistoa x1,x2,...,xn havaintoarvojen logaritmien
u1=log(x1),...,un=log(un) välityksellä.
Edellisessä viestissäni totesin, että vertailemalla eri keskiarvoja
sarjakehitelmien avulla on luonnollisinta tehdä yleistys

(2) L(x1,x2,...,xn) = 1 + (u1+u2+...+un)/n

                      u1^2+u1*u2+...+u1*un+u2^2+u2*u3+...+un^2
                    + ----------------------------------------
                           C(n+1,2)*2!
                    ...

                      u1^m+u1^(m-1)*u2+...+un^m
                    + -------------------------
                           C(n+m-1,m)*m!

                    + ...

missä siis m-asteisen termin osoittajassa oleva polynomi on muotoa

P(n,m)=     SUMMA       u1^i1*u2^i2*...*un^in
        i1+i2+...+in=m
        i1>=0, i2>=0,...,in>=0

eli homogeenisten polynomien kaikki kertoimet ovat pelkkiä ykkösiä,
kuten on asian laita lähtökohtana olevassa tapauksessa n=2.
Jakajina ovat binomikertoimet, jotka vastaavat yhteenlaskettavien
lukumääriä.

Totesin myös, että polynomit P(n,m) on kätevä lausua esim. viimeisen
u:n alenevien potenssien mukaan rekursiivisesti muodossa

(3)  P(n,m) =   u(n)^m
              + u(n)^(m-1)*P(n-1,1)
              + u(n)^(m-2)*P(n-1,2)
              ...
              + u(n)^1*P(n-1,m-1)
              + u(n)^0*P(n-1,m)

reunaehdoin P(n,1) = u1+u2+...+u(n),
            P(1,m) = u1^m.

Jos kaikki x:t ja vastaavasti u:t ovat keskenään eri suuria,
ratkaisevaa on nyt huomata, että näille polynomeille löytyy toinen
esitystapa lausekkeiden

               n    ui^m
(4) Q(n,m) = SUMMA ------, k=0,1,2,...,
              i=1   T(i)

missä
             n
(4b) T(i) = TULO (ui-uj),
            j=1
            j<>i

avulla. On nimittäin voimassa yhtälöt

(5)  Q(n,m) = 0, kun m=0,1,2,...,n-2,
(6)  Q(n,n-1) = 1,
(7)  Q(n,m) = P(n,m-n+1), kun m=n,n+1,n+2,...  .

Nämä identiteetit ovat mielenkiintoisia, sillä en ole sattunut näkemään
vastaavaa missään aikaisemmin. On kuitenkin hyvin ilmeistä, että ne
tunnetaan jostain muusta yhteydestä. Olisinkin kiitollinen kaikista
vinkeistä, mikäli joku tuntee nuo identiteetit ennestään.

Esim. Q(4,0)=0 on aukikirjoitettuna

         1                       1                       1
--------------------- + --------------------- + ---------------------
(u1-u2)(u1-u3)(u1-u4)   (u2-u1)(u2-u3)(u2-u4)   (u3-u1)(u3-u2)(u3-u4)

                                 1
                      + --------------------- = 0 .
                        (u4-u1)(u4-u2)(u4-u3)

Paikkansapitävyyden toteaa suoralla laskulla tekemällä
termit samannimisiksi ja toteamalla, että osoittajaksi saadaan
yhteenlaskun jälkeen lausekerykelmä, joka sievenee nollaksi.
Yleisesti yhtälöiden (5)-(7) todistaminen ei kuitenkaan onnistune
tuota kautta. Esitän yleisen todistuksen tämän viestin lopussa.

Nyt pyrin osoittamaan pirunnyrkkiesityksen (1) ja sarjakehitelmän (2)
yhtäpitävyyden olettaen, että yhtälöt (5),(6),(7) pitävät paikkansa.

Sarjakehitelmää (2) muotoillaan vaiheittain seuraavasti:

    L(x1,x2,...,xn) = 1 + P(n,1)/n + P(n,2)/[C(n+1,2)*2!] + ...

                        + P(n,m)/[C(n+m-1,m)*m!] + ...

                                  oo     P(n,m)
                    = 1 + (n-1)! SUMMA  --------
                                  m=1   (n+m-1)!

                                  oo     Q(n,n+m-1)
                    = 1 + (n-1)! SUMMA  -----------  (7):n nojalla
                                  m=1    (n+m-1)!

                                  oo     Q(n,k)
                    = 1 + (n-1)! SUMMA  --------
                                  k=n      k!

                              oo     Q(n,k)
                    = (n-1)! SUMMA  --------         (6):n nojalla
                             k=n-1     k!

                              oo     Q(n,k)
                    = (n-1)! SUMMA  --------         (5):n nojalla
                              k=0      k!

                                      n    ui^k
                                    SUMMA ------
                              oo     i=1   T(i)
                    = (n-1)! SUMMA  ------------     (4):n nojalla
                              k=0      k!

                                     oo    ui^k
                                    SUMMA ------
                               n     k=0    k!
                    = (n-1)! SUMMA  ------------
                              i=1      T(i)


                               n     exp(ui)
                    = (n-1)! SUMMA  ----------       (4b):n nojalla,
                              i=1    n
                                    TULO (ui-uj)
                                    j=1
                                    j<>i

mikä on sama kuin pirunnyrkki (1), kun otetaan huomioon, että
ui=log(x1), i=1,2,...,n.

Edellä olevassa kehittelyssä on merkille pantavaa, miten (5) ja (6)
ovat "elämälle u1,u2,...,un vieraita kuolleita sieluja", jotka
välttämättä tarvitaan eksponenttifunktion sarjakehitelmän
täydentämiseen.

Identiteettien (5),(6),(7) todistaminen:
----------------------------------------

Välittömästi nähdään, että ko. identiteetit ovat voimassa, kun n=2.
Tällöinhän
  Q(2,k) = u1^k/(u1-u2)+u2^k/(u2-u1) = (u1^k-u2^k)/(u1-u2), k=0,1,2,...
eli
  Q(2,0)=0, Q(2,1)=1 ja Q(2,k)=P(2,k-1), kun k=2,3,...

Yleinen todistus perustuu induktioon n-1 -> n eli oletetaan, että
ko. yhtälöt pitävät paikkansa arvolla n-1 ja näytetään, että ne
tällöin pätevät myös arvolla n.

Kirjoittamalla määritelmässä (4) osoittajat ui^m muotoon
(ui^m-un^m)+un^m ja erottamalla termit kahtia ja supistamalla
ensimmäinen osa nimittäjän viimeisellä tekijällä ui-un syntyy
rekursiokaava

(8) Q(n,m) =   un^(m-1)*Q(n-1,0)
             + un^(m-2)*Q(n-1,1)
             + ...
             + un^0*Q(n-1,m-1) + un^m*Q(n,0), kun m=1,2,...

Merkitään nyt väliaikaisesti
Q(n,0) = f(u1,u2,...,un) ja tarkastellaan funktiota f argumenttiensa
käänteisarvoilla eli funktiota f(1/u1,1/u2,...,1/un).
Tällöin on välittömästi pääteltävissä, muuntamalla nimittäjiin syntyvät
murtolausekkeet 1/ui-1/uj muotoon (uj-ui)/(ui*uj) ja ottamalla eteen
yhteiset tekijät, että

f(1/u1,1/u2,...,1/un) = (-1)^n*u1*u2*...*un*Q(n,n-2)

Soveltamalla rekursiokaavaa (8) viimeiseen tekijään ja ottamalla
huomioon se, että induktio-oletuksen mukaan kaavat (5) pätevät
tapauksessa n-1, rekursiokaavassa vain viimeinen termi voi olla
nollasta poikkeava eli

f(1/u1,1/u2,...,1/un) = (-1)^n*u1*u2*...*un*un^(n-2)*f(u1,u2,...,un).

Funktio f(u1,...,un) on homogeeninen ja symmetrinen argumenttiensa
suhteen.
Jos f olisi muuta kuin identtisesti nolla, seuraisi ristiriita,
sillä viimeisen yhtälön oikea puoli ei tällöin olisi symmetrinen
funktio tapauksissa n>2. Näin siis Q(n,0)=0, kun n=2,3,... ja (5) on
todistettu tapauksessa m=0.

Rekursiokaavassa (8) viimeinen termi jää siten pois ja on voimassa

(9) Q(n,m) =   un^(m-1)*Q(n-1,0)
             + un^(m-2)*Q(n-1,1)
             + ...
             + un^0*Q(n-1,m-1),  kun m=1,2,...

Tästä seuraa induktio-oletuksen perusteella

    Q(n,1) = un^0*Q(n-1,0) = 0,
    Q(n,2) = un^1*Q(n-1,0) + un^0*Q(n-1,1) = 0,
    ...
    Q(n,n-2) = un^(n-3)*Q(n-1,0) + ... + u^n0*Q(n-1,n-3) = 0

eli (5) on todistettu myös tapauksissa m=1,2,...,n-2.

Tapauksessa m=n-1 rekursiokaava (9) antaa (induktio-oletuksin)

    Q(n,n-1) = un^0*Q(n-1,n-2) = 1*1 = 1

eli näin (6) on näytetty toteen.

Tapauksessa m=n vuorostaan kaavasta (9) seuraa

    Q(n,n) = un^1*Q(n-1,n-2) + un^0*Q(n-1,n-1)
           = un*1 + 1*(u1+u2+...+u(n-1)) = u1+u2+...+un

ja siis (7) pätee tapauksessa m=n ja Q(n,n)=P(n,1).

Näiden tulosten perusteella rekursiokaavan (9) voi edelleen typistää
muotoon

(10) Q(n,m) =   un^(m-n+1)
              + un^(m-n)*Q(n-1,n-1)
                ...
              + un^0    *Q(n-1,m-1) , k=1,2,...

Käyttäen tätä kaavaa ja yhtälöä (7) arvolla n-1 saadaan

     Q(n,n+1) = un^2 + un^1*Q(n-1,n-1) + un^0*Q(n-1,n)
              = un^2 + un*P(n-1,1) + P(n-1,2)
              = P(n,2)                        (3):n nojalla

eli (7) pätee tapauksessa m=n+1 ja Q(n,n+1)=P(n,2).

Vastaavasti kun m>n saadaan yhtälöitä (10) ja (7) (jälkimmäistä arvolla
n-1) soveltaen

     Q(n,m) = + un^(m-n+1)
              + un^(m-n)  *P(n-1,1)
              + un^(m-n-1)*P(n-1,2)
                ...
              + un^0      *P(n-1,m-n+1)

            = P(n,m-n+1)                      (3):n nojalla

eli (7) on todistettu yleisesti.

                   - - - - - - -

Kuten edellisessä viestissäni kerroin, logaritmisia keskiarvoja
lasketaan Survossa uudella LOGMEAN-ohjelmalla. Tämä ohjelmamoduli
on mukana myös näiltä sivuilta imuroitavassa SURVO MM:n ilmais-
versiossa (ver. 1.25).

- Seppo Mustonen

Vastaukset:

Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!

Etusivu  |  Keskustelu
Copyright © Survo Systems 2001-2013. All rights reserved.
Updated 2013-06-15.