[vastaus aiempaan viestiin]
Kirjoittaja: | Seppo Mustonen |
---|---|
Sähköposti: | - |
Päiväys: | 14.9.2002 15:32 |
Kerrottuani Yrjö Vartialle uusiintuneesta kiinnostuksestani logaritmista keskiarvoa ja erityisesti sen yleistämistä kohtaan, hän palautti mieleeni ja toimitti käsiini artikkelin L.Törnqvist, P.Vartia, Y.Vartia (1985): How Should Relative Chages Be Measured. The American Statistician. February 1985, Vol.39, No.1, josta mm. ilmenee, että Leo Törnqvist on jo vuonna 1935 (ruotsin- kielisessä julkaisussaan) tuonut esiin käsitteen "log-mean". Yrjö Vartia on sitten 1970-luvun alkupuolelta lähtien käyttänyt lausekkeesta L(x,y)=(x-y)/log(x/y) johdonmukaisesti nimitystä logaritminen keskiarvo (logarithmic mean). Tuossa vuoden 1985 artikkelissa suositellaan suhteellisen muutoksen mittaamisessa käytettäväksi tavanomaisen R1(x,y)=(y-x)/x asemasta logaritmista muutosta R2(x,y)=log(y/x) . Suositus johtuu mm. siitä epäkohdasta, että esim. R1(1,2)=1 (100%) mutta R1(2,1)=-0.5 (-50%), kun sen sijaan R2(1,2)=log(2)=0.693... (69.3 L%) ja R2(2,1)=log(1/2)=-0.693... (-69.3 L%) eli yleisesti logaritmisella muutoksella on miellyttävä käänteisominaisuus R2(x,y)=-R2(y,x) joka puuttuu tavalliselta suhteelliselta muutokselta aiheuttaen jatkuvaa sekaannusta monissa käytännön vertailutilanteissa. Pienillä muutoksilla R1 ja R2 ovat toki lähellä toisiaan, mikä ilmenee mielestäni parhaiten sarjakehitelmästä R2(x,y) = log(1+(y/x-1)) = log(1+R1(x,y)) = R1(x,y) - R1(x,y)^2/2 + R1(x,y)^3/3 -... eli tavanomainen suhteellinen muutos on luonteeltaan ensimmäisen asteen approksimaatio logaritmiselle suhteelliselle muutokselle. Samassa artikkelissa tuodaan esiin muitakin hyödyllisiä ominaisuuksia, jotka R2(x,y) täyttää verrattuna muihin suhteellisen muutoksen mitta- reihin. Useat kirjallisuudessa näkyvät ehdotukset ovat muotoa R(x,y)=(x-y)/K(x,y), missä K(x,y) on jokin keskiarvo. Törnqvist ja Vartiat toteavat, että logaritmisella suhteellisella muutoksella tuo K on logaritminen keskiarvo eli x-y R2(x,y)=log(x/y)= -------------- = (x-y)/L(x,y) . (x-y)/log(x/y) Tätä seikkaa voi pitää eräänä lähtökohtana logaritmiseen keskiarvoon kohdistuneelle mielenkiinnolle. Tuossa Törnqvistin ja Vartioitten artikkelissa viitataan tällä kohtaa myös omaan logaritmisen keskiarvon yleistykseeni n havainnon tapauk- seen: "Unpublished manuscript (1976)". Muistan saaneeni aikoinaan tuon maininnan johdosta ainakin yhden tiedustelun, jossa toivottiin "käsikirjoitusta" nähtäväksi. Se oli kuitenkin vain läjä suttuisia papereita, joiden kopioiden lähettämistä en voinut ajatellakaan. Tuolloin minulla ei ollut mahdollisuutta ryhtyä viimeistelemään ehdotustani. On ehkä korkea aika yrittää sitä nyt ja perustella, mistä ehdotukseni (eritoten tuo pirunnyrkkikaava) n xi (1) L(x1,x2,...,xn) = (n-1)! SUMMA --------------- i=1 n TULO log(xi/xj) j=1 j<>i on kotoisin. Motivaatiotani selvittää enemmälti asiaa on aikaisemmin hillinnyt se, etten ole saanut mitenkään hyödynnettyä tätä tulosta. Kuten edellisessä viestissäni totean, logaritmisen keskiarvon laskennassa pirunnyrkki (rajoitetulla laskutarkkuudella) räjähtää herkästi älyttömiin arvoihin. Kannattaa siis sen sijasta käyttää sarjakehitelmää. Nyt olen kuitenkin löytänyt kiintoisan ominaisuuden, jonka osoittamisessa pirunnyrkki-esitys on todella kätevä, mutta jonka toteaminen sarjakehitelmästä lienee hankalaa. Tarkastellaan eksponentiaalista havaintosarjaa x0, x0*c, x0*c^2, x0*c^3,..., x0*c^(n-1) . Tässä tapauksessa (1) tulee aluksi muotoon (n-1)!*x0 n c^(i-1) L(x1,x2,...,xn) = ------------ SUMMA ------------ . log(c)^(n-1) i=1 n TULO (i-j) j=1 j<>i Tällöin summassa jakajat ovat muotoa (-1)^(n-i)*(i-1)!*(n-i)!, jolloin binomikertoimen esityksen C(m,k)=m!/[k!*(m-k)!] mukaisesti (n-1)! n (-1)^(n-i)*C(n-1,i-1)*c^(i-1) L(x1,x2,...,xn) = ------------ SUMMA ------------------------------- log(c)^(n-1) i=1 (n-1)! (n-1)!*x0 (c-1)^(n-1) = ------------ * ----------- (binomikaavasta) log(c)^(n-1) (n-1)! = x0*[(c-1)/log(c)]^(n-1) = x0*L(c,1)^(n-1) . Siis, kun havainnot muuttuvat askeleittain kertoimella c, niin logaritminen keskiarvo muuttuu kertoimella L(c,1). Oli itselleni yllätys havaita, että samanlainen sääntö koskee geometris- ta keskiarvoa eli todetaan helposti, että tässä havaintosarjassa G(x1,x2,...,xn) = x0*G(c,1)^(n-1), missä siis G(c,1)=sqrt(c*1). Geometrinen ja logaritminen keskiarvo ovat siis näinkin sukua toisilleen. Kuitenkin, kun c<>1, seuraa väistämättä, että L/G -> oo, kun n -> oo, koska L(c,1)>G(c,1). Pirunnyrkkikaavan johtaminen: ----------------------------- Tarkastellaan havaintoaineistoa x1,x2,...,xn havaintoarvojen logaritmien u1=log(x1),...,un=log(un) välityksellä. Edellisessä viestissäni totesin, että vertailemalla eri keskiarvoja sarjakehitelmien avulla on luonnollisinta tehdä yleistys (2) L(x1,x2,...,xn) = 1 + (u1+u2+...+un)/n u1^2+u1*u2+...+u1*un+u2^2+u2*u3+...+un^2 + ---------------------------------------- C(n+1,2)*2! ... u1^m+u1^(m-1)*u2+...+un^m + ------------------------- C(n+m-1,m)*m! + ... missä siis m-asteisen termin osoittajassa oleva polynomi on muotoa P(n,m)= SUMMA u1^i1*u2^i2*...*un^in i1+i2+...+in=m i1>=0, i2>=0,...,in>=0 eli homogeenisten polynomien kaikki kertoimet ovat pelkkiä ykkösiä, kuten on asian laita lähtökohtana olevassa tapauksessa n=2. Jakajina ovat binomikertoimet, jotka vastaavat yhteenlaskettavien lukumääriä. Totesin myös, että polynomit P(n,m) on kätevä lausua esim. viimeisen u:n alenevien potenssien mukaan rekursiivisesti muodossa (3) P(n,m) = u(n)^m + u(n)^(m-1)*P(n-1,1) + u(n)^(m-2)*P(n-1,2) ... + u(n)^1*P(n-1,m-1) + u(n)^0*P(n-1,m) reunaehdoin P(n,1) = u1+u2+...+u(n), P(1,m) = u1^m. Jos kaikki x:t ja vastaavasti u:t ovat keskenään eri suuria, ratkaisevaa on nyt huomata, että näille polynomeille löytyy toinen esitystapa lausekkeiden n ui^m (4) Q(n,m) = SUMMA ------, k=0,1,2,..., i=1 T(i) missä n (4b) T(i) = TULO (ui-uj), j=1 j<>i avulla. On nimittäin voimassa yhtälöt (5) Q(n,m) = 0, kun m=0,1,2,...,n-2, (6) Q(n,n-1) = 1, (7) Q(n,m) = P(n,m-n+1), kun m=n,n+1,n+2,... . Nämä identiteetit ovat mielenkiintoisia, sillä en ole sattunut näkemään vastaavaa missään aikaisemmin. On kuitenkin hyvin ilmeistä, että ne tunnetaan jostain muusta yhteydestä. Olisinkin kiitollinen kaikista vinkeistä, mikäli joku tuntee nuo identiteetit ennestään. Esim. Q(4,0)=0 on aukikirjoitettuna 1 1 1 --------------------- + --------------------- + --------------------- (u1-u2)(u1-u3)(u1-u4) (u2-u1)(u2-u3)(u2-u4) (u3-u1)(u3-u2)(u3-u4) 1 + --------------------- = 0 . (u4-u1)(u4-u2)(u4-u3) Paikkansapitävyyden toteaa suoralla laskulla tekemällä termit samannimisiksi ja toteamalla, että osoittajaksi saadaan yhteenlaskun jälkeen lausekerykelmä, joka sievenee nollaksi. Yleisesti yhtälöiden (5)-(7) todistaminen ei kuitenkaan onnistune tuota kautta. Esitän yleisen todistuksen tämän viestin lopussa. Nyt pyrin osoittamaan pirunnyrkkiesityksen (1) ja sarjakehitelmän (2) yhtäpitävyyden olettaen, että yhtälöt (5),(6),(7) pitävät paikkansa. Sarjakehitelmää (2) muotoillaan vaiheittain seuraavasti: L(x1,x2,...,xn) = 1 + P(n,1)/n + P(n,2)/[C(n+1,2)*2!] + ... + P(n,m)/[C(n+m-1,m)*m!] + ... oo P(n,m) = 1 + (n-1)! SUMMA -------- m=1 (n+m-1)! oo Q(n,n+m-1) = 1 + (n-1)! SUMMA ----------- (7):n nojalla m=1 (n+m-1)! oo Q(n,k) = 1 + (n-1)! SUMMA -------- k=n k! oo Q(n,k) = (n-1)! SUMMA -------- (6):n nojalla k=n-1 k! oo Q(n,k) = (n-1)! SUMMA -------- (5):n nojalla k=0 k! n ui^k SUMMA ------ oo i=1 T(i) = (n-1)! SUMMA ------------ (4):n nojalla k=0 k! oo ui^k SUMMA ------ n k=0 k! = (n-1)! SUMMA ------------ i=1 T(i) n exp(ui) = (n-1)! SUMMA ---------- (4b):n nojalla, i=1 n TULO (ui-uj) j=1 j<>i mikä on sama kuin pirunnyrkki (1), kun otetaan huomioon, että ui=log(x1), i=1,2,...,n. Edellä olevassa kehittelyssä on merkille pantavaa, miten (5) ja (6) ovat "elämälle u1,u2,...,un vieraita kuolleita sieluja", jotka välttämättä tarvitaan eksponenttifunktion sarjakehitelmän täydentämiseen. Identiteettien (5),(6),(7) todistaminen: ---------------------------------------- Välittömästi nähdään, että ko. identiteetit ovat voimassa, kun n=2. Tällöinhän Q(2,k) = u1^k/(u1-u2)+u2^k/(u2-u1) = (u1^k-u2^k)/(u1-u2), k=0,1,2,... eli Q(2,0)=0, Q(2,1)=1 ja Q(2,k)=P(2,k-1), kun k=2,3,... Yleinen todistus perustuu induktioon n-1 -> n eli oletetaan, että ko. yhtälöt pitävät paikkansa arvolla n-1 ja näytetään, että ne tällöin pätevät myös arvolla n. Kirjoittamalla määritelmässä (4) osoittajat ui^m muotoon (ui^m-un^m)+un^m ja erottamalla termit kahtia ja supistamalla ensimmäinen osa nimittäjän viimeisellä tekijällä ui-un syntyy rekursiokaava (8) Q(n,m) = un^(m-1)*Q(n-1,0) + un^(m-2)*Q(n-1,1) + ... + un^0*Q(n-1,m-1) + un^m*Q(n,0), kun m=1,2,... Merkitään nyt väliaikaisesti Q(n,0) = f(u1,u2,...,un) ja tarkastellaan funktiota f argumenttiensa käänteisarvoilla eli funktiota f(1/u1,1/u2,...,1/un). Tällöin on välittömästi pääteltävissä, muuntamalla nimittäjiin syntyvät murtolausekkeet 1/ui-1/uj muotoon (uj-ui)/(ui*uj) ja ottamalla eteen yhteiset tekijät, että f(1/u1,1/u2,...,1/un) = (-1)^n*u1*u2*...*un*Q(n,n-2) Soveltamalla rekursiokaavaa (8) viimeiseen tekijään ja ottamalla huomioon se, että induktio-oletuksen mukaan kaavat (5) pätevät tapauksessa n-1, rekursiokaavassa vain viimeinen termi voi olla nollasta poikkeava eli f(1/u1,1/u2,...,1/un) = (-1)^n*u1*u2*...*un*un^(n-2)*f(u1,u2,...,un). Funktio f(u1,...,un) on homogeeninen ja symmetrinen argumenttiensa suhteen. Jos f olisi muuta kuin identtisesti nolla, seuraisi ristiriita, sillä viimeisen yhtälön oikea puoli ei tällöin olisi symmetrinen funktio tapauksissa n>2. Näin siis Q(n,0)=0, kun n=2,3,... ja (5) on todistettu tapauksessa m=0. Rekursiokaavassa (8) viimeinen termi jää siten pois ja on voimassa (9) Q(n,m) = un^(m-1)*Q(n-1,0) + un^(m-2)*Q(n-1,1) + ... + un^0*Q(n-1,m-1), kun m=1,2,... Tästä seuraa induktio-oletuksen perusteella Q(n,1) = un^0*Q(n-1,0) = 0, Q(n,2) = un^1*Q(n-1,0) + un^0*Q(n-1,1) = 0, ... Q(n,n-2) = un^(n-3)*Q(n-1,0) + ... + u^n0*Q(n-1,n-3) = 0 eli (5) on todistettu myös tapauksissa m=1,2,...,n-2. Tapauksessa m=n-1 rekursiokaava (9) antaa (induktio-oletuksin) Q(n,n-1) = un^0*Q(n-1,n-2) = 1*1 = 1 eli näin (6) on näytetty toteen. Tapauksessa m=n vuorostaan kaavasta (9) seuraa Q(n,n) = un^1*Q(n-1,n-2) + un^0*Q(n-1,n-1) = un*1 + 1*(u1+u2+...+u(n-1)) = u1+u2+...+un ja siis (7) pätee tapauksessa m=n ja Q(n,n)=P(n,1). Näiden tulosten perusteella rekursiokaavan (9) voi edelleen typistää muotoon (10) Q(n,m) = un^(m-n+1) + un^(m-n)*Q(n-1,n-1) ... + un^0 *Q(n-1,m-1) , k=1,2,... Käyttäen tätä kaavaa ja yhtälöä (7) arvolla n-1 saadaan Q(n,n+1) = un^2 + un^1*Q(n-1,n-1) + un^0*Q(n-1,n) = un^2 + un*P(n-1,1) + P(n-1,2) = P(n,2) (3):n nojalla eli (7) pätee tapauksessa m=n+1 ja Q(n,n+1)=P(n,2). Vastaavasti kun m>n saadaan yhtälöitä (10) ja (7) (jälkimmäistä arvolla n-1) soveltaen Q(n,m) = + un^(m-n+1) + un^(m-n) *P(n-1,1) + un^(m-n-1)*P(n-1,2) ... + un^0 *P(n-1,m-n+1) = P(n,m-n+1) (3):n nojalla eli (7) on todistettu yleisesti. - - - - - - - Kuten edellisessä viestissäni kerroin, logaritmisia keskiarvoja lasketaan Survossa uudella LOGMEAN-ohjelmalla. Tämä ohjelmamoduli on mukana myös näiltä sivuilta imuroitavassa SURVO MM:n ilmais- versiossa (ver. 1.25). - Seppo Mustonen
Vastaukset: |
---|
Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!