Re: Logaritmointi

[vastaus aiempaan viestiin]

Kirjoittaja: Juha Puranen
Sähköposti:    juha.puranen'at'helsinki.fi
Päiväys: 22.5.2003 10:56

Seppo Mustonen kirjoitti 21.5.2003 10:46 :

> 
> 
>Ei tunnu järkevältä lähteä käsittelemään logaritmoimalla aineistoa,
>jossa havaintoarvojen joukossa on nollia.
>Jos kuitenkin nollat tarkoittavat puuttuvia tietoja ja niitä on
>suhteellisen vähän jakautuen umpimähkään (eikä systemaattisesti)
>yli aineiston, nollia sisältävät havainnot voi poistaa.
> 

Tässä on kyseessä kulutustutkimusaineisto, jossa ihmiset kirjaaavat
2 viikon aikana eri tavoin käyttämänsä  rahat.

Harjoitustyön tekijät  saattavat tutkia esimerkiksi
tulojen ja velan välistä riippuvuutta, jolloin  aineisto  muodostuu
kahdesta osa-aineistosta ne, joilla on velkaa (kuten minä),  ja ne muut.
Tarkasteluissa voidaan tälläin rajoittua siihen osa-aineistoon, jolla
on velkaa ja katsoa miten lainansaantimahdollisuudet riippuvat  tuloista.


Toinen tyypillinen tarkastelu voisi olla tulojen ja
vihannesten (makkaran, ... )kulutuksen välinen yhteys. Koska
kyseessä on 2. viikon jakso, aineistossa on tyypillisesti paljon
nollahavaintoja (puuttuvia tietoja -  ei ole jakson aikana ostettu
vihanneksia) ja on tarkoituksenmukaista rajoittua niihin, jotka
ovat  vihanneksia tutkimusjakson aikana ostaneet.

Kummassakin tapauksessa  koodaus on  0.  (Jälkimmäisessä tapauksessa
nolla ei paljasta,  syödäänkö  taloudessa  joskus kasviksia, vai
onko hk:n sininen ainoa taloudessa käytetty vihannes)

>Pienestä aineistosta ne ottaa pois suoraan "käsipelillä" esim.
>FILE SHOW-tilassa.
>Yleinen menettely (Survon datatiedostoilla) on mm. seuraava:
>Muodostetaan ylimääräinen indikaattorimuuttuja (esim. Y) , joka kertoo
> 
>paljonko kussakin havainnossa datatiedostossa DATA1 on nollia
>komennolla
>VARSTAT DATA1,Y,#VAL,0
>ja sitten kopioidaan DATA1 uudeksi tiedostoksi DATA2, josta
>nollahavainnot on poistettu komennolla
>FILE COPY DATA1 TO DATA2 / IND=Y,0
>Lopuksi pannaan Y-muuttuja passiiviseksi ja DATA2 logaritmoidaan
>komennolla
>TRANSFORM DATA2 BY log(X)

Eikö olisi  helpompi aloittelevalle Survoilijalle  käyttää
ehdollista muunnosta

VAR LX=if(X=0)then(MISSING)else(log(X))

Aika monessa  tapauksessa (ainakin näissä kulutustutkimuksissa)
logaritmointi  linearisoi aika kivasti muuttujien välisiä
riippuvuuksia.


>- Seppo                                                                > 


- Juha

Vastaukset:

Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!

Etusivu  |  Keskustelu
Copyright © Survo Systems 2001-2013. All rights reserved.
Updated 2013-06-15.