[vastaus aiempaan viestiin]
Kirjoittaja: | Juha Puranen |
---|---|
Sähköposti: | juha.puranen'at'helsinki.fi |
Päiväys: | 22.5.2003 10:56 |
Seppo Mustonen kirjoitti 21.5.2003 10:46 : > > >Ei tunnu järkevältä lähteä käsittelemään logaritmoimalla aineistoa, >jossa havaintoarvojen joukossa on nollia. >Jos kuitenkin nollat tarkoittavat puuttuvia tietoja ja niitä on >suhteellisen vähän jakautuen umpimähkään (eikä systemaattisesti) >yli aineiston, nollia sisältävät havainnot voi poistaa. > Tässä on kyseessä kulutustutkimusaineisto, jossa ihmiset kirjaaavat 2 viikon aikana eri tavoin käyttämänsä rahat. Harjoitustyön tekijät saattavat tutkia esimerkiksi tulojen ja velan välistä riippuvuutta, jolloin aineisto muodostuu kahdesta osa-aineistosta ne, joilla on velkaa (kuten minä), ja ne muut. Tarkasteluissa voidaan tälläin rajoittua siihen osa-aineistoon, jolla on velkaa ja katsoa miten lainansaantimahdollisuudet riippuvat tuloista. Toinen tyypillinen tarkastelu voisi olla tulojen ja vihannesten (makkaran, ... )kulutuksen välinen yhteys. Koska kyseessä on 2. viikon jakso, aineistossa on tyypillisesti paljon nollahavaintoja (puuttuvia tietoja - ei ole jakson aikana ostettu vihanneksia) ja on tarkoituksenmukaista rajoittua niihin, jotka ovat vihanneksia tutkimusjakson aikana ostaneet. Kummassakin tapauksessa koodaus on 0. (Jälkimmäisessä tapauksessa nolla ei paljasta, syödäänkö taloudessa joskus kasviksia, vai onko hk:n sininen ainoa taloudessa käytetty vihannes) >Pienestä aineistosta ne ottaa pois suoraan "käsipelillä" esim. >FILE SHOW-tilassa. >Yleinen menettely (Survon datatiedostoilla) on mm. seuraava: >Muodostetaan ylimääräinen indikaattorimuuttuja (esim. Y) , joka kertoo > >paljonko kussakin havainnossa datatiedostossa DATA1 on nollia >komennolla >VARSTAT DATA1,Y,#VAL,0 >ja sitten kopioidaan DATA1 uudeksi tiedostoksi DATA2, josta >nollahavainnot on poistettu komennolla >FILE COPY DATA1 TO DATA2 / IND=Y,0 >Lopuksi pannaan Y-muuttuja passiiviseksi ja DATA2 logaritmoidaan >komennolla >TRANSFORM DATA2 BY log(X) Eikö olisi helpompi aloittelevalle Survoilijalle käyttää ehdollista muunnosta VAR LX=if(X=0)then(MISSING)else(log(X)) Aika monessa tapauksessa (ainakin näissä kulutustutkimuksissa) logaritmointi linearisoi aika kivasti muuttujien välisiä riippuvuuksia. >- Seppo > - Juha
Vastaukset: |
---|
Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!