[viesti Survo-keskustelupalstalla (2001-2013)]
Kirjoittaja: | Petri Palmu |
---|---|
Sähköposti: | petri.palmu'at'helsinki.fi |
Päiväys: | 9.5.2003 9:55 |
Terve ! Olen yrittänyt löytää SURVO:sta toimintoja, joilla tehdä kätevästi erityyppisiä temppuja datalle, joka sisältää sekä poikkileikkaus- että aikasarjahavaintoja. Datani koskee joukkoa taloudellisia muuttujia Suomesta kuntatasolla (n. 450 kpl), joista jokaisesta kunnasta on saatavilla 8 vuosihavaintoa. Haluaisin muuntaa kaikki muuttujat "yhdellä iskulla" log-vuosimuutoksiksi, mutta en tiedä, miten muunnos tehdään ositteittain. Paneelidatan ollessa pinotussa muodossa (kunnittaiset havainnot allekkain), on havaintorivejä yhteensä n. 450 * 8 kpl. Muunnetussa aineistossa kuntakohtaisia havaintoja olisi sitten vain 7 kpl, jos tehdään yhdellä periodilla viivästettyjä log-differenssejä. SPSS:ssä osa-aineistoittaiset muunnokset voidaan tehdä SPLIT FILE toiminnan avulla, R:ssä on erilaisia tapoja, joista ainakin yksi tapahtuu ositusapumuuttujan avulla (tapply -toiminto). Jos muunnettavia muuttujia olisi vain yksi, niin R:ssä voidaan siirtyä pinotusta (stacked) "leveään" (unstacked) esitysmuotoon, ja tehdä muunnokset ikään kuin ositekohtaiset havainnot toimisivat sarakemuuttujina. Tämä on kuitenkin kankeata, jos ja kun aitoja muuttujia on enemmän kuin yksi. Ymmärtääkseni periaatteessa SURVO:n TRANSFORM toiminto tekee muunnokset vaikka kaikille datan muuttujille, mutta saako toiminnon yhteyteen lisäoption: "Tee muunnos diff(log(x)) erikseen jokaiselle ositteelle, missä osittamisen määrää ryhmittelymuuttuja"? Tämän lisäksi kuntahavaintoihin liittyy muitakin (passiivisia) indeksoivia taustatietoja, kuten. maakunta, seutukunta, kuntamuoto, johon tietty kunta kuuluu ja joita tarvitaan esim. maakuntason log-muutosten aggrekoimisessa (tietty painottamalla log-muutoksia sopivalla säännöllä). Kaikki raakadatassa oleva ryhmittelytieto pitäisi siis saada mukaan uuteen, muunnettuun aineistoon, mikä ilmeisesti onnistuu varsin vaivatta liitämällä yhteen muunnettu data ja alkuperäinen vain ryhmittelymuuttujien osalta. Täytyy vielä muistaa, että raakadatassa on yksi havainto per osite enemmän kuin log-muutosten datassa. Yleisemminkin olen kiinnostunut siitä, miten SURVOSSA hoidetaan aineiston splittaukset silloin, kun samoja operaatiot (esim. regressiomallin estimointi) tehdään vaikkapa 500 sadalle ositteelle. Tällöin IND, CASES,.. -rajoittimien avulla käsipelillä puuhastelu ei ole kovinkaan tervejärkistä meininkiä. Ongelmani on ehkäpä "olematon", mutta vielä varsin kokemattomana SURVO:n käyttäjänä en ole pitkällisten etsintöjeni jälkeen löytänyt kunnollista teknistä ratkaisua, mikä vähän tuppaa olemaan riesana muuten antoisassa "survoomisessa". t. Petri Palmu --------------------------- Keskusteluryhmän ylläpitäjän huomautus: Viesti oli alunperin lähetetty 8.5.2003 klo 20:34. Korvasin sen tänään uudella, koska se oli pitkien rivien vuoksi vaikeasti luettavissa. Olemme halunneet säilyttää rivinvaihdot, jotta tänne voisi laittaa myös taulukkomuotoista tietoa. Varjopuolena on, että leikepöydältä joistain ohjelmista suoraan siirretyt tekstit eivät rivity vaan jäävät pitkiksi rimpsuiksi. Molempia ominaisuuksia ei yhtaikaa oikein saa. :( - terv. Kimmo Vehkalahti (webmaster@survo.fi)
Vastaukset: |
---|
Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!