[vastaus aiempaan viestiin]
Kirjoittaja: | Petri Palmu |
---|---|
Sähköposti: | petri.palmu'at'helsinki.fi |
Päiväys: | 16.2.2004 13:32 |
Merkkijonon eripituisuuden tuoma hankaluus jäi mietityttämään. Kokeneemmat datan "pulaajat" ovat varmaankin kehittäneet ratkaisuja. Juhan käytäntö toimii kaiketi kaikissa tilanteissa, mutta kiusaan vielä kerran (itseäni) aiheesta ;). Haluaisin nimenomaan puristaa kätevät ratkaisut Survon omista toiminnoista. Alla olevassa esimerkissäni muutin "ryhma"-muuttujaan (numeerinen) arvot "eripituiseksi". DATA A vuosi ryhma ryhma1 ryhvuosi vuosiryh 1994 1 001 1.1994 1994. 1 1995 1 001 1.1995 1995. 1 1996 1 001 1.1996 1996. 1 1994 10 010 10.1994 1994. 10 1995 10 010 10.1995 1995. 10 1996 10 010 10.1996 1996. 10 1994 101 101 101.1994 1994.101 1995 101 101 101.1995 1995.101 1996 101 101 101.1996 1996.101 Yhdistellen vuotta ja ryhmaa (kun ne on eka tehty stringiksi), saadaan "ryhvuosi" tai "ryhvuosi" (erotin kahden muuttujan arvot pisteellä). "vuosiryh" on vähän kinkkisen näköinen, en tiedä haittaako analyyseja teknisesti? "Ryhma1":ssä olen pakottanut merkkimääräisesti eripituiset luvut yhtäpitkiksi 1 -> 001 jne. Tällöin lopullinen yhdistetty muuttuja olisi tyylikkään näköinen ja ilmeisesti säilyttää "ryhma":n mukaisen järjestyksen SORTatessa. Kysymys: Miten tehdä "ryhma1" Survosta käsin? Entä miten - niin tarvittaessa - palauttaa "ryhma1" "ryhma":ksi (toki "ryhma":n voi ottaa mukaan aggregoituun aineistoon FIRST:n avulla). Excelissä ainakin on puoliautomaattinen toiminto, jolla turhat "0":t poistetaan ja text-tyyppi muunnetaan vaikka number-tyypiksi. CLASSIFY:n avulla homma tuntuu työläältä, jos muutettavia lukuja on tosi paljon. Homma mennee? sitten astetta hankalammaksi, jos muuttuja on esim. maakuntien tai kuntien oikeita nimiä sisältävä. Tässäkin on kai hyvä tehdä aggregointi "helpomman" muuttujan (kuntakoodi,...) suhteen ja ottaa oikea nimi mukaan aggregoiden FIRST-funktiolla. Pohdiskeluni saattaa ehkä tuntua liioitellulta, mutta monitasoisuuden tai ositteisuuden ollessa aineistoa hallitseva piirre, joutuu käyttämään ylimääräistä aikaa tähän funtsimiseen. SPSS:n "Compare Means" tarjoaa suhteellisen monipuolisen ja eritoten nopeasti suoritettavan toiminnon useankin muuttujan aggregointiin, mikä ei tietenkään :) ole yhtä monipuolinen ja etenkin edelleen hyödynnettävissä kuin Survossa. Jatkojalostamisesta tuli mieleen täsmäys (MATCH FILE COPY:n yhteydessä) ,kun liitetään monistaen ryhmittäin aggregoidut suureet takaisin alkuperäiseen aineistoon sopivalla avaimella (dataa osittavat ryhmät). Erittäin miellyttävä toiminto! Petri Juha Valtonen kirjoitti 15.2.2004 19:48 : > > >Olen päätynyt tällaisissa tapauksissa ratkaisuun, että jo alunperin >luon tämän tyypppiset muttujat, kuten vuosi, kk, pp stringeinä. Se >helpottaa elämää, ei vain aggrekoinneissa, vaan myös esimerkiksi >siirrettäessä dataa tekstiksi yms. Stringeinäkin niillä voi >tarvittaessa >tehdä laskutoimituksia jne. Numeerisena luon muuttujat vain kun >kyseessä on todella lukuarvo. > >:JVa > > >> Mikä muuten on kätevin tapa, jos oletetaan että minulla on jo >> Survo-data, jossa yksi numeerinen muuttuja halutaan tehdä >stringksi? >
Vastaukset: |
---|
Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!