Re: Numeeristen + stringien yhdistely stringiksi (

[vastaus aiempaan viestiin]

Kirjoittaja: Petri Palmu
Sähköposti:    petri.palmu'at'helsinki.fi
Päiväys: 16.2.2004 13:32

Merkkijonon eripituisuuden tuoma hankaluus jäi
mietityttämään. Kokeneemmat datan "pulaajat" ovat
varmaankin kehittäneet ratkaisuja. Juhan käytäntö
toimii kaiketi kaikissa tilanteissa, mutta kiusaan vielä kerran
(itseäni) aiheesta ;). Haluaisin nimenomaan puristaa kätevät ratkaisut
Survon omista toiminnoista.

Alla olevassa esimerkissäni muutin
"ryhma"-muuttujaan (numeerinen) arvot "eripituiseksi".

DATA A
vuosi  ryhma  ryhma1  ryhvuosi  vuosiryh
1994   1       001      1.1994  1994.  1
1995   1       001      1.1995  1995.  1
1996   1       001      1.1996  1996.  1
1994   10      010     10.1994  1994. 10
1995   10      010     10.1995  1995. 10
1996   10      010     10.1996  1996. 10
1994   101     101    101.1994  1994.101
1995   101     101    101.1995  1995.101
1996   101     101    101.1996  1996.101

Yhdistellen vuotta ja ryhmaa (kun ne on eka tehty stringiksi),
saadaan "ryhvuosi" tai "ryhvuosi" (erotin kahden muuttujan
arvot pisteellä). "vuosiryh" on vähän kinkkisen näköinen, en tiedä
haittaako analyyseja teknisesti?

"Ryhma1":ssä olen pakottanut merkkimääräisesti eripituiset
luvut yhtäpitkiksi 1 -> 001 jne. Tällöin lopullinen yhdistetty muuttuja
olisi tyylikkään näköinen ja ilmeisesti säilyttää "ryhma":n mukaisen
järjestyksen SORTatessa.
Kysymys: Miten tehdä "ryhma1" Survosta käsin? Entä miten - niin
tarvittaessa - palauttaa "ryhma1" "ryhma":ksi (toki "ryhma":n voi ottaa
mukaan aggregoituun aineistoon FIRST:n avulla). Excelissä ainakin
on puoliautomaattinen toiminto, jolla turhat "0":t poistetaan ja
text-tyyppi muunnetaan vaikka number-tyypiksi. CLASSIFY:n avulla homma
tuntuu työläältä, jos muutettavia lukuja on tosi paljon.

Homma mennee? sitten astetta hankalammaksi, jos muuttuja on esim.
maakuntien tai kuntien oikeita nimiä sisältävä. Tässäkin on kai hyvä
tehdä aggregointi "helpomman" muuttujan (kuntakoodi,...)
suhteen ja ottaa oikea nimi mukaan aggregoiden FIRST-funktiolla.

Pohdiskeluni saattaa ehkä tuntua liioitellulta, mutta monitasoisuuden
tai ositteisuuden ollessa aineistoa hallitseva piirre,
joutuu käyttämään ylimääräistä aikaa tähän funtsimiseen.
SPSS:n "Compare Means" tarjoaa suhteellisen monipuolisen ja eritoten
nopeasti suoritettavan toiminnon useankin muuttujan aggregointiin, mikä
ei tietenkään :) ole yhtä monipuolinen ja etenkin edelleen
hyödynnettävissä kuin Survossa.
Jatkojalostamisesta tuli mieleen täsmäys (MATCH  FILE COPY:n yhteydessä)
,kun liitetään monistaen ryhmittäin aggregoidut suureet takaisin
alkuperäiseen aineistoon sopivalla avaimella (dataa osittavat ryhmät).
Erittäin miellyttävä toiminto!

Petri



Juha Valtonen kirjoitti 15.2.2004 19:48 :

> 
> 
>Olen päätynyt tällaisissa tapauksissa ratkaisuun, että jo alunperin
>luon tämän tyypppiset muttujat, kuten vuosi, kk, pp stringeinä. Se
>helpottaa elämää, ei vain aggrekoinneissa, vaan myös esimerkiksi
>siirrettäessä dataa tekstiksi yms. Stringeinäkin niillä voi
>tarvittaessa
>tehdä laskutoimituksia jne. Numeerisena luon muuttujat vain kun
>kyseessä on todella lukuarvo.
> 
>:JVa
> 
> 
>>  Mikä muuten on kätevin tapa, jos oletetaan että minulla on jo
>>  Survo-data, jossa yksi numeerinen muuttuja halutaan tehdä
>stringksi?
> 

Vastaukset:

Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!

Etusivu  |  Keskustelu
Copyright © Survo Systems 2001-2013. All rights reserved.
Updated 2013-06-15.