Re: Merkkijonomuunnokset datassa [Survo-keskustelupalstan (2001-2013) arkisto]

Re: Merkkijonomuunnokset datassa

Kirjoittaja:	Petri Palmu
Sähköposti:	-
Päiväys:	13.8.2008 12:14


Juha Valtonen kirjoitti 11.8.2008 22:56 :

> 
>Minä käyttäisin tässä tapauksessa varmaankin
>CLASSIFYtä
> 
>CLASSIFY data KORJ muuttuja muuttuja
> 
>CLASSIFICATION KORJ
>Hyvink'ä:  Hyvinkää
>OTHERS:    NO_CHANGE
> 
> 
>sääntöjä voi sitten avittaa kaikilla IND, CASES,
>tai PARTIAL ja WILD -virityksillä
> 
>ks lisää: CLASSIFY?
> 
>:JVa
> 

Joo nuo PARTIAL JA WILD ovat kyllä olleet hyödyllisiä. TXTCONV on
minusta kuitenkin luonteva lähtökohta, kun kyseessä on yksittäinen
merkki eikä koko string (ä -merkkejä sisältäviä kuntia on aika paljon
ja "ä" kombinaatioita nimen sisällä riittää...)
. Tosin pitää kikkailla, niin että homma ei kohdistu koko dataan,
vaan ko kenttään. Käytännössä siis pitää tallettaa ko. muuttuja
tekstifileen ja tehdä konversiot (TXTCONV) ja sitten kopsata
korjatut arvot takaisin dataan (MATCH=# avulla).

Muistelin vaan, että oli joku CODES tyyppinen homma, jolla
pystyi mm. kertaheitolla vaihtamaan pienet kirjaimet isoiksi...

Aika usein teen näitä muunnoksia R:n gsub() -funktiolla, joka sallii
säännöllisiä lausekkeita. Tekemälläni /R_VAR -sukrolla homma
hoituu Survon data fileen varsin kätevästi :)

t. Petri

Vastaukset:

FILE CONVERT - OK! (Petri Palmu 13.8.2008 14:08)

Luettelo keskustelunaiheista

Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!

Etusivu | Keskustelu