Re: Merkkijonomuunnokset datassa

[vastaus aiempaan viestiin]

Kirjoittaja: Petri Palmu
Sähköposti:    -
Päiväys: 13.8.2008 12:14


Juha Valtonen kirjoitti 11.8.2008 22:56 :

> 
>Minä käyttäisin tässä tapauksessa varmaankin
>CLASSIFYtä
> 
>CLASSIFY data KORJ muuttuja muuttuja
> 
>CLASSIFICATION KORJ
>Hyvink'ä:  Hyvinkää
>OTHERS:    NO_CHANGE
> 
> 
>sääntöjä voi sitten avittaa kaikilla IND, CASES,
>tai PARTIAL ja WILD -virityksillä
> 
>ks lisää: CLASSIFY?
> 
>:JVa
> 

Joo nuo PARTIAL JA WILD ovat kyllä olleet hyödyllisiä. TXTCONV on
minusta kuitenkin luonteva lähtökohta, kun kyseessä on yksittäinen
merkki eikä koko string (ä -merkkejä sisältäviä kuntia on aika paljon
ja "ä" kombinaatioita nimen sisällä riittää...)
. Tosin pitää kikkailla, niin että homma ei kohdistu koko dataan,
vaan ko kenttään. Käytännössä siis pitää tallettaa ko. muuttuja
tekstifileen ja tehdä konversiot (TXTCONV) ja sitten kopsata
korjatut arvot takaisin dataan (MATCH=# avulla).

Muistelin vaan, että oli joku CODES tyyppinen homma, jolla
pystyi mm. kertaheitolla vaihtamaan pienet kirjaimet isoiksi...

Aika usein teen näitä muunnoksia R:n gsub() -funktiolla, joka sallii
säännöllisiä lausekkeita. Tekemälläni /R_VAR -sukrolla homma
hoituu Survon data fileen varsin kätevästi :)

t. Petri

Vastaukset:

Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!

Etusivu  |  Keskustelu
Copyright © Survo Systems 2001-2013. All rights reserved.
Updated 2013-06-15.