[vastaus aiempaan viestiin]
Kirjoittaja: | Reijo Sund |
---|---|
Sähköposti: | - |
Päiväys: | 20.11.2007 23:24 |
> Onko olemassa standardilähestymistapaa pieneen (n < 30) > aineistoon, joka on tavallaan parittainen (matched case control, > iän mukaan), mutta jossa jokaista tapausta (C) vastaakin kaksi > verrokkia (V). Tämä onkin ihan kiinnostava kysymys. Periaatteessa menetelmiä on, mutta pienten aineistojen kanssa voi tulla hankaluuksia. Kokeillaan pienellä koeaineistolla, mitä saadaan aikaiseksi. Tarkastellaan siis aineistoa, jossa muuttuja A vastaa tapauksen mittauksia ja B sekä C tapauksen kaltaistettujen verrokkien mittauksia. Määritellään samalla pari apumuuttujaa, jotka kertovat mikä "pari" on kulloinkin kyseessä. *.................................................................. *DATA KOE,A,B,C CA B C P1 P2 P3 P4 P5 A110 100 103 1 0 0 0 0 *107 108 106 0 1 0 0 0 *117 110 108 0 0 1 0 0 *118 111 117 0 0 0 1 0 B115 115 111 0 0 0 0 1 * * *FILE COPY KOE TO NEW Q01 *.................................................................. > Ainakin Y_V1 ja Y_V2 arvoista voisi ottaa keskiarvon > ja käyttää tätä keskiarvoa uutena muuttujana Y_V Tällä tavalla saadaan jonkunmoinen tulos helposti aikaiseksi, mutta tapa ei ole suositeltava. *.................................................................. *VAR BCMEAN=(B+C)/2 TO Q01 *COMPARE Q01(A),Q01(BCMEAN),CUR+2 / TEST=PAIRED * *Paired comparisons: *Samples: N=5 Q01(A) Q01(BCMEAN) Difference *Mean 113.4000 108.9000 -4.500000 *Standard deviation 4.722288 5.029911 3.708099 *Paired t=-2.714 (P=0.0267 one-sided t test df=4) *Wilcoxon signed ranks test=-1.826 (P=0.0339 normal approximation) *Critical levels by simulation: * Differences Signed rank *Critical level 0.06322 0.06322 N=100000 *Standard error 0.00077 0.00077 *.................................................................. Standarditapa on muotoilla ongelma regressiomallin muotoon. Otetaan tapauksen ja verrokkien mittaukset selitettäväksi muuttujaksi ja selitetään niitä ryhmään- ja "pareihin" kuulumisella. Tätä varten tarvitaan verrokkiryhmän indikoiva dummy-muuttuja ja dummyt jokaiselle "parille". Malli on siis muotoa: Y(it) = a(i) + bx(t), jossa i vastaa "paria" ja t ryhmää. Ongelma tässä lähestymistavassa ovat kaltaistettujen "parien" muodostamat klusterit. Käytännössä parimuuttujat ovat pelkkiä kiusaparametreja ja standardiratkaisu olisikin käyttää estimoinnissa kiusaparametrit eliminoivaa ehdollista uskottavuusfunktiota tai käsitellä parimuuttujia satunnaisefekteinä monitasomallissa. Pienten aineistojen ja ei-normaalisten mittausten kanssa voi silti tulla hankaluuksia. Oletetaan mittaukset nyt normaalisti jakautuneiksi ja kokeillaan käyttää tavallista regressioanalyysia, vaikka sen antamat tulokset ovatkin klusteroinnin takia luultavasti hieman harhaisia. *.................................................................. *FILE COPY Q01 TO NEW Q02 *FILE COPY Q01 TO Q02 *FILE COPY Q01 TO Q02 *.................................................................. *VAR A=B TO Q02 / IND=ORDER,6,10 *VAR A=C TO Q02 / IND=ORDER,11,15 *VAR RYH:1=0 TO Q02 / IND=ORDER,1,5 *VAR RYH:1=1 TO Q02 / IND=ORDER,6,15 *.................................................................. *REGDIAG Q02,CUR+2 / VARS=A(Y),RYH(X),P2(X),P3(X),P4(X),P5(X) * *Regression diagnostics on data Q02: N=15 *Regressand A # of regressors=6 (Constant term included) *Condition number of scaled X: k=5.39034 *Variable Regr.coeff. Std.dev. t *Constant 107.33333 1.9209694 55.875 *RYH -4.5000000 1.5402020 -2.9217 *P2 2.6666667 2.2959976 1.1614 *P3 7.3333333 2.2959976 3.1940 *P4 11.000000 2.2959976 4.7909 *P5 9.3333333 2.2959976 4.0650 *Variance of regressand A=28.11428571 df=14 *Residual variance=7.907407407 df=9 *R=0.9051 R^2=0.8192 Durbin-Watson=2.911 *.................................................................. Regressiomallilla saadaan otettua huomioon tapausten ja verrokkien eri määrät. RYH-muuttujaan liittyvä t-arvo onkin pienempi kuin käytettäessä verrokkien mittausten keskiarvoa tavallisessa parittaisessa testissä. > Vielä tulee mieleen jonkimoiset simulointi- tai > uudelleenotantamenetelmät. Yksi tähän kategoriaan kuuluva tapa voisi olla hiukan muunnettu bootstrappaus, jossa muodostetaan ensin mahdolliset tapaus-verrokkiparit (n=2*tapausten määrä) ja poimitaan tästä aineistosta sitten tapausten määrän kokoisia replikaatteja ja testataan niitä parittaisella testillä ja otetaan tulokset talteen. Seuraava pätkä sukroineen tuottaa toimituskentän loppuun tuhat replikaattia parittaisen simulaatiotestin p-arvosta. Erittäin pienen aineiston vuoksi tulokset eivät ole kovin siististi jakautuneita, mutta hiukan isommilla aineistoilla tämä tapa voisi olla kokeilemisen arvoinen ainakin herkkyysanalyysimielessä. *.................................................................. *FILE COPY Q01 TO NEW Q03 *FILE COPY Q01 Q03 *.................................................................. *VAR B=C TO Q03 / IND=ORDER,6,10 *.................................................................. *MAT SAVE DATA Q03 TO Q / VARS=A,B *.................................................................. *MAT R=#SAMPLE(Q,5,1000,URS,111) *FILE SAVE MAT R TO R *VAR REP=int((ORDER-1)/5)+1 TO R *.................................................................. *TUTSAVE LOOP *{init}{tempo -1}{W2=1} *{R}{R}{ref set 1}{d12}{r16}{ref set 2} + luuppi: *{ref jump 1}{erase}IND=REP,{print W2} *{R}{pre}{act}{ref jump 2}{save word W3} *{line start}{d3}{u}{ins line}{print W3} *{W2=W2+1} - if W2 <= W1 then goto luuppi *{end} * */LOOP 1000 *.................................................................. *IND=REP,1 *FILE COPY R TO NEW T *COMPARE T(A),T(B),CUR+2 / TEST=PAIRED * terv. Reijo
Vastaukset: |
---|
Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!