[viesti Survo-keskustelupalstalla (2001-2013)]
Kirjoittaja: | Reijo Sund |
---|---|
Sähköposti: | reijo.sund'at'stakes.fi |
Päiväys: | 27.8.2002 16:40 |
Tulipa tässä mieleen tuosta Sepon esittämästä mielivaltaisella tarkkuudella laskemisesta yksi asiaan vain mutkan kautta liittyvä ongelma, jonka kanssa jouduin jossain vaiheessa vähän painiskelemaan. Lyhyesti: Tarkoituksena oli laskea kuntakohtaisesti terveydenhuoltomenoihin liittyvää taloudellista riskiä. Käytettävissä oli yksilökohtaista aineistoa siten, että jokaisen sairaalassa olleen potilaan koko vuoden aikana kertyneet hoitokustannukset olivat tiedossa. Näin ollen yhden kunnan hoitokustannukset voitiin esittää summana S=x1+x2+...+xn, jossa x1, x2, ..., xn ovat potilaiden kustannuksia ja n on potilaiden määrä ko. kunnassa. Olettamalla x1, x2, ..., xn olevan riippumattomia ja samoin jakautuneita satunnaismuuttujia ja n olevan ei-negatiivinen kokonaislukuarvoinen satunnaismuuttuja saadaan kokonaiskustannusten jakauma suoraan vastaavan satunnaissumman jakaumana. Kiinnittamällä x ja n jakaumat pystyy satunnaissumman jakauman ainakin erikoistapauksissa laskemaan suljetussa muodossa esim. konvoluutioita käyttäen. Valitettavasti jakauma tulee usein erittäin monimutkaiseksi ja onkin järkevämpää pyrkiä approksimoimaan jakaumaa jotenkin. 1) Panjer-rekursio Pienen pähkäilyn jälkeen törmäsin tekniikkaan, joka tunnetaan nimellä Panjerin rekursio. Sitä käyttämällä on mahdollista määrätä satunnaisumman jakauma numeerisesti muutamille n jakaumille. Ko. tilanteessa oli järkevä olettaa n olevan binomijakautunut, joten Panjer rekursio vaikutti periaatteessa käyttökelpoiselta ja implementoin sen omaan käyttöön sopivaksi Survo-moduliksi. Tässä vaiheessa tuli laskutarkkuus vastaan. Väestörikkailla kunnilla rekursio ei lähtenyt pyörimään, sillä alkuarvo pyöristyi väkisin nollaan. Ratkaisuksi löytyi lopulta ns. Waldmanin layerointi, jossa rekursiota pyöritettiin useamman kerran laskutarkkuuden salliman alueen yli ja jokaisen "vaihdon" yhteydessä skaalattiin rekursion tarvitsemat arvot sopivasti. Onnistuin sisällyttämään tämänkin kikkailun moduliini ja sain estimoitua tarvitsemani jakaumat. 2) Bootstrap Periaatteessa parametriset jakaumaoletukset voivat olla liian rajoittavia. Vaikka Panjer-rekursiolla voisikin varsin helposti laskea numeerisesti mielivaltaisten x jakaumien satunnaisummat muutamalle n jakaumalle (binomi, poisson, geometrinen, negatiivinen binomi) oli houkutteleva ajatus irtautua näistä oletuksista. Ratkaisuksi tuli bootstrap-simulointi, jossa kustannusjakaumasta lisättynä ei-palveluja käyttäneiden nollakustannuksilla (atomi nollaan) otettiin replikaatteja. Tämä oli varsin helppo ohjelmoida tehokkaaksi moduliksi. Vähän miettimällä on helppo nähdä, että em. bootstrapissä n osoittautuu itse asiassa binomijakautuneeksi ja näin ollen sekä binomijakauma-Panjer-rekursio ja bootstrap johtavat yhteneviin tuloksiin. 3) Normaaliapproksimaatio Kokonaisumman termien satunnaisesta määrästä johtuen keskeinen raja-arvolause ei ole suoraan sovellettavissa, mutta silti oli houkutteleva ajatus kokeilla normaaliapproksimaatiota, sillä ehdollisten odotusarvoja käyttämällä saadaan helposti laskettua E(S)=E(N)E(X) ja var(S)=E(N)var(X)+var(N)[E(X)]^2. Kokeilujen perusteella approksimaatio oli hämmästyttävän hyvä jo pienillä n:illä (esim. tuhannen asukkaan kunta). Tämä oli sinänsä vähän pettymys, sillä niin Panjer-rekursion kuin bootstrapinkin implementointi vaati jonkun verran työtä. En nyt oikein tiedä, mikä viestini pointti oikein oli, mutta ehkäpä tämä menee jonkinmoisena kuvauksena tilanteesta, jossa Survo jälleen kerran osoittautui loistavaksi käyttöympäristöksi tilastolliseen tietojenkäsittelyyn :). Jos Panjer-rekursio tai bootstrap modulit kiinnostavat, niin ne saa minulta pyytämällä (eivät todellakaan ole käyttäjäystävällisiä ;) ). Lisätietoa aiheesta myös seuraavissa jutuissa: Mikkola, Hennamari & Sund, Reijo & Linna, Miika & Häkkinen, Unto (2002): Comparing the financial risk of bed-day and DRG based pricing types using parametric and simulation methods. Health Care Management Science (accepted). Sund, Reijo (2002): Parametric and non-parametric techniques for the modelling of financial risk in the public health care system (working paper).
Vastaukset: |
---|
Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!