Sociologiskforum.dk var aktivt fra 2004-2012, men eksisterer i dag kun som arkiv.
annonce

Median Odds Ratio i logistisk multilevel regression

Skrevet d. 09.09.2007 af KristianKarlson
Til alle, der har en smule nørdet interesse for statistik

I logistiske multilevelmodeller kan det være svært at få et udtryk for andelen af level-2-variation (i forhold til den samlede variation). I lineære modeller anvender man typisk Intra Class Correlation (ICC), men da residualerne opfører sig noget anderledes i logistisk regression, giver ICC ikke meget mening. Level-1-variationen er svær at sætte på formel, og dermed er det svært at angive, hvor stor en del af den samlede variation, level-2-variationen udgør. Imidlertid er der nogen, der har sat sig ned og tænkt over det her problem (Larsen & Merlo 2005).

Løsningen har den lidt sjove forkortelse MOR, der står for Median Odds Ratio, som er en måde at kvantificere level-2-heterogeniteten på (2005:82):

[i]The MOR quantifies the variation between clusters (the second-level variation) by comparing two persons from two randomly chosen, different clusters. Consider two persons with the same covariates, chosen randomly from two different clusters. The MOR is the median odds ratio between the person of higher propensity and the person of lower propensity.[/i]

Og så er MOR nem at regne ud:

exp( kvrod(2*level-2-varians) * inverse kumulative standardnormalfordelingsfunktion(0,75) )

Bemærk her, at der ligger antagelser om en normalfordelt level-2-restled. Se i øvrigt artiklen neden for, hvis man gerne vil have en pænere formel. De to forfattere udforsker også en måde at afrapportere random koefficienter i logistisk multilevel regression.


Reference
Larsen, K & J Merlo 2005: “Appropriate Assessment of Neighborhood Effects on Individual Health: Integrating Random and Fixed Effects in Multilevel Logistic Regression”, in: American Journal of Epidemiology, vol. 161, (1).
Skrevet d. 09.09.2007 af KristianKarlson
Og så skal det lige siges, at høje MOR selvfølgelig betyder, at der er noget level-2-variation at komme efter. Det følger af den simple grund, at en level-2-varians på 0 giver MOR=1.

vh Kristian
Skrevet d. 09.09.2007 af Mads_Jaeger
Hej Kristian

Spændende! Gælder udregningsmetoden også for ordinale variable (her bliver odds-betragtningen lige mere funky)? En bette kommentar: Jeg ved ikke om man kan sige, at residualerne i den logistiske regression opfører sig "mærkeligt". Residualvariation (level-1) i den logistiske regression er nem at sætte på formel, for den er per definition phi2/3. I probit`en er den 1. Derfor er det nemt nok at udregne ICC i multilevel logistiske og probitmodeller.

Mvh.

Mads
Skrevet d. 10.09.2007 af KristianKarlson
Lyder godt. Gælder ikke ordniale variable, så vidt jeg har forstået. Og jeg må kigge nærmere på ICC i logistisk og probitmodellerne ;)

mvh Kristian
Skrevet d. 10.09.2007 af KristianKarlson
Jeg har nu fået fat i en glimrende artikel, der kaster endnu klarere lys over det med ICC og logistiske modeller (se ref`en nedenfor). Den giver et indtryk af, at ICC er svær at tolke på inden for en logistisk ramme. Det skyldes, at de udregningsmetoder, der er for ICC i logistisk regression, i virkeligheden baserer sig på den forståelse af ICC, man har i lineær regression. Artiklen viser også, hvorfor MOR lige er sagen. Herudov er teksten nem at gå til, hvis man bare har lidt kendskab til multilevel analyse.

Ref:
Merlo, J et al. 2006: "A brief conceptual tutorial of multilevel analysis in social epidemiology: using measures of clustering in multilevel logistic regression to investigate contextual phenomena", in: J. Epidemiol. Community Health, 60: 290-297.

vh Kristian

Andre læser også

annonce
Sociologiskforum.dk benytter cookies til blandt andet statistik og marketing. Ved at benytte hjemmesiden accepterer du vores brug af cookies. Okay