Sociologiskforum.dk var aktivt fra 2004-2012, men eksisterer i dag kun som arkiv.

Vægtning og logistisk regression

Skrevet d. 30.04.2009 af Smj
Er der nogen, der kan hjælpe mig med at udrede, hvad problemerne kan være ved at have en vægtvariabel `slået til` i SPSS, når der udføres logistisk regression?
Skrevet d. 30.04.2009 af KristianKarlson
Hej,

Jeg kunne først godt tænke mig at høre, hvad du selv synes problemet kunne være? Jeg tænker, at det ikke umiddelbart er et problem, men da jeg ikke ved, hvad problemet består i, er det selvfølgelig svært at svare direkte på.

Hvad er formålet med vægten? At opvægte en stratificeret stikprøve?

vh Kristian
Skrevet d. 01.05.2009 af Smj
Hej,

Tak for svaret.

Ja, det var vist en lidt hurtig beskrivelse... Her kommer lidt mere: Jeg arbejder med et datasæt på lidt over 2000 respondenter og jeg har udarbejdet en samlet vægtvariabel for skoletype og alder for at opveje en oversampling af bestemte aldersgrupper og bestemte skoletyper.

Jeg har ladet mig fortælle, at det naturligvis er vigtigt at anvende vægten i den deskriptive analyse, men at der kan være problemer i forhold til pålideligheden af odds-ratio og sikkerhedsintervaller for disse, hvis vægten er slået til, når der udføres logistisk regression. Jeg har forsøgt at finde noget uddybende materiale omkring disse mulige problematikker, men det er ikke lykkes mig endnu... Som det også tidligere har været oppe herinde, er der jo argumenter for og imod vægtning, men jeg kunne godt tænke mig at vide noget mere om argumenter mod vægtning i en regression.
Skrevet d. 01.05.2009 af KristianKarlson
Hej,

Argumentet for er, at du får en repræsentativ stikprøve, [i]givet[/i] du vægter med de korrekte forhold. Hvis din stikprøve således er "skæv" i forhold til nogle grupper i populationen (og du har oplysninger om populationsfordelingen af disse), så er det en god idé at vægte sine data. Problemet er blot, at hvis du ikke har alle de forhold, som er med til at gøre stikprøven skæv, så er der intet du kan gøre. Det er sådan set argumentet imod brugen af vægte (dvs. at du skal have god grund til at der ikke er andre forhold, der gør din stikprøve skæv).

Men hvis du har en idé om, at der er en oversampling af særlige aldersgrupper og skoletyper, så er det helt fint at vægte data for at tage højde for dette. Overvej således her, om der er andre forhold, som du ikke har information om - fx mere subjektive faktorer som tilbøjeligheden til at deltage i en survey-undersøgelse - kan have betydning for din stikprøves repræsentativitet. Hvis du har mistanke til dette, så er det en god idé at tage forbehold, men overordnet set kan man ikke gøre meget mere ved det end at tro på, at det ikke influerer resultaterne i særlig høj grad (for du har jo ikke data om disse forhold og derved er det svært at gøre noget ved det).

I forhold til de tidligere diskussioner herinde om vægtning, så går det mere specifikt på konsulentbureauernes blinde brug af vægte i forhold til diverse meningsmålinger. Bare fordi man vægter med hensyn til alder og køn har man ikke nødvendigvis et retvisende billede. Fx er uddannelse og indkomst og sikkert også andre mere subjektive forhold vigtige for at kunne danne en repræsentativ stikprøve. Kritikken af konsulentbureauerne er altså fuldt ud berettiget, men behøver ikke nødvendigvis at gælde for din undersøgelse – det ved kun du ;)

I forhold til regression: Regression er i virkeligheden bare en "vægtning" af gennemsnit ud fra princippet om mindste kvadraters metode. Derfor kan man sige, at en vægtning af data helt basalt er en korrektion til de "beta-vægte", som regressionen arbejder med. Så man kan forstå "implikationerne" af vægtning af sine data som en - i hvert fald for regressionsanalysens vedkommende - korrektion af koefficienterne.

I forhold til logistisk regression kan problemet ligge i - sådan som jeg lige kan gennemskue det - at såfremt din binære 0/1-variabel bliver vægtet, så antager den (for nogle grupper) værdier, der hverken er 0 eller 1. Men jeg er lidt i tvivl om det. Måske applicerer den vægten [i]efter[/i] den har kørt regressionen, dvs. på parameterestimaterne (= ”beta-vægtene”) og ikke på data før man kører regressionen. Det må du kunne finde i SPSS et sted - ellers skriv til dem. Det vil i hvert fald give mening for mig, hvis de gjorde det efter. Logistisk regression estimerer jo - i transformeret form - betingede sandsynligheder for en given tilstand. Derfor må vægtene også kunne appliceres der som en korrektion til de betingede sandsynligheder.

I forhold til de vægtede frekvenser i din deskriptive analyse, så er det sådan, at de altid vil se sære ud - men det har du nok allerede regnet ud. Man kan eventuelt runde dem ned, så de ikke har nogen decimaler; så bliver læseren ikke så hurtigt mistænkelig ;)

Sidst vil jeg sige, at du skal se på, hvordan resultaterne fra din regression ændrer sig, når du har vægten slået hhv. til og fra. Er der ikke store forskelle, så drop vægten! Den skal kun med, hvis det ændrer resultaterne i ”signifikant grad” – eller i en sådan grad, at du vurderer, at det vil være forkert ikke at have vægten med.

Håber det giver lidt klarhed.

mvh Kristian
Skrevet d. 01.05.2009 af Mads_Jaeger
Hej Kristian

Godt svar. Så vidt jeg ved implicerer vægtning i logitisk regression bare, at hver observation bidrager forskelligt (= vægtet) til den samlede likelihood [der finder modellens parametre]. Dvs. der ganges en vægt på i likelihoodfunktionen.

Mads
Skrevet d. 01.05.2009 af KristianKarlson
Hej Mads,

Ja, sådan havde jeg ikke tænkt det. Det er jo netop de betingede sandsynligheder i likelihoodfunktionen, vi har interesse i - så giver det hele jo mening ;)

Håber ikke det bliver for sort med likelihood-snak, smj. Men Mads må have ret - det er der vægtningen sker.

- Kristian
Skrevet d. 04.05.2009 af Smj
Hej Mads og Kristian

Tusind tak for svarene. Jeg vil arbejde videre med logistisk regression, både med og uden vægt og vurdere forskellene nærmere op imod hinanden.

Mvh. Sara.

Andre læser også

Sociologiskforum.dk benytter cookies til blandt andet statistik og marketing. Ved at benytte hjemmesiden accepterer du vores brug af cookies. Okay