Sociologiskforum.dk var aktivt fra 2004-2012, men eksisterer i dag kun som arkiv.

Korrektion ved stikprøveudtag fra små populationer

Skrevet d. 25.08.2008 af Niels M
Normalt når man gennemfører stikprøvebaserede undersøgelser plejer man at ignorere populationens størrelse. Men gælder det også når ens stikprøve udgør en betydelig del af populationen? Jeg kan se at man flere steder anbefaler at når ens stikprøve udgør mere end 5-10% af populationen, skal man korrigere sine resultater med "the finite population correction factor" givet ved sqrt((N-n)/(N-1)). Dvs. at man finder flere signifikante sammenhænge end man ellers ville have gjort, får smallere kofidensintervaller osv.

Er der nogen der ved noget mere on hvad begrundelsen er for at gøre det? Jeg har set forklaringen et sted er at formlen for standardfejlen sådan som den er gengivet i Agresti & Finaly er under forudsætning af en population af uendelig størrelse (selvom det ikke står der). Et sted har jeg set det forklaret lidt mere folkeligt ved at man ved en nærmest uendelig population ikke får kendskab til særlig meget af populationen ved at trække en stikprøve på 1000 individer. Det gør man derimod hvis populationen er 1500 individer. "The finite population correction factor" er dermed en korrektion for hvor meget ekstra information vi opnår fordi vi har spurgt en stor del af populationen.

Er det rigtigt at korrigere? Og hvis ja, er der nogen der ved noget mere om hvorfor? Det forekommer mig at der store muligheder i at kunne trække stikprøver i stedet for spørge alle, selv når populationen er meget lille. Folk gider jo kun at besvare et vist antal spørgeskemaer.

Endelig er der nogen der ved hvordan man gøre det på en nem måde i SPSS f.eks. i forbindelse med chi-square test?
Skrevet d. 27.08.2008 af Sørland
Ved en uendelig population ændres sandsynligheden ikke af de foregående træk. Tænk f.ex. på en population med lige mange mænd og kvinder. Sandsynligheden for at udvælge to kvinder tilfældigt fra en uendelig population er 1/2*1/2. Men hvis populationen er på 4 personer, er sandsynligheden for at den først valgte er en kvinde 1/2, men derefter er der kun 3 tilbage hvoraf en er kvinde, så sandsynligheden for at vælge kvinden er 1/3, og den kombinerede sandsynlighed bliver 1/2*1/3. Dette gælder selvfølgelig kun, hvis hver person kun kan vælges en gang (uden `tilbagelægning`).
Det korrektionsled, du anfører gælder for variansen på stikprøvegennemsnit i en finit population. Det skal derfor ikke benyttes ved et chi-kvadrat-test.

Skrevet d. 27.08.2008 af Niels M
Kære Sørland

Tak for responsen. Det var en god forklaring.
Angående chi-square test. Den test statistic som spss spytter ud, skal vel korrigeres på anden vis? Kan det passe det er sqrt(1-n/N)

Hilsen Niels

Andre læser også

Sociologiskforum.dk benytter cookies til blandt andet statistik og marketing. Ved at benytte hjemmesiden accepterer du vores brug af cookies. Okay