Ikke-stikprøve data
Er der nogen, der kan hjælpe mig med, hvad man (officielt) vil kalde data, som dækker hele populationen, og altså ikke er en stikprøve?
Jeg har forsøgt at finde noget på nettet, men ved ikke helt, hvad jeg skal søge efter.
En af de ting, jeg leder efter svar på, er hele test-forestillingen i forhold til `populations-data` (eller hvad det så hedder?).
Jeg har lagt mærke til, at der ofte udføres signifikanstest på fundne forskelle i data - selv om data ikke er en stikprøve. Giver det mening?
En signifikanstest på forskellen mellem - lad os sige to middelværdier - er vel en måde at sansynliggøre, at den forskel man finder i data og findes i populationen. Har man hele populationen, betyder alle (*)stjernerne i en tabel vel i grunden ingen ting - selvom de ser pæne ud?
mvh
Jacob
Jeg har forsøgt at finde noget på nettet, men ved ikke helt, hvad jeg skal søge efter.
En af de ting, jeg leder efter svar på, er hele test-forestillingen i forhold til `populations-data` (eller hvad det så hedder?).
Jeg har lagt mærke til, at der ofte udføres signifikanstest på fundne forskelle i data - selv om data ikke er en stikprøve. Giver det mening?
En signifikanstest på forskellen mellem - lad os sige to middelværdier - er vel en måde at sansynliggøre, at den forskel man finder i data og findes i populationen. Har man hele populationen, betyder alle (*)stjernerne i en tabel vel i grunden ingen ting - selvom de ser pæne ud?
mvh
Jacob
Hej Jacob,
Jeg har netop siddet med samme problem på engelsk. Jeg kaldte det "data covering the full population" (hvor population er veldefineret). Måske kan man gøre noget lignende på dansk (data der dækker hele populationen). Hvis du skal bruge termen mange gange i dit arbejde, kan du måske kalde det populationsdata.
Det med tests på populationsdata er noget pudsigt noget. Der er nogle, der antager, at der findes en "superpopulation", som din population er trukket fra. Superpopulationen er "sand", mens din population indeholder målefejl og andre usikkerheder. Derfor tester man med *. Testen tager højde for disse usikkerheder. Jeg er ikke grundigt inde i det med superpopulationer, så jeg håber, at jeg ikke er helt off the mark.
En sidste ting jeg vil bemærke: Hvis du har rigtig mange data, så vil standardfejlene altid blive meget, meget små, og alt vil blive signifikant (det gælder også meget store stikprøver - det handler om størrelsen på N). I de tilfælde er det en god ide at skelne mellem signifikans og effekt (man kan hævde, at det bør man altid gøre - for en sammenhæng kan nemt være højsignifikant og så samtidig være meget lille). Hvis du fx finder, at alle effekter er signifikante, så kan du prøve at standardisere alle dine forklarende variable - i så fald vil effekterne af disse variable på din afhængige variabel kunne sammenlignes. Så kan du udtale dig om størrelsen af effekter (og måske bekymre dig mindre om størrelsen af signifikanssandsynligheden). Men det er bare et forslag.
mvh Kristian
PS: Jeg har ikke prøvet, men måske en omgang google på "superpopulation population inference" vil returnere noget interessant...
Jeg har netop siddet med samme problem på engelsk. Jeg kaldte det "data covering the full population" (hvor population er veldefineret). Måske kan man gøre noget lignende på dansk (data der dækker hele populationen). Hvis du skal bruge termen mange gange i dit arbejde, kan du måske kalde det populationsdata.
Det med tests på populationsdata er noget pudsigt noget. Der er nogle, der antager, at der findes en "superpopulation", som din population er trukket fra. Superpopulationen er "sand", mens din population indeholder målefejl og andre usikkerheder. Derfor tester man med *. Testen tager højde for disse usikkerheder. Jeg er ikke grundigt inde i det med superpopulationer, så jeg håber, at jeg ikke er helt off the mark.
En sidste ting jeg vil bemærke: Hvis du har rigtig mange data, så vil standardfejlene altid blive meget, meget små, og alt vil blive signifikant (det gælder også meget store stikprøver - det handler om størrelsen på N). I de tilfælde er det en god ide at skelne mellem signifikans og effekt (man kan hævde, at det bør man altid gøre - for en sammenhæng kan nemt være højsignifikant og så samtidig være meget lille). Hvis du fx finder, at alle effekter er signifikante, så kan du prøve at standardisere alle dine forklarende variable - i så fald vil effekterne af disse variable på din afhængige variabel kunne sammenlignes. Så kan du udtale dig om størrelsen af effekter (og måske bekymre dig mindre om størrelsen af signifikanssandsynligheden). Men det er bare et forslag.
mvh Kristian
PS: Jeg har ikke prøvet, men måske en omgang google på "superpopulation population inference" vil returnere noget interessant...
Man foretager ikke bare statistiske tests med henblik på stikprøvens usikkerhed, men også med henblik på tilfældige målefejl,. For eksempel testede en af de klassiske statistikere (Gauss?) en række målinger af afstanden til månen. Den samme måne.
Andre læser også
- Perspektivering og konklusion
- Fænomenologisk metode/hermeneutisk fortolkning
- Definition af kontingens
- Svag paternalisme
- Abduktion
- Habermas` teori om system og livsverden
- Generaliserbarhed ved kvalitativ metode?
- Bourdieu - Foucault; Forskel eller lighed
- Magt og viden(foucault)
- Socialkonstruktionisme versus socialkonstruktivisme
- Socialkonstruktivistisk /hermeneutisk
- Metaperspektiv?
- Hvem kender til makro- meso- og mikro begreberne?
- Deduktiv vs. induktiv
- Foucault, subjektivering/objektivering
- Ordet "perspektivering" på engelsk?
- Foucaults diskursanalyse - i en simpel udgave?
- Har jeg forstået Luhmann korrekt???
- Socialkonstruktivisme
- Forskel på paradigme og diskurs
- Moral og etik - en begrebsafklaring.
- Kritisk realisme vs. realism
- HJÆLP!!! jeg fatter ikke felt og doxa
- Sammenhæng mellem kapital og habitus
- Governmentality
- Viden - ud fra en ontologisk og epistemologisk dimension