Enkelt slumpmässigt urval: Analys (2023)

Den här lektionen beskriver hur man uppskattar ett populationsmedelvärde eller andel, givet undersökningsdata från ett enkelt slumpmässigt urval. En bra analys bör ge två utgångar:

  • Apunktuppskattningav befolkningens medelvärde eller andel.
  • Ett kvantitativt mått på osäkerhet i samband med punktuppskattningen (t.ex. enmarginal eller feloch/eller akonfidensintervall).

Först beskriver vi hur man gör en bra analys steg för steg. Sedan kommer vi att illustrera analysen med ett exempelproblem.

Hur man analyserar undersökningsdata

Varje bra analys av undersökningsprovdata inkluderar samma sju steg:

  • Uppskatta en populationsparameter.
  • Uppskatta populationsvarians.
  • Beräkna standardfel.
  • Ange en konfidensnivå.
  • Hitta det kritiska värdet (ofta en z-poäng eller en t-poäng).
  • Beräkna felmarginal.
  • Definiera konfidensintervall.

Låt oss titta lite närmare på varje steg - vad vi gör i varje steg och varför vi gör det. När du förstår vad som verkligen pågår blir det lättare för dig att tillämpa formler korrekt och att tolka analytiska fynd.

Notera:Formlerna nedan är endast lämpliga för enkla slumpmässiga urval.

Uppskattning av ett befolkningsmedelvärde eller -andel

Det första steget i analysen är att utveckla enpunktuppskattningför befolkningens medelvärde eller andel. Använd denna formel för att uppskatta populationens medelvärde:

Exempelmedelvärde =x= Σx/n

där Σx är summan av alla provobservationer och n är antalet provobservationer.

En proportion är ett specialfall av medelvärdet. Det representerar antalet observationer som har ett visst attribut dividerat med det totala antalet observationer i gruppen. Använd denna formel för att uppskatta befolkningens andel:

(Video) Slumpmässigt urval och punktskattning

p = Provobservationer med attribut
Total provstorlek (n)

Eftersom olika prover kan ge olika punktuppskattningar kan du vara ganska säker på att uppskattningen från ditt prov gör detinteexakt lika med det sanna värdet av populationsparametern.

Därför behöver du ett sätt att uttrycka den osäkerhet som är inneboende i din uppskattning. De återstående sex stegen i analysen är inriktade på att kvantifiera osäkerheten i din uppskattning.

Uppskattning av befolkningsvarians

Devariationär ett numeriskt värde som används för att mäta variationen av observationer i en grupp. Om enskilda observationer skiljer sig mycket från gruppmedelvärdet är variansen stor; och vice versa.

Givet ett enkelt slumpmässigt urval är den bästa uppskattningen av populationsvariansen:

s2= Σ ( xi-x)2/ ( n - 1 )

vars2är ett urvalsuppskattning av populationsvarians,xär provmedelvärdet, xiärielement från provet, och n är antalet element i provet.

Med en proportion kan populationsvariansen uppskattas från ett urval som:

s2= [ n / (n - 1) ] * p * (1 - p)

vars2är en provuppskattning av populationsvarians, p är en stickprovsuppskattning av populationsandelen och n är antalet element i urvalet.

Varför bryr vi oss om befolkningsvariationer? Variansen behövs för att beräkna standardfelet. Och varför bryr vi oss om standardfelet? Läs vidare.

Beräkningsstandardfel

Destandard felär kanske det viktigaste resultatet från vår analys. Det tillåter oss att beräknafelmarginaloch denkonfidensintervall.

När vi uppskattar ett medelvärde eller en andel från ett enkelt slumpmässigt urval, är standardfelet (SE) för skattningen:

SE = sqrt [ (1 - n/N) *s2/ n ]

(Video) Urvalsmetod

där n är urvalsstorleken, N är populationsstorleken ochsär en stickprovsuppskattning av populationens standardavvikelse.

Tänk på standardfelet somstandardavvikelseav ett provstatistisk. I undersökningsurval finns det vanligtvis många olika delmängder av populationen som vi kan välja för analys. Varje olika urval kan ge en annan uppskattning av värdet av en populationsparameter. Standardfelet ger ett kvantitativt mått på variabiliteten hos dessa uppskattningar.

Specificering av konfidensnivå

Vid undersökningsurval kan olika urval väljas slumpmässigt från samma population; och varje prov kan ofta producera olikakonfidensintervall. Vissa konfidensintervall inkluderar den sanna populationsparametern; andra gör det inte.

En konfidensnivå avser procentandelen av alla möjliga urval som ger konfidensintervall som inkluderar den sanna populationsparametern. Anta till exempel att alla möjliga urval valdes från samma population och att ett konfidensintervall beräknades för varje urval. En konfidensnivå på 95 % innebär att 95 % av konfidensintervallen skulle innehålla den sanna populationsparametern.

Som en del av analysen väljer undersökningsforskare en konfidensnivå. Förmodligen är den vanligaste konfidensnivån 95 %.

Att hitta kritiskt värde

Ofta uttryckt som ent-poängeller az-poäng, är det kritiska värdet en faktor som används för att beräkna felmarginalen. Följ dessa steg för att hitta det kritiska värdet:

  • Beräkna alfa (α): α = 1 - (konfidensnivå / 100)
  • Hitta den kritiska sannolikheten (p*): p* = 1 - α/2
  • För att uttrycka det kritiska värdet som en z-poäng, hitta z-poängen med akumulativ sannolikhetlika med den kritiska sannolikheten (p*).
  • För att uttrycka det kritiska värdet som en t-statistik, följ dessa steg:
    • Hittagrader av frihet(df). När du uppskattar ett medelvärde eller en andel från ett enkelt slumpmässigt urval är frihetsgrader lika med urvalsstorleken minus ett.
    • Den kritiska t-statistiken (t*) är den t-statistik som har frihetsgrader lika med df och enkumulativ sannolikhetlika med den kritiska sannolikheten (p*).

Forskare använder ett t-poäng när urvalsstorleken är liten; en z-poäng när den är stor (minst 30). Du kan användaNormalfördelningskalkylatorför att hitta den kritiska z-poängen ocht Distributionsräknareför att hitta den kritiska t-statistiken.

Beräkningsfelmarginal

Defelmarginaluttrycker den maximala förväntade skillnaden mellan den sanna populationsparametern och en provuppskattning av den parametern.

Här är formeln för beräkning av felmarginal (ME):

ME = SE * CV

där SE är standardfel och CV är det kritiska värdet.

Definiera konfidensintervall

Statistiker använder ett konfidensintervall för att uttrycka graden av osäkerhet som är förknippad med en provstatistik. Ett konfidensintervall är ettintervalluppskattningkombinerat med en sannolikhetsangivelse.

Så här beräknar du minimi- och maximivärdena för ett konfidensintervall.

(Video) The new era of positive psychology | Martin Seligman

Betyda Andel

CImin=x- SE * CV

CImax=x+ SE * CV

CImin= p - SE * CV

CImax= p + SE * CV

I tabellen ovan,xär provuppskattningen av populationsmedelvärdet, p är provuppskattningen av populationsandelen, SE är standardfelet och CV är det kritiska värdet (antingen en z-poäng eller en t-poäng). Och konfidensintervallet är en intervalluppskattning som sträcker sig mellan CIminoch CImax.

Provproblem

Det här avsnittet presenterar ett provproblem som illustrerar hur man analyserar undersökningsdata när urvalsmetoden är enkel slumpmässig urval, och parametern av intresse är ett medelvärde. (I enefterföljande lektion, går vi igenom det här problemet igen och ser hur enkelt slumpmässigt urval kan jämföras med andra urvalsmetoder.)

Kalkylator för provstorlek

Analysen av data som samlats in via enkel stickprovstagning kan vara komplex och tidskrävande. Stat Treks provstorlekskalkylator kan hjälpa till. Kalkylatorn beräknar standardfel, felmarginal och konfidensintervall. Den bedömer krav på urvalsstorlek, uppskattar populationsparametrar och testar hypoteser. Kalkylatorn är gratis. Du hittar provstorlekskalkylatorn i Stat Treks huvudmeny under fliken Stat Tools. Eller så kan du trycka på knappen nedan.

Kalkylator för provstorlek

Problem 1

I slutet av varje läsår administrerar staten ett läsprov till ett enkelt slumpmässigt urval som dras utan ersättning från en befolkning på 20 000 tredjeklassare. I år gjordes testet till 36 elever som valts ut via ett enkelt slumpmässigt urval. Testresultatet från varje provad student visas nedan:

50, 55, 60, 62, 62, 65, 67, 67, 70, 70, 70, 70, 72, 72, 73, 73, 75, 75,
75, 78, 78, 78, 78, 80, 80, 80, 82, 82, 85, 85, 85, 88, 88, 90, 90, 90

Med hjälp av urvalsdata uppskattar du den genomsnittliga läsprestationsnivån i populationen. Hittafelmarginaloch denkonfidensintervall. Antag 95 %självförtroendenivå.

Lösning:För att lösa detta problem följer vi den sjustegsprocess som beskrivs ovan.

  • Beräkna befolkningsmedelvärdet. Eftersom vi försöker uppskatta ett populationsmedelvärde väljer vi urvalsmedelvärdet som urvalsstatistik. Provmedelvärdet är:

    x= Σ (xi) / n

    x= ( 50 + 55 + 60 + ... + 90 + 90 + 90 ) / 36 = 75

    Baserat på data från det enkla slumpmässiga urvalet uppskattar vi därför att den genomsnittliga läsprestationsnivån i populationen är lika med 75.
  • Uppskatta populationsvarians. Vi måste uppskatta populationsvariansen nu, så att vi kan beräkna standardfelet i nästa steg.

    s2= Σ ( xi-x)2/ ( n - 1 )

    (Video) On the traces of an Ancient Civilization? 🗿 What if we have been mistaken on our past?

    s2= [ (50 - 75)2+ (55 - 75)2+ (60 - 75)2+ ... + (90 - 75)2+ (90 - 75)2] / 35 = 98,97

  • Beräkna standardfel. Standardfelet mäter variabiliteten i vår urvalsuppskattning av populationsmedelvärdet. Vi kommer att använda standardfel för att beräkna felmarginalen och för att definiera en konfidensnivå.

    SE = sqrt [ (1 - n/N) *s2/ n ]

    SE = sqrt [ ( 1 - 36/20 000 ) * 98,97 / 36 ]

    SE = sqrt [ ( 0,998 ) * 98,97 / 36 ] = 1,66

  • Välj en konfidensnivå. I denna analys definieras konfidensnivån för oss i problemet. Vi arbetar med en 95% konfidensnivå.
  • Hitta det kritiska värdet. Det kritiska värdet är en faktor som används för att beräkna felmarginalen. För att hitta det kritiska värdet tar vi dessa steg.
    • Beräkna alfa (α):

      α = 1 - (konfidensnivå / 100)

      a = 1 - 95/100 = 0,05

    • Hitta den kritiska sannolikheten (p*):

      p* = 1 - α/2 = 1 - 0,05/2 = 0,975

    • Eftersom urvalsstorleken (n = 36) är större än 30, kan vi uttrycka det kritiska värdet som en z-poäng. Det kritiska värdet är z-poängen med akumulativ sannolikhetlika med 0,975. FrånNormalfördelningskalkylator, finner vi att det kritiska värdet är cirka 1,96.

Enkelt slumpmässigt urval: Analys (1)

  • Beräkna felmarginalen (ME):

    ME = kritiskt värde * standardfel

    ME = 1,96 * 1,66 = 3,25

  • Ange konfidensintervall. Minsta och högsta värden för konfidensintervallet är:

    CImin=x- SE * CV = 75 - 1,66 * 1,96 = 71,75

    CImax=x+ SE * CV = 75 + 1,66 * 1,96 = 78,25

Sammanfattningsvis, här är resultaten av vår analys. Baserat på urvalsdata uppskattar vi att populationsmedelvärdet är 75. Givet en konfidensnivå på 95 % är felmarginalen runt den skattningen 3,25; och 95 % konfidensintervall är 71,75 till 78,25.

(Video) Semistrukturerad intervju, kvalitativ metod, renskriva/transkribera, intervjuguide/-mall

Sista lektionen Nästa lektion

Videos

1. Nicholas Christakis: How social networks predict epidemics
(TED)
2. The Scientific Truth of Psychic Phenomena w/ Dean Radin: Twitter Precognition, Spoon Bending, & more
(Unravelling the Universe)
3. Are we wrong about Evolution?
(See the Pattern)
4. Statistical Plotting with Matplotlib!
(Adrian Dolinay)
5. Excel Random Date or Random Date and Time - 2524
(MrExcel.com)
6. STRATEGO Strategy Guide
(Legendary Tactics)
Top Articles
Latest Posts
Article information

Author: Mrs. Angelic Larkin

Last Updated: 14/10/2023

Views: 5653

Rating: 4.7 / 5 (47 voted)

Reviews: 86% of readers found this page helpful

Author information

Name: Mrs. Angelic Larkin

Birthday: 1992-06-28

Address: Apt. 413 8275 Mueller Overpass, South Magnolia, IA 99527-6023

Phone: +6824704719725

Job: District Real-Estate Facilitator

Hobby: Letterboxing, Vacation, Poi, Homebrewing, Mountain biking, Slacklining, Cabaret

Introduction: My name is Mrs. Angelic Larkin, I am a cute, charming, funny, determined, inexpensive, joyous, cheerful person who loves writing and wants to share my knowledge and understanding with you.