Esta lección describe cómo apreciar una suma de la población, dados los datos de la encuesta de una simple selección aleatoria.Un buen análisis debe dar dos salidas:
- Apunto estimadode la población total.
- Una medida cuantitativa de incertidumbre en relación con la estimación de puntos (por ejemplomarginal o arribay/o unintervalo de confianza).
Primero describimos cómo hacer un buen análisis paso a paso.Luego ilustraremos el análisis con un problema de ejemplo.
Cómo analizar los datos de la encuesta
Cada buen análisis de los datos de la prueba de encuesta incluye los mismos siete pasos:
- Aprecie un parámetro de población (en este caso la suma de la población).
- Apreciar la varianza de la población.
- Calcule los errores estándar.
- Ang un nivel de confianza.
- Encuentre el valor crítico (a menudo un puntaje Z o una puntuación T).
- Calcule el margen de error.
- Definir intervalos de confianza.
Echemos un vistazo más de cerca a cada paso: lo que hacemos en cada paso y por qué lo hacemos.Cuando comprende lo que realmente está sucediendo, se vuelve más fácil aplicar fórmulas correctamente e interpretar los hallazgos analíticos.
Usar:Las fórmulas a continuación solo son adecuadas para una selección aleatoria simple.
Estimación de una suma de población
El objetivo principal del análisis es desarrollar unopunto estimadopara la población total.Antes de que podamos lograr este objetivo, debemos estimar el valor de la población o la participación de la población.
El promedio de la selección es una estimación imparcial del promedio de la población:
Promedio de muestra =X= Σx/n
Donde σx es la suma de todas las observaciones de prueba y N es el número de observaciones de prueba.
Una vez que conocemos el promedio de la selección, podemos estimar la suma de la población (t) de la siguiente fórmula:
Población totalt = t = nX
donde n es el número de observaciones en la población, yXes el promedio de la prueba.
Una proporción es un caso especial de la media.Representa el número de observaciones que tienen un cierto atributo dividido por el número total de observaciones en el grupo.Para estimar una participación de la población (P), use esta fórmula para la prueba compartida (P):
P = | Observaciones de muestra con atributos Tamaño total de la muestra (N) |
Una vez que conocemos la selección compartida, podemos estimar una suma de población:
Población totalt = t = n * sid
Cuando T es una estimación del número de elementos en la población que tiene un atributo específico, n es el número de observaciones en la población y P es la participación de selección.
Ya sea que esté utilizando un promedio de selección o una proporción de selección para estimar una suma de población, sabe que diferentes selecciones pueden proporcionar diferentes estimaciones puntuales de la suma de la población.Como resultado, puede estar bastante seguro de que la estimación de su selección no corresponde exactamente a la verdadera suma de la población.
Por lo tanto, necesita una forma de expresar la incertidumbre inherente a su estimación.Los seis pasos restantes en el análisis se centran en cuantificar la incertidumbre en su estimación.
Estimación de la varianza de la población
Devariaciónes un valor numérico utilizado para medir la variación de las observaciones en un grupo.Si las observaciones individuales difieren enormemente del promedio del grupo, la varianza es grande;Y viceversa.
Cuando se usa una media para estimar una suma de población de una selección aleatoria simple, la mejor estimación de la variación de la población es:
s2= S (xi-X)2/ (N - 1)
eras2es una estimación de selección de la varianza de la población,Xes el promedio de prueba, xicepalleiElementos de la muestra, y N es el número de elementos en la muestra.
Al usar una proporción para estimar una suma de población, la variedad de población puede apreciarse de una selección como:
s2= [N / (N - 1)] * P * (1 - P)
eras2es una estimación de prueba de la varianza de la población, P es una estimación de muestra de la participación de la población y N es el número de elementos en la selección.
¿Por qué nos importan las variaciones de población?La varianza es necesaria para calcular el error estándar.¿Y por qué nos importa el error estándar?Sigue leyendo.
Error estándar de cálculo
DeFEL estándares quizás el resultado más importante de nuestro análisis.Nos permite calcularmargen de errory esointervalo de confianza.
Cuando usamos una media o proporción para estimar una suma de población de una selección aleatoria simple, el error predeterminado (ver) es para la estimación:
Son = ordenar sh n2* (1 - n/n) *s2/ N]
donde n es el tamaño de la población, n es el tamaño de selección ys2es una estimación de selección de la variedad de población.
Considere el error predeterminado queDesviación Estándarde una muestraestadísticamente.En la selección de encuestas, generalmente hay muchos subconjuntos diferentes de la población que podemos elegir para el análisis.Cada selección diferente puede proporcionar una estimación diferente del valor de un parámetro de población.El error estándar proporciona una medida cuantitativa de la variabilidad de estas estimaciones.
Especificación del nivel de confianza
Cuando se examina la selección, se puede seleccionar aleatoriamente una selección diferente de la misma población;y cada muestra a menudo puede producir diferentesintervalo de confianza.Algunos intervalos de confianza incluyen el verdadero parámetro de población;Otros no.
Un nivel de confianza se refiere al porcentaje de todas las selecciones posibles que proporcionan intervalos de confianza que incluyen el verdadero parámetro de población.Por ejemplo, suponga que se eligió toda la selección posible de la misma población y que se calculó un intervalo de confianza para cada selección.Un nivel de confianza del 95 % significa que el 95 % de los intervalos de confianza contendrían el verdadero parámetro de población.
Como parte del análisis, los investigadores de investigación eligen un nivel de confianza.Probablemente el nivel de confianza más común es el 95 %.
Para encontrar un valor crítico
A menudo expresado como unPuntos TEller tienePuntaje z, el valor crítico es un factor utilizado para calcular el margen de error.Siga estos pasos para encontrar el valor crítico:
- Cálculo alfa (α): α = 1 - (Nivel de Confianza / 100)
- Encuentre la probabilidad crítica (p*): p* = 1 - α/2
- Para expresar el valor crítico como puntaje Z, encuentre el punto Z con unprobabilidad acumuladaigual a la probabilidad crítica (p*).
- Para expresar el valor crítico como una estadística t, siga estos pasos:
- Encontrarsegrados de libertad(Df).Cuando estima un promedio o una acción de una selección aleatoria simple, el grado de libertad es igual al tamaño de selección menos uno.
- Las estadísticas de T críticas (t*) son las estadísticas t que tienen grados de libertad iguales a DF y unoprobabilidad acumuladaigual a la probabilidad crítica (p*).
Usar:Puedes usar una puntuación TOun valor z para el valor crítico.No tienes que calcular ambos.Los investigadores usan un punto T cuando el tamaño de la muestra es pequeño;una puntuación Z cuando es grande (al menos 30).Puedes usarCalculadora de distribución normalPara encontrar el punto Z crítico yT contadores de distribuciónPara encontrar el punto T crítico.
Margen de error de cálculo
Demargen de errorexpresa la diferencia máxima esperada entre el verdadero parámetro de población y una estimación de prueba del parámetro.
Aquí está la fórmula para calcular el margen de error (ME):
En = a * yo
Donde SE es errores estándar y el currículum es el valor crítico.
Definir intervalos de confianza
Las estadísticas utilizan un intervalo de confianza para expresar el grado de incertidumbre asociado con una muestra de estadísticas.Un intervalo de confianza es unoEstimación de intervalocombinado con una probabilidad que indica.
Aquí le mostramos cómo calcular los valores mínimos y máximos para un intervalo de confianza en torno a una suma de población estimada.
CIMínimo= T - e * cv
CImáximo= T + e * cv
hay CIMínimoes el valor mínimo en el intervalo de confianza, CImáximoes el valor máximo en el intervalo de confianza, t es la estimación de prueba de la suma de la población, ver el error estándar y el CV es el valor crítico (ya sea un punto z o una puntuación T).Por lo tanto, el intervalo de confianza es una estimación de intervalo que se extiende entre CIMínimoy tumáximo.
Problemas de prueba
Esta sección presenta un problema de prueba que ilustra cómo analizar los datos de la investigación cuando el método de selección es una selección aleatoria simple, y el parámetro de interés es una puntuación total.
Problema 1
En una pequeña comunidad con 100 hogares, el departamento local de control de animales realiza una encuesta de 16 casas para estimar el número de mascotas de cuatro platos (perros, gatos, cerdos, etc.) que viven en la sociedad.El departamento utiliza una selección aleatoria simple para elegir hogar para el estudio.El número de mascotas de cada casa de muestra se muestra a continuación:
0, 0, 0, 0, 0, 1, 1, 1,
1, 1, 1, 2, 2, 2, 3, 5,
Con la ayuda de los datos de muestra, puede estimar el número total de cuatro mascotas ligadas que viven en la sociedad.Encontrarmargen de errory esointervalo de confianza.Supongamos 95 %Nivel de autoconfianza.
Solución:Para resolver este problema, seguimos el proceso de siete pasos descrito anteriormente.
- Estimar la población por completo.Antes de que podamos estimar la suma de la población, primero debemos estimar el promedio de la población.como estadísticas de muestra.El promedio de la prueba es:
X= S (Xi) / n
X= (0 + 0 + 0 + ... + 2 + 3 + 5) / 16 = 20/16 = 1,25
Según los datos de la selección aleatoria simple, estimamos que el hogar promedio en la sociedad tiene 1.25 mascotas de cuatro ligas.Ahora podemos estimar el número total de cuatro mascotas con Late que:Población totalt = t = nX= 100 * 1,25 = 125
- Apreciar la varianza de la población.Debemos estimar la varianza de la población (s2) Ahora, para que podamos calcular el error estándar en el siguiente paso.
s2= S (xi-X)2/ (N - 1)
s2= [(0 - 1,25)2+ (0 - 1,25)2+ ... + (3 - 1,25)2+ (5 - 1,25)2] / 15 = 1,80
- Calcule los errores estándar.El error estándar mide la variabilidad de nuestra estimación de selección del promedio de la población.Usaremos errores predeterminados para calcular el margen de error y definir un nivel de confianza.
Son = ordenar sh n2* (1 - n/n) *s2/ N]
Es = skee shs 1002* (1 - 16/100) * 1,8 / 16]
Hijo = cuchara (10,000) * 0.84 * 0.1125
Son = siembra (682,5) = 30,
- Elija un nivel de confianza.En este análisis, el nivel de confianza se define para nosotros en el problema.Trabajamos con un nivel de confianza del 95%.
- Encuentra el valor crítico.El valor crítico es un factor utilizado para calcular el margen de error.Para encontrar el valor crítico, tomamos estos pasos.
- Calcular alfa (α):
α = 1 - (10 de confianza / 100)
A = 1 - 95/100 = 0,05
- Encuentre la probabilidad crítica (p*):
P* = 1 - A/2 = 1 - 0.05/2 = 0.975
- Dado que el tamaño de la muestra (n = 16) es inferior a 30, expresaremos el valor crítico como punto T con 15 grados de libertad (ya que N-1 es igual a 15).El valor crítico es la puntuación t con 15 grados de libertad que tiene unoprobabilidad acumuladaigual a 0.975.Decalculadora de distribución t, encontramos que el valor crítico es de aproximadamente 2.13.
- Calcular alfa (α):
- Calcule el margen de error (ME):
Me = valor crítico * error predeterminado
Yo = 2,13 * 30,74 = 65,5
- Ingrese el intervalo de confianza.Los valores mínimos y más altos para el intervalo de confianza son:
CIMínimo=X- SE * CV = 125 - 30,74 * 2,13 = 59,5
CImáximo=X+ SE * CV = 125 + 30.74 * 2,13 = 190,5
En resumen, aquí están los resultados de nuestro análisis.Basado en los datos de selección, estimamos que el número total de cuatro mascotas con lenguado en la sociedad es de 125. Dado un nivel de confianza del 95 %, el margen de error es alrededor de la estimación 65.5;Y el intervalo de confianza del 95 % es de 59.5 a 190.5.
Última lección Siguiente lección