Calculadora para el tamaño de la muestra y la calculadora de efectos estadísticos (2023)

Usa esto avanzadoCalculadora de tamaño de pruebapara calcular el tamaño de selección requerido para una estadística con una selección, o para diferencias entre dos proporciones o promedios (dos selecciones independientes).Más de dos grupos son compatibles con datos binomiales.Calcular la potenciaDado el tamaño de la muestra, alfa y el efecto detectable más bajo (MDE, efecto más bajo de interés).

Navegacion rapida:

  • Parámetros para el tamaño de la muestra y los cálculos de energía
  • El vencimiento de la calculadora
  • ¿Por qué es importante determinar el tamaño de la muestra?
  • ¿Qué es el poder estadístico?
    • Potencia post-hoc (fuerza observada)
  • Tipos de hipótesis cero e alternativas en las pruebas de significación
  • Absolutamente versus diferencia relativa y por qué es importante para la determinación del tamaño de la muestra
  • Usando la calculadora de potencia y tamaño de muestra

    Esta calculadora permite evaluar varios diseños estadísticos en la planificación de un experimento (prueba, prueba) que utiliza una prueba estadística de hipot cero para sacar conclusiones.Se puede usar tanto como unCalculadora de tamaño de pruebaY como unoCalculadora de efectos estadísticos.Por lo general, uno determinaría el tamaño de la muestra requerido dado un cierto requisito de energía, pero en los casos en que hay un tamaño de muestra predeterminado, se puede calcular el efecto para un tamaño de interés de potencia dado.

    Parámetros para el tamaño de la muestra y los cálculos de energía

    1. Número de grupos de prueba.La calculadora de tamaño de prueba admite experimentos donde recopila datos en unMuestras individualesCompararlo con una población general o un valor de referencia conocido (una muestra), así como aquellos en los que se compara un grupo de control con uno o más grupos de tratamiento (Testia de dos pruebas, K-Test) para detectar diferencias entre ellos.Para comparar más de un grupo de tratamiento con un grupo de control, los ajustes de la muestra se basan enCorrección de Dunnetaplicar.Estos son solo aproximados y están sujetos a la suposición de un tamaño de potencia aproximadamente igual en todos los grupos K, y solo pueden soportar tamaños de muestra iguales en todos los grupos y control.Los cálculos de energía actualmente no son compatibles con más de un grupo de tratamiento debido a su complejidad.

    2. Tipo de resultados.El resultado de interés puede serDiferencia absoluta en dos proporciones(Datos binomiales, por ejemplo, frecuencia de conversión o tasa de eventos), elDiferencia absoluta en dos fondos(Datos en curso, por ejemplo, longitud, peso, velocidad, tiempo, ingresos, etc.), oDiferencia relativaentre dos proporciones o dos promedios (diferencia porcentual, cambio porcentual, etc.).AspectoAbsolutamente versus diferencia relativapara mayor información.También puede calcular la potencia y el tamaño de la muestra para el promedio de un solo grupo.La calculadora de tamaño de prueba y la potencia usanDistribución z (distribución normal).

    3. Línea de baseValor de línea básica (promedio bajo H0) es el número uno puede esperar ver si a todos los participantes experimentales se les asignó el grupo de control.Es el valor promedio que uno espera observar si el tratamiento no tiene ningún efecto.

    4. Efecto mínimo detectable.El efecto más pequeño de interés, a menudo llamado el efecto detectable más pequeño (MDE, pero más precisamente: mrde, mínimoseguramenteefecto detectable) debe ser unDiferencia que uno no quiere perder, si hubiera.Se puede declarar como una acción (por ejemplo, 0.10) o como un porcentaje (por ejemplo, 10%).Siempre es relativo a la media/proporción debajo de H0± Superioridad/no subestimado o el margen del equivalen.Por ejemplo, si la media de línea de base es10y hay una hipótesis alternativa de superioridad con un margen de superioridad en1y el efecto de interés más pequeño en relación con la línea de base es 3, luego ingrese un MDE en2, dado que el margen de la unidad superior MDE más será exacto 3. En este caso, MDE (MRE) se calcula relativamente en la línea de base más el margen de la unidad superior, ya que generalmente es más intuitivo estar interesado en ese valor.

    Si ingresa datos promedio, debe especificar el valor promedio de hipótesis por debajo de cero (peor escenario para un compuesto cero) yDesviación Estándarde datos (para una población conocida o apreciado de una selección).

    5. Tipo de hipótesis alternativa.La calculadora es compatiblesuperioridad,no inferioridadYequivalenciahipótesis alternativas.Cuando el margen superior o no inferior es cero, se convierte en una hipótesis clásica del lado izquierdo o derecho, si es mayor que cero, se convierte en un diseño real de diseño de superioridad/no subestimado.El margen de equivalencia no puede ser cero.AspectoTipos de cero e hipótesis alternativaA continuación para una explicación en profundidad.

    6. Errores aceptables.Escriba la tasa de error,a, siempre se debe proporcionar.Efecto, calculado como1 - B, donde β es la frecuencia de error tipo II, solo al determinar el tamaño de la muestra.Para una explicación en profundidad de poder ver¿Qué es el poder estadístico?Abajo.La frecuencia de error Tipo I es equivalente al umbral de significancia si realiza cálculos de valor p y con el nivel de confianza si usa el intervalo de confianza.

    El vencimiento de la calculadora

    DeSe expulsará la calculadora de tamaño de muestraEl tamaño de selección para el grupo individual o para todos los grupos, así como el tamaño de selección total requerido.Si se usa para resolver el efecto, generará el efecto como una proporción y como porcentaje.

    ¿Por qué es importante determinar el tamaño de la muestra?

    Aunque este software en línea brinda la oportunidad de determinar el tamaño de la muestra para una prueba, es de gran importancia comprender el contexto de la pregunta, "por qué" de todo.

    Al estimar el tamaño de selección necesario antes de que se ejecute un experimento que se evaluará mediante una prueba estadística (una prueba de importancia, intervalo de confianza, etc.) puede: Puede:

    • Determine el tamaño de la muestra necesario para detectar un efecto de un tamaño dado con una probabilidad dada
    • Tenga en cuenta el tamaño del efecto que se puede detectar con un tamaño de muestra particular y potencia
    • Calcule el efecto de un tamaño de muestra dado y tamaño de potencia de interés

    Esta es información crucial para hacer que el costo de la prueba sea efectivo.Tener un tamaño de selección correcto puede significar la diferencia entre completar el experimento o posponerlo cuando puede pagar una selección de tamaño que sea lo suficientemente grande como para garantizar una alta probabilidad de detectar un efecto de importancia práctica.

    Por ejemplo, si un examen médico tiene un efecto bajo, digamos menos del 80 % (β = 0.2) para un cierto efecto mínimo de interés, puede ser poco ético implementarlo debido a su baja probabilidad de rechazar la hipótesis cero y determinar el tratamiento eficiencia.Del mismo modo, para experimentos en física, psicología, economía, marketing, optimización de la frecuencia de conversión, etc. Equilibrar los riesgos y beneficios y garantizar la efectividad de costo de un experimento es una tarea que requiere hacer malabares con muchas partes interesadas, que está mucho más allá del alcance de este texto.

    ¿Qué es el poder estadístico?

    El poder estadístico esprobabilidad de rechazar una hipótesis cero falsa con un nivel dado de significación estadística, contra una hipótesis alternativa particular.Alternativamente, se puede decir que es la probabilidad de descubrir un efecto verdadero de un cierto tamaño con un nivel de significancia dado.Esto es lo que obtienes al usar la herramienta en"Contador de poder"ubicación.El poder está estrechamente relacionado conTipo IIVelocidad: β, y siempre es igual a (1 - β).En una notación de probabilidad, el error de tipo dos para una opción de punto dado puede expresarse como[1]:

    B (Ta;metro1) = P (d (x) ≤ ca; m = m1)

    Debe entenderse que la frecuencia de tipo II se calcula en un punto dado, designado por la presencia de un parámetro para la función de beta.Del mismo modo, dicho parámetro se encuentra en la expresión del efecto porque POW = 1 - β[1]:

    POW (Ta;metro1) = P (d (x)> ca; m = m1)

    En las ecuaciones anterioresCarepresenta el valor crítico para rechazar cero (umbral significativo), d (x) es una función estadística del parámetro de interés, generalmente una transformación a una puntuación estandarizada y µ1es un valor específico de la sala de hipótesis alternativa.

    También puede calcular y trazar toda la función de potencia y obtener una estimación de la potencia para muchas hipótesis alternativas diferentes.Debido a la función de la función, el efecto aumenta rápidamente a casi 100 % para tamaños de potencia más grandes, mientras que disminuye más gradualmente a cero para tamaños de potencia más pequeños.Tal gráfico de función de potencia aún no es compatible con nuestro software estadístico, pero puede calcular la potencia en algunos puntos clave (por ejemplo, 10%, 20%... 90%, 100%) y conectarlos para una aproximación aproximada.

    El poder estadístico es directo e inverso relacionado con el umbral de significación.En el punto de efecto cero para una superioridad simple, el efecto de hipótesis alternativo es exactamente 1 - α, que puede demostrarse fácilmente con nuestra calculadora de potencia.Al mismo tiempo, el efecto se relaciona positivamente con el número de observaciones, por lo que un aumento en el tamaño de la selección aumentará el efecto de un tamaño de potencia dado, siempre que todos los demás parámetros sigan siendo los mismos.

    Potencia post-hoc (fuerza observada)

    Los cálculos de potencia pueden ser útiles incluso después de que se haya completado una prueba porque no rechazar el valor cero puede usarse como argumento para el valor cero y contra hipótesis alternativas especiales en la medida en que la prueba tenía el poder de rechazarlas.Esto se define más explícitamente en el concepto de prueba grave propuesto por Mayo & Spanos (2006).

    Calcular el efecto observado solo es útil si no hubo rechazo de hipótesis cero y uno está interesado en estimarCómo la prueba probada fue contra cero.Es absolutamenteInútilpara calcular el efecto post-hoc para una prueba que resulta en un efecto estadísticamente significativo que se encuentra[5].Si el efecto es significativamente, la prueba tenía suficiente potencia para detectarlo.De hecho, hay una relación inversa de 1 a 1 entre el poder observado y la importancia estadística, por lo que no obtiene nada de calcular la potencia post-hoc, p.Una prueba planificada para α = 0.05 aprobada con un valor p de solo 0.0499 tendrá exactamente el 50 % de potencia observada (observado β = 0.5).

    Fomento encarecidamente el uso de este contador de potencia y tamaño de selección para calcular el efecto observado en el primer caso, y les recomiendo fuertemente en el último caso.

    Tipos de hipótesis cero e alternativas en las pruebas de significación

    Al hacer cálculos de tamaño de selección, es importante para la hipótesis cero (h0, la hipótesis que se está probando) y la hipótesis alternativa es (h1) están bien pensados.La prueba puede rechazar cero o puede no rechazarla.Estrictamente lógicamente, no puede conducir a la aceptación de cero o la aceptación de la hipótesis alternativa.Una hipótesis cero puede ser unapuntoUno: hipótesis de que el valor verdadero es un punto exacto de los posibles valores, o uncompuestoUno: cubre muchos valores posibles, generalmente de -∞ a cualquier valor o de cualquier valor a +∞.La hipótesis alternativa también puede ser un punto uno o uno compuesto.

    En un marco Neyman-Pearson de NHST (prueba estadística de NULL-Hypotesi), la opción debería agotar todos los valores que no pertenecen a NULL, por lo que generalmente se compone.A continuación se muestra una ilustración de algunas posibles combinaciones de hipótesis estadísticas cero y alternativas: superioridad, no inferioridad, fuerte superioridad (margen> 0), equivalencia.

    Kalkylator för provstorlek och statistisk effektkalkylator (1)

    Todos estos son compatibles con nuestra calculadora de potencia y tamaño de prueba.

    Se debe tener una consideración cuidadosa cuandoDecide un margen de no inferioridad, margen de superioridad o el margen de una equivalencia.Las pruebas de equivalencia a veces se usan en ensayos clínicos donde un medicamento puede funcionar por igual (dentro de ciertos límites) como un medicamento existente, pero aún puede preferirse debido a efectos secundarios menos o menos graves, fabricación más barata u otros beneficios, sin embargo, los patrones no inferiores son más común.Casos similares existen dentro de las disciplinas como la optimización de la frecuencia de conversión[2]Y otras aplicaciones comerciales donde los beneficios que no se miden por el resultado principal del interés pueden afectar la adopción de una solución dada.Para las pruebas de equivalencia, se supone que serán evaluados con dos pruebas t de prueba (TOST) unilateral, o intervalo de confianza.

    Tenga en cuenta que nuestra calculadora no admite el caso de libros escolar con un punto cero y una alternativa de punto, ni un punto cero y una alternativa que cubra todos los valores restantes.Esto se debe a que tales casos no son existentes en la práctica experimental.[3] [4].El único cálculo de dos lados es para la hipótesis alternativa de equivalencia, todos los demás cálculos sonunilateral (un lado).

    Absolutamente versus diferencia relativa y por qué es importante para la determinación del tamaño de la muestra

    Cuando se usa una calculadora de tamaño de muestra, es importante saber qué tipo de conclusión desea hacer: si la diferencia absoluta o relativa, a menudo llamada efecto porcentual, efecto porcentual, cambio relativo, elevación porcentual, etc. Donde el puño esmetro1- Mel otro esmetro1-m/mOmetro1-m/m x 100(%).La división con µ es lo que agrega másvariaciónA dicha estimación, dado que µ es solo otra variable con errores aleatorios, por lo tanto, una prueba de diferencia relativa requerirá un mayor tamaño de selección que una prueba de diferencia absoluta.En consecuencia, si el tamaño de la muestra es fijo, habrá menos efecto sobre el cambio relativo que corresponde a un cambio absoluto dado.

    Por la razón anterior, es importante saber y especificar de antemano si estará interesado en el cambio porcentual o si el cambio absoluto es de interés primario.Entonces solo enciende un botón de radio.

    Referencias

    1Mayo D.G., Spanos A. (2010) - "Estadísticas de error", I P. S. Bandyopadhyay y M. R. Forster (Eds.), Filosofía de las estadísticas, (7, 152–198).Manual para la filosofía científica.Países Bajos: Elsevier.

    2Georgiev G.Z.(2017) "El caso de las pruebas A/B sin inferioridad", [en línea] https://blog.analytics-toolkit.com/2017/case-non-inferiority-designs-ab-testing/ (tillgänglig 7 maj,2018)

    3Georgiev G.Z.(2017) "Pruebas de importancia de una cola de dos colas en las pruebas A/B", [en línea] https://blog.analytics-toolkit.com/2017/one-tailed-two-tailed-tests-significance-AB-Testing/ (Tillgänglig 7 Maj 2018)

    4Hyun-Chul Cho Shuzo Abe (2013) "¿Son legítimas las pruebas de hipótesis a dos lados para la investigación direccional?",Journal of Business Research66: 1261-1266

    5Lakens D. (2014) "Potencia observada, y qué hacer si su editor solicita análisis de energía post-hoc" [en línea] http://daniellaks.blogspot.bg/2014/12/observed-power-and-what- what- to-do- if-eur.html (disponible el 7 de mayo de 2018)

    Nuestras calculadoras estadísticasha sido presentadoEn artículos y artículos científicos publicados en revistas científicas de alto perfil por:

    Top Articles
    Latest Posts
    Article information

    Author: Twana Towne Ret

    Last Updated: 02/09/2023

    Views: 5647

    Rating: 4.3 / 5 (44 voted)

    Reviews: 83% of readers found this page helpful

    Author information

    Name: Twana Towne Ret

    Birthday: 1994-03-19

    Address: Apt. 990 97439 Corwin Motorway, Port Eliseoburgh, NM 99144-2618

    Phone: +5958753152963

    Job: National Specialist

    Hobby: Kayaking, Photography, Skydiving, Embroidery, Leather crafting, Orienteering, Cooking

    Introduction: My name is Twana Towne Ret, I am a famous, talented, joyous, perfect, powerful, inquisitive, lovely person who loves writing and wants to share my knowledge and understanding with you.