Cómo realizar una prueba de repetibilidad 2:

Recopilación de datos

El número de muestras recogidas durante la experimentación influye en el análisis de los resultados y en la validez de los datos de las pruebas recogidas. A lo largo de los años, he observado varios relatos contradictorios sobre cuántas muestras se deben recoger durante la experimentación. Según muchos libros de texto de introducción a la estadística, el número de muestras recogidas depende de la población. Una población pequeña se considera una colección de 30 muestras o menos, mientras que una población grande se considera una colección de más de 30 muestras. Sin embargo, las áreas temáticas más avanzadas de la estadística tendrán múltiples aseveraciones en relación con los objetivos del análisis y la confianza esperada en los resultados. Si se encuestara a un grupo de profesionales de diferentes organizaciones y de diferentes industrias, se obtendría una colección de opiniones variadas. Esto es el resultado de diferentes visiones del mundo; cada persona y organización va a tener diferentes objetivos. Por lo tanto, tendrán un grado de opiniones variadas.

Qué hacer

En mi opinión profesional, el número de muestras que se recojan debe estar en relación con los objetivos de su organización y el nivel de confianza que se espera de los resultados. Si su laboratorio busca alcanzar un nivel de confianza del 95,45% (donde k=2,00), le recomiendo que recoja 22 muestras para cada experimento. Si su objetivo es alcanzar un nivel de confianza del 99%, le recomiendo que recoja 100 muestras. ¿Por qué? La respuesta es atípica. Puedes validar tus resultados con valores atípicos. Si recoge 22 muestras y busca alcanzar un nivel de confianza del 95,45%, normalmente encontrará un valor atípico en su conjunto de muestras recogidas. Así es como puede asegurarse de que está alcanzando el nivel de confianza que cumple con sus objetivos. Además, le permite controlar la efectividad y la eficiencia de sus esfuerzos de recolección de datos. ¿Por qué recolectar 100 muestras si sólo necesita 22; o, por qué recolectar 22 muestras si necesita 100. Sólo gaste los recursos que necesita para alcanzar sus objetivos. De lo contrario, estará desperdiciando el tiempo y los recursos que podrían utilizarse para realizar otras tareas. Utilizando la siguiente ecuación, se puede determinar el número apropiado de muestras que se desea recolectar para lograr un nivel de confianza específico.

Vamos a romperlo

No estoy seguro de que mi teoría sea válida. Entonces, déjeme mostrarle los resultados cuantitativos y cualitativos que apoyan mi opinión. Usando una simulación de Monte Carlo, generaré un conjunto de datos aleatorios que se supone que se ajustan a un nivel de confianza específico (es decir, 95,45%) exhibiendo una distribución gaussiana. Con estos datos, calcularé la media, la desviación estándar y los grados de libertad e informaré de los resultados para que los evalúen. A partir de aquí, puede formular su propia opinión y elegir entre estar de acuerdo o no conmigo.

Los resultados

El 95,46% de los ensayos mostraron un atípico o menos

El 68,18% de los ensayos mostraron al menos un atípico

El 4,54% de los ensayos mostraron más de un atípico

Notas

1| Los números de la columna de la izquierda representan el número de muestra de cada ensayo, totalizando 22.

2| Los números de la fila superior representan el número de prueba, totalizando 22.

3| Los límites superior e inferior se cuantificaron calculando la suma y la diferencia de la media y el doble de la desviación estándar (es decir, 2-sigma).

4| Los valores que no se conforman, o que son atípicos, son las celdas que no están resaltadas en verde.

5| Haga clic en la imagen para agrandarla

Ahora que le he proporcionado alguna información y métodos que puede utilizar para determinar el número más eficiente de muestras a recoger para sus experimentos de repetibilidad, ¿cuántas muestras recogerá?

Leave a Comment!