Introducción a las estadísticas para el análisis de la incertidumbre

Introducción a la Estadística

La estimación de la incertidumbre en la medición requiere una buena comprensión de las estadísticas y del análisis estadístico. Si bien hay muchos recursos estadísticos gratuitos en línea, nadie ha creado una guía estadística específicamente para la estimación de la incertidumbre en la medición.

En este artículo, he compilado una lista completa de las funciones estadísticas para ayudarle a calcular la incertidumbre en la medición y evaluar sus resultados. Esta guía te enseñará la definición, la ecuación y las instrucciones para calcular cada función estadística. Además, he incluido algunos principios y reglas estadísticas para ayudarte a evaluar tus resultados.

Fondo

Cuando empecé a calcular la incertidumbre, solía referirme constantemente a varios libros de texto de la universidad para funciones estadísticas para analizar los datos. Algunos de mis libros de texto de estadística favoritos incluyen;

-Estadísticas para la Ingeniería y las Ciencias por Mendenhall y Sincich

-Introducción al Control de Calidad Estadístico por Douglas Montgomery

-Estadísticas para los experimentadores por Box, Hunter y Hunter

Utilicé los libros de texto de la universidad porque eran el único recurso disponible para evaluar los cálculos de la incertidumbre de la medición.

A lo largo de los años, he usado tanto estos libros de texto que ahora me sé estas funciones de memoria. Por lo tanto, pensé que sería una gran idea crear una guía de Introducción a la Estadística para el Análisis de Incertidumbre para usted.

Cada una de las funciones estadísticas enumeradas en la presente guía tiene un propósito específico. Algunas funciones se utilizan para estimar la incertidumbre y otras para evaluar los resultados.

Creo que he creado una gran guía de introducción a la estadística para calcular la incertidumbre y evaluar sus resultados. Si me he dejado algo, no dude en recomendar funciones adicionales.

A continuación figura una lista de las funciones estadísticas incluidas en la presente guía. Sólo tienes que hacer clic en la función sobre la que quieres saber más.

Promedio

Variación

Desviación Estándar

Determinar el tamaño de la muestra

Grados de Libertad

Suma de cuadrados

Suma de raíz de los cuadrados

Variación agrupada

Grados de Libertad Efectivos

Interpolación Lineal

Regresión Lineal

Coeficiente de Sensibilidad

Covarianza

Correlación

Coeficiente de Correlación (R)

Coeficiente de determinación (R2)

Teorema del Límite Central

Desviación estándar de la media

Intervalos de confianza

Z-Score

T-Score

Distribución de la T de Student

Distribuciones de probabilidad

Bono: Utiliza estas funciones estadísticas cuando calculas la incertidumbre. Descarga la Hoja de Trampas de Estadística ahora.

Promedio

Cuando necesite saber el valor central de su conjunto de datos de muestra, querrá calcular el valor medio o promedio. Puede utilizarse para predecir el valor esperado de los futuros resultados de las mediciones.

Definición

El número central del conjunto de números que se calcula sumando las cantidades y dividiendo luego el número total de cantidades.

Ecuación

Cómo calcular

1. Sume todos los valores juntos.

2. Cuente el número de valores.

3. Divide el paso 1 por el paso 2.

Variación

Cuando quiera saber cuán extendidos están los datos en su conjunto de muestras, querrá calcular la varianza.

Definición

Una medida de la dispersión entre los números de un conjunto de datos.

Ecuación

Cómo calcular

1. Reste cada valor por la media.
2. Cuadrar cada valor en el paso 1.

3. Sume todos los valores del paso 2.

Desviación estándar

Cuando se analiza un conjunto de datos y se necesita conocer la variabilidad aleatoria media, se quiere utilizar la ecuación de la desviación estándar. Es una de las funciones estadísticas descriptivas más comunes utilizadas para calcular la incertidumbre.

Definición

Medida de la dispersión de un conjunto de datos a partir de su media (es decir, el promedio).

Ecuación

Cómo calcular

1. Reste cada valor de la media.
2. Cuadrar cada valor en el paso 1.

3. Sume todos los valores del paso 2.

4. Cuente el número de valores y réstelo por 1.

5. Dividir el paso 3 por el paso 4.

6. Calcula la raíz cuadrada del paso 5.

Determinación del tamaño de la muestra

¿Alguna vez has querido reducir la magnitud de tu desviación estándar? Bueno, si sabes lo pequeña que quieres que sea la desviación estándar, puedes usar esta función para decirte cuántas muestras tendrás que recoger para lograr tu objetivo.

Definición

El número de muestras necesarias para obtener un margen de error deseado.

Ecuación

Cómo calcular

1. Elija su nivel de confianza deseado (z).

2. Elija su margen de error deseado (MOE).

3. Multiplique el resultado del paso 1 por el valor por la desviación estándar del conjunto de la muestra.

4. Divida el resultado por el margen de error seleccionado en el paso 2.

5. Cuadrar el resultado calculado en el paso 4.

Grados de libertad

Cuando se quiere determinar la importancia de las estimaciones estadísticas, como la media, la desviación estándar, etc., es importante calcular los grados de libertad. Además, los grados de libertad se utilizan comúnmente para estimar los intervalos de confianza.

Definición

El número de valores en el cálculo final de una estadística que son libres de variar.

Ecuación

Cómo calcular

1. Cuente el número de valores en el conjunto de la muestra.

2. Reste el valor del paso 1 por 1.

Suma de cuadrados

Cuando se necesita conocer la variación total atribuida por diversos factores, la suma de los cuadrados es una función importante a utilizar. Se utiliza comúnmente en el análisis de regresión para evaluar el error residual de un modelo.

Definición

La suma de los errores, incertidumbres y (o) tolerancias al cuadrado.

Ecuación

Cómo calcular

1. Cuadrar cada valor en el conjunto de la muestra.

2. Sume todos los valores del paso 1.

Suma de Raíz de los Cuadrados

¿Necesita calcular la variación total de varias influencias no correlacionadas para el análisis de incertidumbre, error o tolerancia? Entonces, el método de la suma de raíces de los cuadrados (es decir, RSS) debería ser su función estadística preferida.

Definición

La raíz cuadrada de la suma de los errores cuadrados, incertidumbres y (o) tolerancias.

Ecuación

Cómo calcular

1. Cuadrar cada valor en el conjunto de la muestra.

2. Sume todos los valores del paso 1.

3. Calcula la raíz cuadrada del valor del paso 2.

Variación conjunta

A veces es necesario encontrar el promedio de varias desviaciones estándar calculadas. Bueno, no puedes aproximar la desviación estándar promedio usando la función promedio. Es un error que veo que la gente comete todo el tiempo.

En su lugar, debería utilizar el método de la varianza combinada.

Definición

La estimación de la varianza para múltiples poblaciones, cada una con su propia media y desviación estándar.

Ecuación

Cómo calcular

1. Cuadrar cada valor en el conjunto de la muestra.

2. Multiplica cada valor del paso 1 por sus grados de libertad.
3. Sume todos los valores del paso 2.

4. Suma todos los grados de libertad.
5. Divide el valor del paso 3 por el valor del paso 4.

6. Calcula la raíz cuadrada del valor del paso 5.

Grados de libertad efectivos

¿Quieres usar la Distribución T de Student para encontrar tu factor de cobertura? Usa la ecuación Welch-Satterthwaite para aproximarte a tus grados de libertad efectivos.

Definición

Los Grados de Libertad Aproximados para una variable aproximada por la distribución t.

Ecuación

Cómo calcular

1. Calcular la incertidumbre combinada elevada a la potencia de 4.

2. Calcular el coeficiente de sensibilidad elevado a la potencia de 4.

3. Calcular la incertidumbre estándar elevada a la potencia de 4.

4. Multiplica los resultados de los pasos 2 y 3.
5. Divide los resultados del paso 4 por sus grados de libertad asociados.
6. Repita los pasos 2 a 5 para cada coeficiente de sensibilidad y valor de incertidumbre estándar.

7. Sume todos los resultados del paso 5.

8. Dividir el resultado del paso 1 por el resultado del paso 7.

Interpolación lineal

¿Quieres calcular ecuaciones para la incertidumbre de tu CMC? Use la interpolación lineal para desarrollar una ecuación de predicción para estimar la incertidumbre de medición entre dos puntos de una función de medición.

Definición

La estimación de nuevos puntos de datos en un rango entre dos puntos de datos conocidos.

Ecuación

Donde,

Cómo calcular

1. Encuentra los puntos máximos y mínimos conocidos para x e y.

a. Asigne el valor máximo de y como y2.

b. Asigne el valor mínimo de y como y1.

c. Asignar el valor máximo de x como x2.

d. Asigne el valor mínimo de x como x1.

2. Calcula el coeficiente de ganancia: B1

a. Restar el resultado de y2 por el resultado de y1.

b. Restar el resultado de x2 por el resultado de x1.

c. Dividir el resultado del paso 2a por el resultado del paso 2b.

3. Calcular el coeficiente de compensación: B0

a. Multiplique el resultado del paso 2c por el resultado de x1.

b. Restar la media de y por el resultado calculado en el paso 2a.

4. Verifique sus resultados.

Regresión lineal

Necesitan encontrar un modelo de predicción para su incertidumbre en el CMC usando más de dos puntos de datos, querrán usar la regresión lineal para encontrar una ecuación lineal más precisa.

Definición

Procedimiento para estimar la relación entre una variable dependiente (y) y una o más variables independientes (x) para una población determinada.

Ecuación

Donde,

Cómo calcular

1. Calcula el coeficiente de ganancia: B1

a. Calcular la media (es decir, el promedio) de x.

b. Calcular la media (es decir, el promedio) de y.

c. Restar el valor de x por la media (es decir, el promedio) de x.

d. Reste el valor de y por la media (es decir, el promedio) de y.

e. Multiplique el resultado del paso 1c por el resultado del paso 1d.

f. Repita los pasos 1c a 1e para cada valor de x y y en el conjunto de muestras.

g. Sume todos los resultados calculados en el paso 1f.

h. Reste el valor de x por la media (es decir, el promedio) de x.

i. Cuadrar el resultado del paso 1h.

j. Repita los pasos 1h y 1i para cada valor de x en el conjunto de la muestra.

k. Sume todos los resultados calculados en el paso 1j.

l. Divide el resultado del paso 1g por el resultado del paso 1k.

2. Calcular el coeficiente de compensación: B0

a. Multiplique el resultado del paso 1l por la media (es decir, el promedio) de x.

b. Restar la media de y por el resultado calculado en el paso 2a.

3. Verifique sus resultados.

Coeficiente de sensibilidad

Al estimar la incertidumbre con diferentes unidades de medida, el uso de coeficientes de sensibilidad es una gran opción para facilitar el proceso. Simplemente, los coeficientes de sensibilidad convertirán sus influencias de incertidumbre en unidades de medida similares antes de calcular la incertidumbre combinada.

Definición

Factor que correlaciona la relación entre una variable individual (es decir, el factor que contribuye a la incertidumbre) y el efecto que tiene en el resultado final.

Ecuación

Cómo calcular

1. Identifique la ecuación o función que definirá el valor de la variable y.

2. Elija dos valores diferentes (por ejemplo, máx. y mín.) para la variable x.

3. Calcular el resultado de la variable y para cada valor de la variable x.

4. Reste los resultados de la variable y (es decir, y2 – y1).

5. Reste los resultados de la variable x (es decir, x2 – x1).

6. Divide el resultado del paso 4 por el resultado del paso 5.

Covarianza

Cuando se quiere saber cuánta influencia tiene una variable en el resultado de una ecuación, se debe utilizar la función de covarianza para evaluar la fuerza de la correlación.

Definición

Una medida de la fuerza de la correlación entre dos o más conjuntos de variaciones aleatorias. Una covarianza positiva significa que las variables están relacionadas positivamente, mientras que una covarianza negativa significa que las variables están relacionadas inversamente.

Ecuación

Cómo calcular

1. Reste cada valor de x por la media (es decir, el promedio) de x.

2. Reste cada valor de y por la media (es decir, el promedio) de y.

3. Multiplica los resultados del paso 1 y del paso 2.

4. Repita los pasos 1 a 3 para cada valor de x y y.

5. Añade los resultados del paso 4.

6. Restar el número de muestras por el valor de 1.

7. Divide los resultados del paso 5 por el resultado del paso 6.

Correlación

Una vez que determine que dos o más variables están correlacionadas, puede que quiera evaluar la fuerza de la dependencia. La función de correlación te ayudará a conseguirlo.

Definición

Una cantidad que mide la fuerza de la interdependencia de dos cantidades variables.

Ecuación

Cómo calcular

1. Calcular la covarianza de X e Y.

2. Multiplica la desviación estándar de x y la desviación estándar de y.

3. Dividir el resultado del paso 1 por el resultado calculado en el paso 2.

Coeficiente de Correlación (R)

Después de realizar la regresión, puede que quieras determinar si dos variables están influenciadas la una por la otra. Para averiguarlo, utilice el coeficiente de correlación para encontrar la fuerza y la dirección de su relación.

Definición

Una cantidad que mide la fuerza de la Interdependencia lineal de dos cantidades variables.

Ecuación

Cómo calcular

1. Reste el valor de x por la media (es decir, el promedio) de x.

2. Cuadrar el resultado del paso 1.

3. Reste el valor de y por la media (es decir, el promedio) de y.

4. Cuadrar el resultado del paso 3.

5. Multiplica el resultado del paso 2 por el resultado del paso 4.

6. Repita los pasos 1 a 5 para cada valor de x y y en el conjunto de la muestra.

7. Sume todos los resultados calculados en el paso 6.

8. Restar el valor de x por la media (es decir, el promedio) de x.

9. Cuadrar el resultado del paso 1.

10. Repita los pasos 8 y 9 para cada valor de x en el conjunto de la muestra.

11. Sume todos los resultados calculados en el paso 10.

12. Reste el valor de y por la media (es decir, el promedio) de y.

13. Cuadrar el resultado del paso 1.

14. Repita los pasos 12 y 13 para cada valor de y en el conjunto de la muestra.

15. Sume todos los resultados calculados en el paso 14.

16. Multiplica los resultados del paso 10 y del paso 14.
17. Calcula la raíz cuadrada del resultado en el paso 16.

18. Dividir el resultado del paso 7 por el resultado del paso 17.

Reglas de evaluación

1. La relación lineal más fuerte está indicada por un coeficiente de correlación de -1 o 1.

2. La relación lineal más débil está indicada por un coeficiente de correlación de 0.

3. Un coeficiente de correlación positiva significa que una variable aumenta a medida que la otra aumenta.

4. Un coeficiente de correlación negativo significa que una variable aumenta a medida que la otra disminuye.

Coeficiente de determinación (R2)

Otro método comúnmente utilizado para evaluar los modelos de regresión es el coeficiente de determinación. Es una función que evalúa la «bondad de ajuste» del modelo o lo bien que el modelo se ajusta a los datos.

Después de encontrar una ecuación que modela su función de medición, es importante determinar cuán bien el modelo se ajusta a los datos. El coeficiente de determinación es la función más utilizada para determinar la bondad del ajuste.

Definición

La proporción de la varianza en la variable de salida y que es predecible a partir de la variable de entrada x.

Ecuación

Cómo calcular

1. Calcular la suma de los cuadrados de los residuos;

a. Restar la variable de salida prevista y por la prevista.

b. Cuadrar el resultado calculado en el paso 1a.

c. Repita los pasos 1a y 1b para cada variable de salida y.

d. Sume los resultados calculados en el paso 1c.

2. Calcular la suma total de los cuadrados;

a. Restar la variable de salida y por la media

b. Cuadrar el resultado calculado en el paso 2a.

c. Repita los pasos 2a y 2b para cada variable de salida y.

d. Sume los resultados calculados en el paso 2c.

3. Divide el resultado calculado en el paso 1 por el resultado calculado en el paso 2.

4. Reste el resultado calculado en el paso 3 del valor de 1.

Reglas de evaluación

1. Un valor de 0 significa que la variable dependiente y no puede predecirse a partir de la variable independiente x.

2. Un valor de 1 significa que la variable dependiente y puede predecirse sin error a partir de la variable independiente x.

3. Un valor entre 0 y 1 indica el grado en que la variable dependiente es predecible (por ejemplo, 0,90 significa que el 90% de la varianza de y es predecible a partir de x),

Teorema del límite central

Al estimar la incertidumbre, se combinan muchas distribuciones de probabilidad diferentes. Por esta razón, es importante conocer el Teorema del Límite Central para entender cómo su estimación de la incertidumbre se aproxima a una distribución Normal.

Definición

La distribución de la media (es decir, el promedio) de un gran número de variables independientes de idéntica distribución será aproximadamente normal, independientemente de la distribución subyacente.

Cuantas más muestras recoja, más se asemejarán sus datos a una distribución normal.

Desviación estándar de la media

A veces se quiere saber más sobre los datos; concretamente, la incertidumbre del resultado de la medición media o la incertidumbre de la incertidumbre calculada. La desviación estándar de la media le dirá la variabilidad de su media calculada.

Definición

Una estimación de la variabilidad entre muestras significa que si se tomaron múltiples muestras de la misma población.

Desviación estándar de la media vs. Desviación estándar

La desviación estándar de la media estima la variabilidad entre las muestras, mientras que la desviación estándar mide la variabilidad dentro de una sola muestra.

Ecuación

Cómo calcular

1. Calcular la desviación estándar de un conjunto de muestras.

2. Cuente el número de muestras tomadas.

3. Calcular la raíz cuadrada del resultado del paso 2.

4. Divide los resultados del paso 2 por el resultado del paso 1.

Intervalos de confianza

Cuando es necesario establecer parámetros que garanticen que un porcentaje específico de resultados se produzca dentro de esa región, se desea establecer intervalos de confianza.

Definición

Es un rango de valores estimado que probablemente incluya un parámetro de población desconocido; el rango estimado se calcula a partir de un conjunto determinado de datos de muestra.

Ecuación

Donde,

Para una desviación estándar conocida:

Para una desviación estándar desconocida:

Cómo calcular

Encuentra Zα/2

1. Elija su nivel de confianza deseado (por ejemplo, 95%).

2. Calcula el valor de alfa sobre 2.

a. Dividir el resultado del paso 1 por 100.

b. Restar el valor de 1 por el resultado calculado en el paso 2a.

c. Dividir el resultado del paso 2b por 2 (para distribuciones de dos colas).

3. Calcular la probabilidad crítica (p):

a. Restar el valor de 1 por el resultado calculado en el paso 2c.

4. Usando el resultado del paso 3, refiérase a la Tabla de Valores Críticos Z para el factor de expansión z.

a. Encuentra el resultado calculado en el paso 3a en la Tabla de Valores Críticos Z.

b. Encuentra el valor de la fila de intersección (columna más a la izquierda).

c. Encuentra el valor de la columna de intersección (fila superior).

d. Sume los resultados de los pasos 4a y 4b.

Tabla de Valores Críticos Z

Encuentra tα/2

1. Elija su nivel de confianza deseado (por ejemplo, 95%).

2. Cuente los grados de libertad.

3. Usando el resultado del paso 2, refiérase a la Tabla T de Student para el factor de expansión t.

a. Encuentra la columna que corresponde con el nivel de confianza elegido.

b. Encuentra la fila que corresponde con el número de grados de libertad.

c. Encuentra el valor donde se cruzan los resultados de 3a y 3b.

Tabla T del estudiante

Puntuación Z

¿Quiere determinar cuántas desviaciones estándar hay en un resultado de la media o media de la población? Evalúe el resultado calculando el puntaje Z del resultado.

Definición

Medición estadística de la relación de una puntuación (es decir, cuántas desviaciones estándar por encima o por debajo de la media de la población) con la media en un conjunto de puntuaciones.

Ecuación

Cómo calcular

1. Elija un valor del conjunto de datos.

2. Reste el valor por la media de la población (es decir, la media).

3. Dividir el resultado del paso 2 por la desviación estándar del conjunto de la muestra.

T-Score

Otro método para determinar cuán lejos está un resultado de la media es el T-score. La ventaja de utilizar el puntaje T, en lugar del puntaje Z, es que normalmente es más fácil evaluar y explicar los resultados.

Definición

Una relación entre la desviación de un parámetro estimado de su valor teórico y su error estándar.

Ecuación

Cómo calcular

1. Calcular la media de la muestra, x.

2. Calcular la media de la población, µ.

3. Calcular la desviación estándar de la muestra, s.

4. Cuente el número de muestras independientes, n.

5. Restar la media de la muestra por la media de la población.

6. Calcular la raíz cuadrada del número de muestras.
7. Divida la desviación estándar de la muestra por el resultado calculado en el paso 6.

8. Divide el resultado calculado en el paso 5 por el resultado calculado en el paso 7.

Distribución de T de Student

Utiliza la distribución T de Student para establecer intervalos de confianza basados en el número de grados de libertad.

Definición

Una distribución de probabilidad que se utiliza para estimar los parámetros de la población cuando el tamaño de la muestra es pequeño y/o cuando se desconoce la varianza de la población.

Ecuación

Cómo calcular

1. Elija un intervalo de confianza deseado, α.

2. Calcular los grados de libertad, n-1.

3. Consulte la tabla T de los estudiantes para encontrar su factor de cobertura;

a. Encuentra la columna que coincide con el intervalo de confianza deseado.

b. Encuentra la fila que coincide con los grados de libertad calculados.

c. Encuentra donde la columna y la fila se cruzan para encontrar el valor de t.

Distribuciones de probabilidad

Reduzca sus influencias de incertidumbre a equivalentes de desviación estándar basados en cómo se distribuyen los datos de la población. Determine cuál es la distribución de probabilidad que mejor describe sus datos y utilice el cuadro que figura a continuación para encontrar el divisor apropiado.

Bono: Utiliza estas funciones estadísticas cuando calculas la incertidumbre. Descarga la Hoja de Trampas de Estadística ahora.

Conclusión

Las estadísticas son un componente clave para calcular la incertidumbre en la medición. Sin estadísticas, no sería posible estimar la incertidumbre y evaluar los resultados.

Espero que esta guía de introducción a las estadísticas le sea útil, y que sea una herramienta de referencia práctica para sus esfuerzos de análisis de la incertidumbre.

Una vez más, esto es sólo una introducción a las estadísticas para el análisis de la incertidumbre. En el futuro publicaré una guía más completa con funciones estadísticas avanzadas. Mientras tanto, si cree que me he dejado algo, por favor envíeme un correo electrónico para recomendarle funciones adicionales.

Ahora, deja un comentario abajo diciéndome sobre qué función estadística te gustaría aprender más.

Leave a Comment!