Distribuciones de probabilidad para la incertidumbre de la medición

Las distribuciones de probabilidad son una parte del análisis de la incertidumbre de la medición con la que la gente lucha continuamente. Hoy, mi objetivo es ayudarles a aprender más sobre las distribuciones de probabilidad sin tener que tomar un libro de texto de estadística. Aunque hay cientos de distribuciones de probabilidad que podrías usar, me voy a centrar en las 6 que tú necesitas saber .

Si luchas constantemente con las distribuciones de probabilidad, sigue leyendo. Voy a explicar qué son las distribuciones de probabilidad, por qué son importantes, y cómo pueden ayudarte al estimar la incertidumbre de la medición.

¿Qué es una distribución de probabilidad

Explicado de manera sencilla, las distribuciones de probabilidad son una función, tabla o ecuación que muestra la relación entre el resultado de un evento y su frecuencia de ocurrencia.

Las distribuciones de probabilidad son útiles porque pueden utilizarse como una representación gráfica de sus funciones de medición y de cómo se comportan. Cuando se sabe cómo se han desempeñado las funciones de medición en el pasado, se puede analizar más apropiadamente y predecir los resultados futuros.

Antes de saltar de cabeza a los diferentes tipos de distribuciones de probabilidad, aprendamos primero un poco más sobre las distribuciones de probabilidad. En los próximos párrafos, voy a explicar algunas características que deberíais conocer.

Histograma

Un histograma es una representación gráfica utilizada para entender cómo se distribuyen los datos numéricos. Echa un vistazo a continuación al histograma de una distribución gaussiana.

Mire el histograma y vea cómo la mayoría de los datos recogidos se agrupan en el centro. Esto se llama tendencia central.

Ahora mira la altura de cada barra en el histograma. La altura de las barras indica la frecuencia con la que se produce el resultado que representa. Cuanto más alta es la barra, más frecuente es la ocurrencia.

Asimetría

La asimetría es una medida de la simetría de las distribuciones de probabilidad. Mira el siguiente gráfico para entender visualmente cómo las distribuciones de probabilidad pueden inclinarse hacia la izquierda o hacia la derecha.

Curtosis

La curtosis es una medida de la cola y el pico en relación con una distribución normal. Como se puede ver en la imagen de abajo, las distribuciones con colas más anchas tienen picos más pequeños mientras que las distribuciones con picos más grandes tienen colas más estrechas. ¿Ves la relación?

¿Por qué es importante

Sé que parece que te estoy haciendo leer más información que quieres saber, pero es importante conocer estos detalles para que puedas seleccionar la distribución de probabilidad apropiada que caracteriza tus datos.

Si no está seguro de cómo se distribuyen sus datos, cree un histograma y compárelo con las siguientes distribuciones de probabilidad.

El más utilizado

Las distribuciones de probabilidad más utilizadas para estimar la incertidumbre de la medición son;

  • Normal
  • Rectangular
  • En forma de U
  • Triángulo
  • Log-Normal
  • Rayleigh

A continuación encontrará una lista de las distribuciones de probabilidad más comunes utilizadas en los análisis de incertidumbre. Después de leer este artículo, debería ser capaz de identificar qué distribuciones de probabilidad debería utilizar y cómo reducir sus contribuciones a la incertidumbre a equivalentes de desviación estándar.

Distribución Gaussiana (alias Normal)

La distribución normal es una función que representa la distribución de muchas variables aleatorias como un gráfico simétrico en forma de campana en el que el pico se centra en la media y se distribuye simétricamente de acuerdo con la desviación estándar.

La distribución normal es la distribución de probabilidad más utilizada para evaluar los datos del Tipo A. Si no se sabe qué son los datos de Tipo A, son los datos que se recogen de las pruebas experimentales, como la repetibilidad, la reproducibilidad y las pruebas de estabilidad.

Para entenderlo mejor, imagina que vas a recoger 100 muestras de medición y crear un gráfico de histograma con tus resultados. El histograma de tus datos debería parecerse a una forma cercana a una distribución normal.

Cuantos más datos recoja, más se acercará su histograma a una distribución normal.

Ahora, no espero que recoja 100 muestras cada vez que realice una prueba de repetibilidad y reproducibilidad. En su lugar, le recomiendo que empiece por recoger de 20 a 30 muestras para cada prueba. Esto debería darle una buena línea de base para empezar, y permitirle caracterizar sus datos con una distribución normal.

Para reducir los datos distribuidos normalmente a un equivalente de desviación estándar, utilice la siguiente ecuación. La variable U será el valor de su contribución a la incertidumbre y k es el valor de su factor de expansión.

Por ejemplo, si se recogen 20 muestras para un experimento de repetibilidad y se calcula la desviación típica, el valor de k es 1. Si se pregunta, es igual a 1 porque su desviación típica ya está en el nivel de 1-sigma (es decir, 68,27% de confianza).

Así que, si tu desviación estándar calculada es de 1 ppm, entonces;

Cuando use Microsoft Excel para calcular la incertidumbre de la medición, use la siguiente ecuación:

=[Celda1]/1

Para el siguiente ejemplo, imagina que estás evaluando la incertidumbre de la medición de tu informe de calibración. Lo más probable es que se informe con un 95% de confianza donde k es igual a 2 (estoy seguro de que has leído esto en alguna parte antes). Si su incertidumbre reportada es de 1 ppm, entonces;

Cuando use Microsoft Excel para calcular la incertidumbre de la medición, use la siguiente ecuación:

=[Celda1]/2

Distribución rectangular (también conocida como distribución uniforme)

La Distribución Rectangular es una función que representa una distribución uniforme continua y una probabilidad constante. En una distribución rectangular, todos los resultados tienen la misma probabilidad de ocurrir.

La distribución rectangular es la distribución de probabilidad más utilizada en los análisis de incertidumbre. Si te preguntas por qué, es porque cubre la mayoría de los factores de incertidumbre donde el evaluador dice, «No estoy seguro de cómo se distribuyen los datos».

Cuando no se tiene confianza en cómo se distribuyen los datos, es mejor evaluarlos de manera conservadora. En esta situación, la distribución rectangular es una gran opción por defecto, por lo que la mayoría de los evaluadores de la ISO/IEC 17025 la recomiendan. Por lo tanto, asegúrese de prestar atención, usted estará usando mucho esta distribución de probabilidad.

Para reducir sus contribuciones de incertidumbre a los equivalentes de desviación estándar, querrá dividir sus valores por la raíz cuadrada o 3.

Por ejemplo, si se realiza un análisis de la incertidumbre de la medición y se evalúa la contribución de un factor que influye en 1 parte por millón y se propone que los datos se distribuyan uniformemente, entonces;

Cuando use Microsoft Excel para calcular la incertidumbre de la medición, use la siguiente ecuación:

=[Celda1]/SQRT(3)

Distribución en forma de U

La distribución en forma de U es una función que representa los resultados que tienen más probabilidades de ocurrir en los extremos del rango. La distribución forma la forma de la letra «U», pero no tiene que ser necesariamente simétrica.

La distribución en forma de U es útil cuando los eventos ocurren frecuentemente en los extremos del rango. Considere el termostato que controla la temperatura de su laboratorio. Si no está utilizando un controlador PID, el controlador de su termostato sólo intenta controlar la temperatura activándose en los extremos.

Por ejemplo, imagina que el termostato de tu laboratorio está ajustado a 20°C y controla la temperatura a 1°C. Lo más probable es que su termostato no active su sistema de calefacción, ventilación y aire acondicionado hasta que la temperatura del laboratorio alcance los 19°C o 21°C. Esto significa que su laboratorio no está normalmente a 20°C. En su lugar, las temperaturas de su laboratorio están flotando alrededor de los límites de los umbrales del termostato antes de activarse o desactivarse.

Por esta razón, es mejor caracterizar los datos de temperatura de su laboratorio utilizando una distribución en forma de U.

Para reducir sus contribuciones de incertidumbre a los equivalentes de desviación estándar, querrá dividir sus valores por la raíz cuadrada o 2.

Por lo tanto, si se realiza un análisis de la incertidumbre de la medición y se evalúa la contribución de un factor que tiene una influencia de 1 parte por millón y se propone que los datos de este factor se distribuyan en forma de U, entonces;

Cuando use Microsoft Excel para calcular la incertidumbre de la medición, use la siguiente ecuación:

=[Celda1]/SQRT(2)

Distribución del triángulo

La distribución de los triángulos es una función que representa un mínimo, un máximo y un valor central estimado conocidos. Se suele denominar distribución de «desconocimiento» porque se suele utilizar cuando se conoce una relación entre las variables, pero los datos son escasos.

Además, la distribución en triángulos se utiliza comúnmente cuando la recopilación de datos es difícil o costosa.

Para un ejemplo del mundo real, imagina que tu laboratorio tiene la temperatura controlada con un controlador de termostato PID. El controlador del termostato PID está constantemente tratando de alcanzar el punto de referencia de la temperatura objetivo. Por esta razón, las temperaturas en su laboratorio están constantemente flotando alrededor de 20°C y rara vez alcanzan los umbrales de temperatura (es decir, los límites) de un controlador de termostato típico.

Lo que esto significa es que la mayoría de los datos de la temperatura de su laboratorio se centran en su temperatura establecida. Por lo tanto, se caracteriza mejor por una distribución triangular porque conocemos los límites y la media estimada pero no estamos seguros de cómo se distribuyen los datos entre estos puntos.

Para reducir sus contribuciones de incertidumbre a los equivalentes de desviación estándar, querrá dividir sus valores por la raíz cuadrada o 6.

Por lo tanto, si realizas un análisis de la incertidumbre de la medición y evalúas la contribución de un factor que tiene una influencia de 1 parte por millón y propones que los datos de este factor estén distribuidos en triángulos, reducirías su valor utilizando la ecuación anterior.

Si utiliza Microsoft Excel para calcular la incertidumbre de la medición, utilice la siguiente ecuación:

=[Celda1]/SQRT(6)

Distribución Log-Normal

La distribución logarítmica normal es una función de un logaritmo natural que se distribuye normalmente.

La distribución logarítmica normal es una distribución que se encuentra comúnmente pero que se utiliza raramente. La mayoría de las veces es el resultado de la falta de conocimiento o de la falta de desarrollo de un histograma para sus datos.

Por ejemplo, si se realizan mediciones que son finitas, como la longitud, la altura, el peso, etc., lo más probable es que se obtengan datos que se asemejen a una distribución logarítmica normal. Es más común en la metrología dimensional y mecánica.

Para entenderlo mejor, piensa en calibrar un bloque de calibrador. Antes de comenzar la calibración, conoce la longitud del objetivo. Si realiza mediciones repetidas en un solo punto del bloque del medidor, la mayoría de los resultados de las mediciones se centrarán en la longitud real del bloque del medidor. Algunos resultados de las mediciones serán mayores que el valor real del bloque del medidor, y muchos menos resultados de las mediciones serán menores que el valor real del bloque del medidor.

La razón de que esto ocurra es que los resultados de sus mediciones están limitados por la longitud del bloque del medidor. Siendo realistas, no se puede medir menos que la longitud del bloque; por lo tanto, los resultados de sus mediciones son finitos o limitados.

Asegúrese de considerar la distribución logarítmica normal la próxima vez que realice mediciones que sean finitas. Puede evitar que encuentre errores de medición e incertidumbres mal calculadas.

Para reducir sus contribuciones a la incertidumbre a los equivalentes de desviación estándar, usted querrá usar la siguiente ecuación.

Donde,

m = mediana

q = límite

Distribución de Rayleigh

Las distribuciones de Rayleigh se utilizan cuando la magnitud de un vector está asociada a sus componentes direccionales (por ejemplo, x e y), que también pueden ser componentes reales e imaginarios (por ejemplo, i y j).

Cuando los componentes direccionales son ortogonales y están distribuidos normalmente, el vector resultante será el distribuido por Rayleigh.

Las distribuciones de Rayleigh se utilizan comúnmente en la metrología eléctrica para las funciones de RF y microondas. Además, se utilizan comúnmente en la metrología mecánica en la que intervienen los vectores.

Por ejemplo, cuando se analiza la velocidad del viento por sus componentes vectoriales bidimensionales, x e y, el vector resultante es el distribuido por Rayleigh. Para que esto suceda, x e y deben ser ortogonales y estar distribuidos normalmente.

La reducción de los componentes de la incertidumbre a equivalentes de desviación estándar es difícil con las distribuciones de Rayleigh. Será necesario conocer la desviación estándar de cada componente direccional para calcular la incertidumbre de la medición del componente vectorial. Después, puede utilizar la siguiente ecuación para reducir su componente de incertidumbre a un equivalente de desviación estándar.

Para una mejor explicación, haga clic en el siguiente enlace para leer este artículo de Michael Dobbert de Agilent (ahora Keysight).

Revisando la incertidumbre del desajuste con la distribución de Rayleigh

Conclusión

Las distribuciones de probabilidad son una parte importante para comprender el comportamiento de las funciones, analizar los datos y predecir los resultados futuros. Por eso son un componente crítico del análisis de la incertidumbre. Si se estima la incertidumbre de la medición sin considerar las distribuciones de probabilidad, se van a cometer errores. Así que asegúrese de usar esta guía como referencia cuando calcule la incertidumbre.

Además, nunca está de más usar este gráfico.

Espero que este artículo le haya sido útil para su análisis de la incertidumbre. Déjame un comentario y dime las distribuciones de probabilidad que usas en tu análisis de incertidumbre .

Referencias

Castrup, H. (2007). Distributions for Uncertainty Analysis. Bakersfield, CA: Grupo de Ciencias Integradas.

Castrup, H. (2009). Error Distribution Variances and Other Statistics. Bakersfield: Grupo de Ciencias Integradas.

DeCarlo, L. T. (1997). On the Meaning and Use of Kurtosis. American Psychological Association Inc., 292-302.

Dobbert, M., & Gorin, J. (2011). Revisando la Incertidumbre del Desajuste con la Distribución de Rayleigh. Santa Rosa: Agilent.

Petty, N. W., & Dye, S. (2013). Distribuciones triangulares. Christchurch: Centro de Aprendizaje de Estadística.

Si he dejado algo fuera de este artículo o si se le ocurre algún consejo adicional que pueda mejorar esta lista, por favor, deje un comentario o póngase en contacto conmigo para compartir su consejo.

Leave a Comment!