Revisión de conceptos

Antes de comenzar, es necesario explicar varios términos fundamentales, como varianza, desviación estándar, distribución normal, estimación, exactitud, precisión, media, valor esperado y variable aleatoria.

Supongo que muchos lectores de este tutorial están familiarizados con las estadísticas básicas. Sin embargo, al comienzo de este tutorial, prometí proporcionar los antecedentes necesarios para comprender la operación del filtro Kalman. Si está familiarizado con este tema, siéntase libre de omitirlo y pasar a la siguiente sección.

Media y valor esperado

Media and valor esperado son términos estrechamente relacionados. Sin embargo, son diferentes.

Por ejemplo, dadas cinco monedas diferentes: dos monedas de 5 centavos y tres monedas de 10 centavos, podemos calcular fácilmente el valor medio de la moneda promediando los valores de las monedas.

Monedas
\[ V_{mean}= \frac{1}{N} \sum _{n=1}^{N}V_{n}= \frac{1}{5} \left( 5+5+10+10+10 \right) = 8cent \]

El resultado anterior no se puede definir como el valor esperado, ya que los estados del sistema (valores de monedas) no están ocultos, y hemos utilizado toda la población (las 5 monedas) para el cálculo del valor medio.

Libro del Filtro de Kalman
Guía basada en ejemplos del Filtro de Kalman

Ahora suponga cinco medidas de peso diferentes de la misma persona: 79.8 kg, 80 kg, 80.1 kg, 79.8 kg y 80.2 kg.

Hombre en escalas

Las mediciones son diferentes debido al error de medición aleatorio de la balanza. No sabemos el verdadero valor del peso, ya que es una variable oculta. Sin embargo, podemos estimar el peso promediando las medidas de la balanza.

\[ W= \frac{1}{N} \sum _{n=1}^{N}W_{n}= \frac{1}{5} \left( 79.8+80+80.1+79.8+80.2 \right) =79.98kg \]

El resultado de la estimación es el valor esperado del peso.

La media generalmente se denota con una letra griega μ.

El valor esperado generalmente se denota con la letra E.

Varianza y desviación estándar

La varianza es una medida de la dispersión del conjunto de datos a partir de su media.

La Desviación Estándar es la raíz cuadrada de la varianza.

La desviación estándar se denota con una letra griega \( \sigma \) (sigma). En consecuencia, la varianza se denota por \( \sigma ^{2} \).

Por ejemplo, nos gustaría comparar las alturas de dos equipos de basket. La siguiente tabla proporciona la altura del jugador de ambos equipos y su media.

Jugador 1 Jugador 2 Jugador 3 Jugador 4 Jugador 5 Media
Equipo A 1.89m 2.1m 1.75m 1.98m 1.85m 1.914m
Equipo B 1.94m 1.9m 1.97m 1.89m 1.87m 1.914m

Como podemos ver, la altura media de ambos equipos es la misma. Ahora examinemos la varianza de altura.

Dado que la variación mide la difusión del conjunto de datos, nos gustaría saber la desviación del conjunto de datos de su media. Podemos calcular la distancia de la media para cada variable restando la media de cada variable.

Denotaremos la altura por \( x \), y la media de las alturas por la letra griega \( \mu \). La distancia desde la media para cada variable sería:

\[ x_{n}- \mu = x_{n}-1.914m \]

La siguiente tabla presenta la distancia desde la media para cada variable.

Jugador 1 Jugador 2 Jugador 3 Jugador 4 Jugador 5
Equipo A -0.024m 0.186m -0.164m 0.066m -0.064m
Equipo B 0.026m -0.014m 0.056m -0.024m -0.044m

Algunos de los valores son negativos. Para deshacerse de los valores negativos, elevemos al cuadrado la distancia desde la media:

\[ \left( x_{n}- \mu \right) ^{2} = \left( x_{n}- 1.914m \right) ^{2} \]

La siguiente tabla presenta la distancia al cuadrado de la media para cada variable.

Jugador 1 Jugador 2 Jugador 3 Jugador 4 Jugador 5
Equipo A 0.000576m2 0.034596m2 0.026896m2 0.004356m2 0.004096m2
Equipo B 0.000676m2 0.000196m2 0.003136m2 0.000576m2 0.001936m2

Para calcular la varianza del conjunto de datos, necesitamos encontrar el valor promedio de todas las distancias al cuadrado de la media:

\[ \sigma ^{2}= \frac{1}{N} \sum _{n=1}^{N} \left( x_{n}- \mu \right) ^{2} \]

Para el equipo A, la variación sería:

\[ \sigma _{A}^{2} = \frac{1}{N} \sum _{n=1}^{N} \left( x_{n}- \mu \right) ^{2}= \frac{1}{5} \left( 0.000576+ 0.034596+ 0.026896+ 0.004356+ 0.004096 \right) = 0.014m^{2} \]

Para el equipo B, la variación sería:

\[ \sigma _{B}^{2} = \frac{1}{N} \sum _{n=1}^{N} \left( x_{n}- \mu \right) ^{2}= \frac{1}{5} \left( 0.000676+ 0.000196+ 0.003136+ 0.000576+ 0.001936 \right) = 0.0013m^{2} \]

Podemos ver que aunque la media de ambos equipos es la misma, la medida de la distribución de la altura del Equipo A es mayor que la medida de la distribución de la altura del Equipo B. Esto significa que los jugadores del Equipo A son más diversos en altura, mientras que los jugadores del equipo B son más similares en altura.

Las unidades de la varianza son al cuadrado; es más conveniente observar la desviación estándar. Como ya he mencionado, la desviación estándar es la raíz cuadrada de la varianza.

\[ \sigma =\sqrt[]{\frac{1}{N} \sum _{n=1}^{N} \left( x_{n}- \mu \right) ^{2}} \]

La desviación estándar de las alturas de los jugadores del Equipo A sería de 0.120 m.

La desviación estándar de las alturas de los jugadores del Equipo B sería de 0.036 m.

Ahora, supongamos que nos gustaría calcular la media y la varianza de todos los jugadores de basket en todos los clubes. Es una tarea muy difícil. Necesitamos recopilar los datos de todos los jugadores de todos los clubes.

Por otro lado, podemos estimar la media y la varianza de los jugadores seleccionando un conjunto de datos grande y haciendo los cálculos en este conjunto de datos.

El conjunto de datos de 100 jugadores seleccionados al azar puede ser suficiente para una estimación precisa.

Sin embargo, cuando estimamos la varianza, la ecuación para el cálculo de la varianza es ligeramente diferente. En lugar de normalizar por el factor \( N \), normalizaremos por el factor \( N-1 \):

\[ \sigma ^{2}= \frac{1}{N-1} \sum _{n=1}^{N} \left( x_{n}- \mu \right) ^{2} \]

Puede ver la prueba matemática de esta ecuación en el siguiente recurso: http://www.visiondummy.com/2014/03/divide-variance-n-1/

Distribución Normal

Resulta que muchos fenómenos naturales siguen la Distribución Normal. La distribución normal, también conocida como la Gaussiana (llamada así por el matemático Carl Friedrich Gauss), se describe mediante la siguiente ecuación:

\[ f \left( x; \mu , \sigma ^{2} \right) = \frac{1}{\sqrt[]{2 \pi \sigma ^{2}}}e^{\frac{- \left( x- \mu \right) ^{2}}{2 \sigma ^{2}}} \]

La curva gaussiana también se denomina Función de Densidad de Probabilidad (PDF) para la distribución normal.

El siguiente gráfico describe las PDFs del tiempo de entrega de pizza en tres ciudades: ciudad 'A', ciudad 'B' y ciudad 'C'.

Gaussianas
  • En la ciudad 'A', el tiempo medio de entrega es de 30 minutos y la desviación estándar es de 5 minutos.
  • En la ciudad 'B', el tiempo medio de entrega es de 40 minutos y la desviación estándar es de 5 minutos.
  • En la ciudad 'C', el tiempo medio de entrega es de 30 minutos y la desviación estándar es de 10 minutos.

Podemos ver que las formas gaussianas de los tiempos de entrega de pizza en las ciudades 'A' y 'B' son idénticas; sin embargo, sus centros son diferentes. Eso significa que en la ciudad 'A' esperas 10 minutos menos por la pizza en promedio, mientras que la medida de dispersión es la misma.

También podemos ver que los centros de las gaussianas en las ciudades 'A' y 'C' son los mismos; sin embargo, sus formas son diferentes. Por lo tanto, el tiempo medio de entrega es el mismo en ambas ciudades, pero la medida de dispersión es diferente.

El siguiente gráfico describe las proporciones de la distribución normal.

Desviación estándar
  • El 68.26% de los tiempos de entrega en la Ciudad A se encuentra dentro del rango \( \mu \pm \sigma \) (25–35 minutos)
  • El 95.44% de los tiempos de entrega en la Ciudad A se encuentra dentro del rango \( \mu \pm 2\sigma \) (20–40 minutos)
  • El 99.74% de los tiempos de entrega en la Ciudad A se encuentra dentro del rango \( \mu \pm 3\sigma \) (15–45 minutos)

Por lo general, los errores de medición se distribuyen normalmente. El diseño del Filtro de Kalman asume una distribución normal de los errores de medición.

Variables Aleatorias

Una variable aleatoria describe el estado oculto del sistema. Una variable aleatoria es un conjunto de posibles valores de un experimento aleatorio.

La variable aleatoria puede ser continua o discreta:

  • Una variable aleatoria continua puede tomar cualquier valor dentro de un rango específico, como el tiempo de carga de una batería o el tiempo de una carrera de maratón.
  • Una variable aleatoria discreta es contable, como el número de visitantes de un sitio web o el número de estudiantes en una clase.

La variable aleatoria se describe mediante la función de densidad de probabilidad. En este texto, la función de densidad de probabilidad se caracteriza por:

  • \( \mu_{\scriptscriptstyle \!X} \) – la media de la secuencia de mediciones.
  • \(\sigma_{\scriptscriptstyle \!X}^{2} \) – la varianza de la secuencia de mediciones.

Estimación, Exactitud y Precisión

Una Estimación consiste en evaluar el estado oculto del sistema. Por ejemplo, la verdadera posición de una aeronave está oculta para el observador. Podemos estimar la posición utilizando sensores como el radar. La estimación puede mejorarse significativamente usando múltiples sensores y aplicando algoritmos avanzados de estimación y seguimiento (como el Filtro de Kalman). Todo parámetro medido o calculado es una estimación.

La Exactitud indica cuán cercana está la medición al valor verdadero.

La Precisión describe la variabilidad en una serie de mediciones del mismo parámetro. La exactitud y la precisión forman la base de la estimación.

La siguiente figura ilustra la exactitud y la precisión.

Exactitud y Precisión

Los sistemas de alta precisión tienen baja varianza en sus mediciones (es decir, baja incertidumbre), mientras que los sistemas de baja precisión tienen alta varianza (alta incertidumbre). El error de medición aleatorio produce la varianza.

Los sistemas de baja exactitud se denominan sistemas sesgados, ya que sus mediciones tienen un error sistemático incorporado (sesgo).

La influencia de la varianza puede reducirse considerablemente promediando o suavizando las mediciones. Por ejemplo, si medimos la temperatura con un termómetro que tiene error aleatorio, podemos realizar múltiples mediciones y promediarlas. Como el error es aleatorio, algunas mediciones estarán por encima del valor verdadero y otras por debajo. La estimación será cercana al valor verdadero. Cuantas más mediciones realicemos, más cercana estará la estimación.

Por otro lado, un termómetro sesgado produce un error sistemático constante en la estimación.

Todos los ejemplos de este tutorial suponen sistemas no sesgados.

Resumen

La siguiente figura representa una vista estadística de la medición.

Visión estadística de la medición

Una medición es una variable aleatoria, descrita por la Función de Densidad de Probabilidad (PDF).

La media de las mediciones es el Valor Esperado de la variable aleatoria.

La diferencia entre la media de las mediciones y el valor verdadero es la exactitud de las mediciones, también conocida como sesgo o error sistemático de medición.

La dispersión de la distribución es la precisión de la medición, también conocida como ruido de medición, error aleatorio de medición o incertidumbre de medición.

Libro del Filtro de Kalman
Guía basada en ejemplos del Filtro de Kalman
Previo Siguiente