Antes de comenzar, es necesario explicar varios términos fundamentales, como varianza, desviación estándar, distribución normal, estimación, exactitud, precisión, media, valor esperado y variable aleatoria.
Supongo que muchos lectores de este tutorial están familiarizados con las estadísticas básicas. Sin embargo, al comienzo de este tutorial, prometí proporcionar los antecedentes necesarios para comprender la operación del filtro Kalman. Si está familiarizado con este tema, siéntase libre de omitirlo y pasar a la siguiente sección.
Media and valor esperado son términos estrechamente relacionados. Sin embargo, son diferentes.
Por ejemplo, dadas cinco monedas diferentes: dos monedas de 5 centavos y tres monedas de 10 centavos, podemos calcular fácilmente el valor medio de la moneda promediando los valores de las monedas.
El resultado anterior no se puede definir como el valor esperado, ya que los estados del sistema (valores de monedas) no están ocultos, y hemos utilizado toda la población (las 5 monedas) para el cálculo del valor medio.
Ahora suponga cinco medidas de peso diferentes de la misma persona: 79.8 kg, 80 kg, 80.1 kg, 79.8 kg y 80.2 kg.
Las mediciones son diferentes debido al error de medición aleatorio de la balanza. No sabemos el verdadero valor del peso, ya que es una variable oculta. Sin embargo, podemos estimar el peso promediando las medidas de la balanza.
El resultado de la estimación es el valor esperado del peso.
La media generalmente se denota con una letra griega μ.
El valor esperado generalmente se denota con la letra E.
La varianza es una medida de la dispersión del conjunto de datos a partir de su media.
La Desviación Estándar es la raíz cuadrada de la varianza.
La desviación estándar se denota con una letra griega \( \sigma \) (sigma). En consecuencia, la varianza se denota por \( \sigma ^{2} \).
Por ejemplo, nos gustaría comparar las alturas de dos equipos de basket. La siguiente tabla proporciona la altura del jugador de ambos equipos y su media.
Jugador 1 | Jugador 2 | Jugador 3 | Jugador 4 | Jugador 5 | Media | |
---|---|---|---|---|---|---|
Equipo A | 1.89m | 2.1m | 1.75m | 1.98m | 1.85m | 1.914m |
Equipo B | 1.94m | 1.9m | 1.97m | 1.89m | 1.87m | 1.914m |
Como podemos ver, la altura media de ambos equipos es la misma. Ahora examinemos la varianza de altura.
Dado que la variación mide la difusión del conjunto de datos, nos gustaría saber la desviación del conjunto de datos de su media. Podemos calcular la distancia de la media para cada variable restando la media de cada variable.
Denotaremos la altura por \( x \), y la media de las alturas por la letra griega \( \mu \). La distancia desde la media para cada variable sería:
La siguiente tabla presenta la distancia desde la media para cada variable.
Jugador 1 | Jugador 2 | Jugador 3 | Jugador 4 | Jugador 5 | |
---|---|---|---|---|---|
Equipo A | -0.024m | 0.186m | -0.164m | 0.066m | -0.064m |
Equipo B | 0.026m | -0.014m | 0.056m | -0.024m | -0.044m |
Algunos de los valores son negativos. Para deshacerse de los valores negativos, elevemos al cuadrado la distancia desde la media:
La siguiente tabla presenta la distancia al cuadrado de la media para cada variable.
Jugador 1 | Jugador 2 | Jugador 3 | Jugador 4 | Jugador 5 | |
---|---|---|---|---|---|
Equipo A | 0.000576m2 | 0.034596m2 | 0.026896m2 | 0.004356m2 | 0.004096m2 |
Equipo B | 0.000676m2 | 0.000196m2 | 0.003136m2 | 0.000576m2 | 0.001936m2 |
Para calcular la varianza del conjunto de datos, necesitamos encontrar el valor promedio de todas las distancias al cuadrado de la media:
Para el equipo A, la variación sería:
Para el equipo B, la variación sería:
Podemos ver que aunque la media de ambos equipos es la misma, la medida de la distribución de la altura del Equipo A es mayor que la medida de la distribución de la altura del Equipo B. Esto significa que los jugadores del Equipo A son más diversos en altura, mientras que los jugadores del equipo B son más similares en altura.
Las unidades de la varianza son al cuadrado; es más conveniente observar la desviación estándar. Como ya he mencionado, la desviación estándar es la raíz cuadrada de la varianza.
La desviación estándar de las alturas de los jugadores del Equipo A sería de 0.120 m.
La desviación estándar de las alturas de los jugadores del Equipo B sería de 0.036 m.
Ahora, supongamos que nos gustaría calcular la media y la varianza de todos los jugadores de basket en todos los clubes. Es una tarea muy difícil. Necesitamos recopilar los datos de todos los jugadores de todos los clubes.
Por otro lado, podemos estimar la media y la varianza de los jugadores seleccionando un conjunto de datos grande y haciendo los cálculos en este conjunto de datos.
El conjunto de datos de 100 jugadores seleccionados al azar puede ser suficiente para una estimación precisa.
Sin embargo, cuando estimamos la varianza, la ecuación para el cálculo de la varianza es ligeramente diferente. En lugar de normalizar por el factor \( N \), normalizaremos por el factor \( N-1 \):
Puede ver la prueba matemática de esta ecuación en el siguiente recurso: http://www.visiondummy.com/2014/03/divide-variance-n-1/
Resulta que muchos fenómenos naturales siguen a la Distribución Normal. Continuando con el ejemplo de la altura de los jugadores de basket, si construimos un gran conjunto de datos de jugadores seleccionados al azar y construimos una gráfica de la frecuencia de las alturas frente a las alturas, obtendremos la curva en forma de "campana", como se muestra en el siguiente cuadro:
Como puede ver, la curva es simétrica alrededor del valor medio, que es 1.9m. La frecuencia de los valores alrededor de la media es mayor que la frecuencia de los valores distantes.
La desviación estándar de las alturas es igual a 0.2m. El 68,26% de los valores se encuentran dentro de una desviación estándar de la media. Como se puede ver en el gráfico a continuación, el 68.26% de los valores se encuentran entre 1.7 m y 2.1 m (el área verde es el 68.26% del área total bajo la curva).
El 95.44% de los valores se encuentran dentro de dos desviaciones estándar de la media
El 99.74% de los valores se encuentran dentro de dos desviaciones estándar de la media
La distribución normal, también conocida como Gaussiana (lleva el nombre del matemático Carl Friedrich Gauss), y se describe mediante la siguiente ecuación:
La curva gaussiana también se llama Función de densidad de probabilidad (PDF) para la distribución normal.
Por lo general, los errores de medición se distribuyen normalmente. El diseño del filtro Kalman supone una distribución normal de los errores de medición.
Un matemático, un físico y un ingeniero conducen en una zona de 60 km/h. Son detenidos por un policía que mide la velocidad del automóvil con la pistola láser.
La medición de la pistola de velocidad es 70 km/h. La medición de la pistola de velocidad se distribuye normalmente con la desviación estándar de 5 km/h.
La medición de la pistola de velocidad es una variable aleatoria. No sabemos el valor preciso de la velocidad. El valor esperado de la velocidad es 70 km/h.
El matemático diría que la velocidad del automóvil puede ser cualquier número entre infinito negativo e infinito positivo, y la probabilidad de que esta velocidad esté entre 65 km/h y 75 km/h es 68.26%.
El físico diría que la velocidad del automóvil puede ser cualquier número mayor que la velocidad negativa de la luz y menor que la velocidad positiva de la luz.
El ingeniero diría que la velocidad del automóvil puede ser cualquier número por encima de cero y por debajo de 140 km/h (ya que la velocidad máxima del auto es 140 km/h).
El policía, diría que la velocidad del automóvil era de 70 km/h y hace la multa.
Las variables aleatorias pueden ser continuas o discretas:
Todas las mediciones son variables aleatorias continuas.
La estimación consiste en evaluar el estado oculto del sistema. La verdadera posición de un avión está oculta para el observador. Podemos estimar la posición de la aeronave utilizando sensores, como el radar. La estimación se puede mejorar significativamente mediante el uso de múltiples sensores y aplicando algoritmos avanzados de estimación y seguimiento (como el Filtro Kalman). Cada parámetro medido o calculado es una estimación.
La exactitud indica qué tan cerca está la medición del valor verdadero.
La precisión describe cuánta variabilidad hay en varias mediciones del mismo parámetro. La exactitud y la precisión forman la base de la estimación.
La siguiente figura ilustra la exactitud y la precisión.
Los sistemas de alta precisión tienen baja varianza en sus mediciones (es decir, baja incertidumbre), mientras que los sistemas de baja precisión tienen alta varianza en sus mediciones (es decir, alta incertidumbre). La varianza es producida por el error de medición aleatorio.
Los sistemas de baja exactitud se denominan sistemas sesgados , ya que sus mediciones tienen un error sistemático (sesgo) incorporado.
La influencia de la varianza puede reducirse significativamente promediando o suavizando las mediciones. Por ejemplo, si medimos la temperatura usando un termómetro con un error de medición aleatorio, podemos hacer múltiples mediciones y promediarlas. Como el error es aleatorio, algunas de las mediciones estarían por encima del valor verdadero y otras por debajo del valor verdadero. La estimación estaría cerca de un valor verdadero. Cuantas más mediciones hagamos, más cerca estará la estimación.
Por otro lado, si el termómetro está sesgado, la estimación incluirá un error sistemático constante.
Todos los ejemplos en este tutorial asumen sistemas imparciales o no sesgados .
La siguiente figura representa una vista estadística de la medición.
La medición es una variable aleatoria, descrita por la función de densidad de probabilidad (PDF).
La media de las mediciones es el valor esperado de la variable aleatoria.
El desplazamiento entre la media de las mediciones y el valor verdadero es la exactitud de las mediciones, también conocida como sesgo o error de medición sistemática.
La dispersión de la distribución es la precisión de la medición, también conocida como ruido de medición o error de medición aleatorio o incertidumbre de medición.