Introducción al filtro de Kalman

IE3041 - Sistemas de Control 2

La forma correcta de utilizar el "LQR" para observadores

Del LQR al filtro de Kalman

recordemos que la idea del LQR fue penalizar divergencia en las variables de estado y un sobre-uso de los actuadores (entradas)

Del LQR al filtro de Kalman

recordemos que la idea del LQR fue penalizar divergencia en las variables de estado y un sobre-uso de los actuadores (entradas)

\begin{aligned} \mathbf{u}^\star(t) = & \displaystyle\arg\min_{\mathbf{u}(t)} \displaystyle\int_{t_0}^{\infty} \left[\mathbf{x}(t)^\top \mathbf{Q}\mathbf{x}(t)+\mathbf{u}(t)^\top \mathbf{R}\mathbf{u}(t)\right]dt \\ & \textrm{s.t.} \quad \dot{\mathbf{x}}=\mathbf{A}\mathbf{x}+\mathbf{B}\mathbf{u} \\ \end{aligned}

Del LQR al filtro de Kalman

¿Qué ocurre si quisiéramos modificarlo para emplear la dinámica del observador de Luenberger?

Del LQR al filtro de Kalman

¿Qué ocurre si quisiéramos modificarlo para emplear la dinámica del observador de Luenberger?

\dot{\mathbf{e}}=\left(\mathbf{A}-\mathbf{L}\mathbf{C}\right)\mathbf{e}

Del LQR al filtro de Kalman

¿Qué ocurre si quisiéramos modificarlo para emplear la dinámica del observador de Luenberger?

\dot{\mathbf{e}}=\left(\mathbf{A}-\mathbf{L}\mathbf{C}\right)\mathbf{e}

\ \mathbf{e}(t)

Del LQR al filtro de Kalman

¿Qué ocurre si quisiéramos modificarlo para emplear la dinámica del observador de Luenberger?

\dot{\mathbf{e}}=\left(\mathbf{A}-\mathbf{L}\mathbf{C}\right)\mathbf{e}

\ \mathbf{e}(t)

+ \ \square

Del LQR al filtro de Kalman

¿Qué ocurre si quisiéramos modificarlo para emplear la dinámica del observador de Luenberger?

\dot{\mathbf{e}}=\left(\mathbf{A}-\mathbf{L}\mathbf{C}\right)\mathbf{e}

\ \mathbf{e}(t)

+ \ \square

Del LQR al filtro de Kalman

¿Qué ocurre si quisiéramos modificarlo para emplear la dinámica del observador de Luenberger?

\dot{\mathbf{e}}=\left(\mathbf{A}-\mathbf{L}\mathbf{C}\right)\mathbf{e}

\ \mathbf{e}(t)

+ \ \square

???

Del LQR al filtro de Kalman

¿Qué ocurre si quisiéramos modificarlo para emplear la dinámica del observador de Luenberger?

\dot{\mathbf{e}}=\left(\mathbf{A}-\mathbf{L}\mathbf{C}\right)\mathbf{e}

\ \mathbf{e}(t)

+ \ \square

???

Resulta que no sólo la entrada es fundamental para el planteamiento del LQR sino que este deja de existir al no estar presente esta

Del LQR al filtro de Kalman

entonces, para que el "LQR de observadores" funcione, debe penalizar algo en el lugar de la entrada

Del LQR al filtro de Kalman

entonces, para que el "LQR de observadores" funcione, debe penalizar algo en el lugar de la entrada

resulta que la respuesta a esto corresponde al ruido en el sistema

Del LQR al filtro de Kalman

entonces, para que el "LQR de observadores" funcione, debe penalizar algo en el lugar de la entrada

resulta que la respuesta a esto corresponde al ruido en el sistema

sin embargo, para entender el planteamiento necesitamos ser capaces de describir señales aleatorias

Del LQR al filtro de Kalman

entonces, para que el "LQR de observadores" funcione, debe penalizar algo en el lugar de la entrada

resulta que la respuesta a esto corresponde al ruido en el sistema

sin embargo, para entender el planteamiento necesitamos ser capaces de describir señales aleatorias

pongamos esto en contexto con un ejemplo...

Sensores

\ t

x(t)

\ t

x(t)

señal + ruido

\ t

x(t)

señal + ruido

PROBLEMA

aún tenemos pendiente desarrollar herramientas matemáticas para lidiar con el ruido

Probabilidad y variables aleatorias

x = -2.35893

X =

posibles valores

x = -2.35893

X =

posibles valores

existe cierta probabilidad que tome algún valor en específico dentro de los posibles

x = -2.35893

X =

posibles valores

\(\Rightarrow X\) es una variable aleatoria

existe cierta probabilidad que tome algún valor en específico dentro de los posibles

descrita por una función de densidad probabilística (pdf)

existe cierta probabilidad que tome algún valor en específico dentro de los posibles

descrita por una función de densidad probabilística (pdf)

\(P(X=x)=f_X(x)\) tal que \(\displaystyle\int_{-\infty}^{\infty}f_X(x)dx=1\)

existe cierta probabilidad que tome algún valor en específico dentro de los posibles

Ejemplo: variable aleatoria discreta

1/6

\ x

f_X(x)

Ejemplo: variable aleatoria discreta

P(X=2)=f_X(2)=1/6

P(X>3)=\displaystyle\int_{3}^{\infty}f_X(x)dx=1/2

1/6

\ x

f_X(x)

Ejemplo: variable aleatoria discreta

X \sim \mathcal{U}\{1,6\}

distribución uniforme discreta

1/6

\ x

f_X(x)

P(X=2)=f_X(2)=1/6

P(X>3)=\displaystyle\int_{3}^{\infty}f_X(x)dx=1/2

Ejemplo: distribución uniforme continua

\dfrac{1}{b-a}

\ x

f_X(x)

X \sim \mathcal{U}(a,b)

Ejemplo: distribución uniforme continua

\dfrac{1}{b-a}

\ x

f_X(x)

X \sim \mathcal{U}(a,b)

P(X=2)=\mathrm{cte.}

P(X=4.75)=\mathrm{cte.}

\dfrac{1}{b-a}

\ x

X \sim \mathcal{U}(a,b)

P(X=2)=\mathrm{cte.}

P(X=4.75)=\mathrm{cte.}

X \sim \mathcal{U}(2,8)

=\dfrac{1}{6}

Ejemplo: distribución uniforme continua

f_X(x)

Ejemplo: distribución normal (Gaussiana)

\ x

f_X(x)

X \sim \mathcal{N}\left(\mu,\sigma^2\right)

Ejemplo: distribución normal (Gaussiana)

\ x

f_X(x)

X \sim \mathcal{N}\left(\mu,\sigma^2\right)

\mu

media o promedio

Ejemplo: distribución normal (Gaussiana)

\ x

f_X(x)

X \sim \mathcal{N}\left(\mu,\sigma^2\right)

\mu

media o promedio

\sigma^2

varianza o el cuadrado de la desviación estándar

Ejemplo: distribución normal (Gaussiana)

\ x

f_X(x)

\mu

media o promedio

\sigma^2

varianza o el cuadrado de la desviación estándar

f_X(x)=\dfrac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}

Ejemplo: distribución normal (Gaussiana)

\ x

f_X(x)

X \sim \mathcal{N}\left(0,1\right)

distribución normal estándar

-1

Ejemplo: distribución normal (Gaussiana)

\ x

-1

a veces se busca pero la probabilidad acumulada hasta cierto valor

P(X\le -1)=F_X(-1)

f_X(x)

X \sim \mathcal{N}\left(0,1\right)

distribución normal estándar

Ejemplo: distribución normal (Gaussiana)

\ x

-1

a veces se busca pero la probabilidad acumulada hasta cierto valor

P(X\le -1)=F_X(-1)

F_X(x)=\displaystyle\int_{-\infty}^{x}f_X(s)ds

cdf

f_X(x)

X \sim \mathcal{N}\left(0,1\right)

distribución normal estándar

Otras distribuciones

Múltiples variables aleatorias

supongamos que ahora se tienen dos variables aleatorias \(X\) y \(Y\), entonces, se define su distribución de probabilidad conjunta (joint pdf) como

P(X=x, Y=y)=f_{XY}(x,y)

sí y sólo si \(X\) y \(Y\) son independientes

f_{XY}(x,y)=f_X(x)f_Y(y)

supongamos que ahora se tienen dos variables aleatorias \(X\) y \(Y\), entonces, se define su distribución de probabilidad conjunta (joint pdf) como

Múltiples variables aleatorias

Medidas, momentos y valor esperado

la media y la varianza describen a las distribuciones normales, sin embargo, resulta que forman parte de un conjunto de medidas que aplica a cualquier tipo de distribución

Medidas, momentos y valor esperado

la media y la varianza describen a las distribuciones normales, sin embargo, resulta que forman parte de un conjunto de medidas que aplica a cualquier tipo de distribución

la mayoría requiere de la noción general de valor esperado para calcularse

E_X[x]=\displaystyle\int_{-\infty}^{\infty}xf_X(x)dx

valor esperado (promedio ponderado)

E_X[x]=\displaystyle\int_{-\infty}^{\infty}xf_X(x)dx

\mu_X=E_X[x]

\sigma_X^2=E_X\left[(x-\mu_X)^2\right]

\rho_{XY}=\dfrac{\sigma_{XY}}{\sigma_X\sigma_Y}

\sigma_{XY}=E_{XY}\left[(x-\mu_X)(y-\mu_Y)\right]

valor esperado (promedio ponderado)

covarianza

correlación

varianza

media

Otras medidas

\mathrm{mode}=\argmax_x f_X(x)

\lim_{x \to m^-} F_X(x) \le \dfrac{1}{2} \le F_X(m)

(m)

estas reciben el nombre de medidas de tendencia central

Varianza vs covarianza

>> ie3041_clase9_gaussianas.m

mientras la varianza es una medida de dispersión, la covarianza (y correlación) es una medida que representa la relación lineal entre las variables aleatorias, es decir, en qué medida el cambio de una está relacionado con el de la otra

Vectores de variables aleatorias

para evitar la confusión con matrices, emplearemos una notación distinta para vectores de variables aleatorias, por ejemplo, para el caso con \(\mathbf{x}\in\mathbb{R}^n\)

\boldsymbol{\mu}_\mathbf{x}=E\left\{\mathbf{x}\right\}=E\left\{\begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix}\right\} =\begin{bmatrix} E\{x_1\} \\ E\{x_2\} \\ \vdots \\ E\{x_n\} \end{bmatrix}

adicionalmente, las varianzas y covarianzas se combinan en un único objeto denominado matriz de covarianza

\mathbf{Q}_\mathbf{x}=\mathbf{Q}^\top_\mathbf{x}=E\left\{(\mathbf{x}-\mu_\mathbf{x})(\mathbf{x}-\mu_\mathbf{x})^\top\right\}

Vectores de variables aleatorias

adicionalmente, las varianzas y covarianzas se combinan en un único objeto denominado matriz de covarianza

\mathbf{Q}_\mathbf{x}=\mathbf{Q}^\top_\mathbf{x}=E\left\{(\mathbf{x}-\mu_\mathbf{x})(\mathbf{x}-\mu_\mathbf{x})^\top\right\}

varianzas en la diagonal y covarianzas fuera de la diagonal

Vectores de variables aleatorias