Estabilización de trayectorias
IE3041 - Sistemas de Control 2
¿Dónde estamos por el momento?
condición inicial \(\mathbf{x}_0\)
"meta" \(\mathbf{x}_{ss}\)
condición inicial \(\mathbf{x}_0\)
"meta" \(\mathbf{x}_{ss}\)
fuimos capaces de emplear colocación directa para encontrar la trayectoria óptima
esta, sin embargo, presenta un problema crítico
esta, sin embargo, presenta un problema crítico
un ligero cambio en la trayectoria causa un comportamiento completamente distinto
esta, sin embargo, presenta un problema crítico
un ligero cambio en la trayectoria causa un comportamiento completamente distinto
¿Por qué?
lazo cerrado
lazo cerrado
lazo abierto
lazo abierto
lazo cerrado
Robusto
lazo cerrado
Robusto
lazo abierto
Frágil
lazo cerrado
lazo abierto
¿Solución? cerrar el lazo
lazo cerrado
lazo abierto
¿Solución? cerrar el lazo
dos opciones:
Estabilización de trayectorias
Estabilización de trayectorias
la trayectoria se hace atractiva mediante un controlador
referencia
Estabilización de trayectorias
la trayectoria se hace atractiva mediante un controlador
referencia
el controlador absorbe las desviaciones con respecto a la trayectoria calculada
la trayectoria se hace atractiva mediante un controlador
referencia
Estabilización de trayectorias
el controlador absorbe las desviaciones con respecto a la trayectoria calculada
la trayectoria se hace atractiva mediante un controlador
referencia
Time-Varying LQR
Estabilización de trayectorias
horizonte infinito
dinámica LTI
(linealización alrededor de un punto)
Dos tipos de LQR
horizonte infinito
dinámica LTI
(linealización alrededor de un punto)
estabiliza puntos de equilibrio | operación
Dos tipos de LQR
horizonte finito
dinámica LTV
(linealización alrededor de una trayectoria)
Dos tipos de LQR
horizonte finito
dinámica LTV
(linealización alrededor de una trayectoria)
estabiliza trayectorias
Dos tipos de LQR
Estabilización de trayectorias con LQR
Estabilización de trayectorias con LQR
linealización
Estabilización de trayectorias con LQR
linealización
Estabilización de trayectorias con LQR
linealización
Estabilización de trayectorias con LQR
4. Se estabiliza la trayectoria mediante el LQR de horizonte finito.
Estabilización de trayectorias con LQR
4. Se estabiliza la trayectoria mediante el LQR de horizonte finito.
Estabilización de trayectorias con LQR
feedback
4. Se estabiliza la trayectoria mediante el LQR de horizonte finito.
Estabilización de trayectorias con LQR
\(\mathbf{x}_{ss}\) y \(\mathbf{u}_{ss}\) variantes en el tiempo (resultado de la optimización de trayectorias)
4. Se estabiliza la trayectoria mediante el LQR de horizonte finito.
Estabilización de trayectorias con LQR
4. Se estabiliza la trayectoria mediante el LQR de horizonte finito.
Estabilización de trayectorias con LQR
\(\mathbf{P}(t)\) es la solución de la ecuación diferencial de Riccati
4. Se estabiliza la trayectoria mediante el LQR de horizonte finito.
Estabilización de trayectorias con LQR
\(\mathbf{P}(t)\) es la solución de la ecuación diferencial de Riccati
problema de valor final (PVF)*
el PVF se resuelve "al revés" o hacia atrás en el tiempo, por ejemplo, con forward Euler
Estabilización de trayectorias con LQR
el PVF se resuelve "al revés" o hacia atrás en el tiempo, por ejemplo, con forward Euler
empezando en \(\mathbf{P}(t_f)=\mathbf{S}\)
Estabilización de trayectorias con LQR
Se recomienda que \(\mathbf{x}(t_f)=\mathbf{x}_f\) sea un punto de equilibrio u operación para poder terminar la trayectoria con un LQR de horizonte infinito
de horizonte infinito
Estabilización de trayectorias con LQR
Esto puede hacerse ya sea con
o bien
Estabilización de trayectorias con LQR
[Klqr_ss, S, P] = lqr(A, B, Q, R);
Ejemplo: cart-pole swing up (cont.)
Se estabilizará la trayectoria óptima mediante linealización alrededor de trayectorias y un LQR variante en el tiempo. Se finalizará con un LQR LTI para estabilizar el estado de vertical hacia arriba.
>> cartpole_stab.m
Recalcular la optimización
luego de la perturbación
Recalcular la optimización
luego de la perturbación
se recalcula el problema de control óptimo (online) para obtener una nueva trayectoria
Recalcular la optimización
Control de Modelo Predictivo (MPC)
luego de la perturbación
se recalcula el problema de control óptimo (online) para obtener una nueva trayectoria
Recalcular la optimización